Está en la página 1de 268

La revolución Google Scholar
Destapando la caja de Pandora académica

Enrique Orduña-Malea · Alberto Martín-Martín
Juan M. Ayllón · Emilio Delgado López-Cózar
Prologado por
Peter Jacsó
Anne-Wil Harzing

La revolución Google Scholar
Destapando la caja de Pandora académica

Granada · 2016

distribución.© LOS AUTORES © UNIVERSIDAD DE GRANADA La revolución Google Scholar. Unión de Editoriales Universitarias Españolas Diseño de la edición: Francisco Vega Álvarez Cualquier forma de reproducción. salvo excepción prevista por la ley. comunicación pública o transformación de esta obra sólo puede ser realizada con la autorización de sus titulares. Destapando la caja de Pandora académica ISBN: 978-84-338-5985-3 Edita: Editorial Universidad de Granada UNE. .

...................... 41 Capítulo 3 Las dos caras de Google Scholar (II): La herramienta de evaluación...................................................... 15 INTRODUCCIÓN21 BLOQUE A Google Scholar: el buscador académico universal............................................Contenidos PREFACIO I La revolución de Google Scholar: destapando la caja de pandora académica..... 75 Capítulo 4 Capturando la Web académica: Funcionamiento general. tamaño y evolución............................................................ 99 Capítulo 5 El retrato de Google Scholar: Cobertura...................................................................................................................... 9 PREFACIO II Sacrificar un poco de precisión por una cobertura (mucho) más amplia...................................................... 27 Capítulo 2 Las dos caras de Google Scholar (I): El buscador académico. 25 Capítulo 1 Los orígenes.......................... 119 .......................................

................. 171 Capítulo 8 Google Scholar Metrics: El impacto de las revistas científicas.. 217 CONCLUSIONES Google Scholar: la caja de pandora académica................................... debilidades y peligros.......... 173 Capítulo 9 Google Scholar Citations: Los perfiles académicos en la Web......... 133 Capítulo 7 Google Scholar en la balanza: Fortalezas.................. 185 Capítulo 10 Productos derivados independientes.........................................................................Capítulo 6 El proceso de búsqueda en Google Scholar: Prestaciones y servicios....... 155 BLOQUE B La familia Google Scholar: Productos derivados oficiales e independientes....................................... 249 BIBLIOGRAFÍA253 ..................................................................................................................................................................................

en las estanterías digitales de sus bibliotecas. artículos. La mayoría de los usuarios no conocen lo que alberga la caja de GS y no se preocupan por aprenderlo.Prefacio I La revolución de Google Scholar: destapando la caja de pandora académica La caja de Pandora fue un regalo de Zeus que no debía ser abierto. escribieron un libro excelente sobre la base de sus investigaciones. el número de ítems (registros). hizo fácil que aceptara la invitación para escribir un prólogo a este libro. por cuántos años. Los desarrolladores de Google Scholar (GS) pusieron muchas cosas en su caja de almacenamiento.000 ítems aproximadamente. Los cuatro autores. algunas de ellas buenas. en qué idiomas. El hecho de estar familiarizado con sus artículos de revistas y conferencias.100 documentos y. realizaron una extensiva e intensiva serie de pruebas y análisis de resultados. capítulos de libro. . Se aprecia que para algunos de los asuntos controvertidos los autores citen artículos que critican y/o reconocen las “soluciones” de GS. actas de congresos. siempre y cuando encuentren algunos buenos artículos de revistas. tesis doctorales y patentes. dos años después. tanto en inglés como en español. libros… y en qué medida están cubiertos. a 700. algunas otras malas. El único punto en el que discrepo profundamente con los autores es cuando éstos empequeñecen las consecuencias “letales” de un ejemplo específico: cuando GS atribuyó a I INTRODUCTION la autoría de 40. magacines. revistas científicas. más cuando muchos de éstos se encuentran fácilmente disponibles tanto en fuentes de acceso abierto como de pago. A los bibliotecarios y otros profesionales de la información les gustaría conocer el tamaño real aproximado de GS. que explica las ventajas y los inconvenientes de GS y demuestra la competencia de los autores y su experiencia (incluso cuando no estamos de acuerdo en algunos temas). profesores en diversas universidades en España. libros. privando a los autores reales tanto de sus autorías como de sus citas.

En el caso de que no exista resumen. enriquecida por cientos de referencias a materiales primarios de investigación publicados acerca de GS durante los últimos doce años. otorgadas por GS al autor fantasma. tal y como se muestra en la siguiente captura de pantalla (Figura A3). ante la cual indican los autores que “la mejora del sistema fue simplemente espectacular”. GS añade contenido absurdo creado a través de un scraping de la plantilla de la pantalla de búsqueda. cabeceras de secciones y etiquetas de las opciones de los menús de búsqueda (FigA2). Background Statistics. Extracto del famoso ejemplo de autor I INTRODUCTION Source: Bar-Ilan. Los tres autores auténticos se ven privados de su estatus de autor y de las cinco citas recibidas. Esto no es un síntoma raro o casual. El autor. entre ellos muchos de los artículos de los autores así como artículos de conferencias. todavía de bajo nivel. idiomas y la habilidad para buscar el texto completo de documentos primarios. J. GS redujo esta autoría a cinco registros a fecha de septiembre de 2015. siguen produciendo miles de autores fantasma creados a partir de las palabras de los títulos de los documentos. supuestamente llamado IIB STATISTICS según GS. es simplemente el título de la sección II. sino muy común.10 La revolución Google Scholar En efecto. informes técnicos y comentarios acerca del bueno. El malo es que los parsers (analizadores) de GS. Los trabajos citados. Lo “bueno” es la amplitud de los documentos primarios en términos de tipologías documentales. Esto es como alabar al abusador de una mujer de que éste ha reducido considerablemente los golpes a su esposa e hijos. . Resulta extraño por qué el título de la segunda sección fue el elegido por GS para generar el nombre falso de autor y no los títulos de la primera o la tercera sección. Un síndrome relativamente nuevo de GS es que éste sustituye el resumen/extracto original de los artículos de revista o actas de congresos. la ventaja de agruparse en un cuarteto para escribir este libro es obvia. añadiendo esa cadena sin sentido de caracteres. sobre todo para las secciones acerca de la génesis de GS. el feo y el malo de GS. son muy valiosos para comprender sus ventajas e inconvenientes. Figura A1. (2008) Incluso para un autor muy solitario.

Google Scholar añade un sumario a partir de las opciones en la plantilla de búsqueda en el sitio web de Wiley Online Library 11 .Prefacio · Parte I · Peter Jacsó Figura A2. Ejemplo de autor fantasma (IIB STATISTICS) extraído de un título de sección Figura A3.

La primera parte trata de la génesis de GS y sus características como motor de búsqueda (una herramienta de descubrimiento de recursos) así como de su uso como una herramienta de evaluación que pretende cuantificar la productividad científica y su impacto en diferentes niveles. GS se las arregla para producir 552. La columna vertebral de estos servicios de bases de datos son las referencias citadas y citantes (creadas manualmente por Garfield en tarjetas Hollerith. capítulos de libro y libros. Journal Citation Reports y Scimago. Web of Science. el número de citas totales. la lista de revistas cubiertas y la cobertura temporal cubierta. casi invisible. así como de . La prestación “fea” más característica de GS es el secretismo relativo a la información esencial. tal y como hacen los humanos cuando dicen algo en voz muy baja al ser conscientes de que lo que dicen no tiene sentido. a pesar del uso del adjetivo Scholar (o Académico en muchos países de habla hispana). Proquests. son muchas las fuentes no académicas. La cobertura del libro es excelente y completa. Scopus. mostrando el número de hits en el más brillante. cuál es el tamaño y cobertura estimados. como por ejemplo el tamaño de la base de datos. del servicio de Scopus y de Google Scholar. Las siete secciones dentro de este primer bloque dirigen a los lectores a través del proceso de cómo GS captura los datos.000 hits con el contenido que se ilustra a continuación. exceptuando la decepcionante omisión de la fértil obra de Eugene Garfield desde mediados de los 1950 en adelante acerca de la indización de citas y la búsqueda basada en referencias citadas. datos que son fácilmente disponibles en bases de datos hospedadas por EBSCO. Microsoft Academic Search (que se ha ido desvaneciendo). predecesoras de los enlaces digitales). Como las prácticas de los médicos de vudú desde América del Norte a la India.12 La revolución Google Scholar En el caso de la colección digital del sitio web de John Wiley. así como de los elementos del proceso de búsqueda a través del prisma crítico de los especialistas en búsquedas en bases de datos. actas de congresos. color gris. el número de registros maestros. El segundo bloque discute las ventajas e inconvenientes de Google Scholar Metrics for publications y de Google Scholar Citations. que van desde los autores individuales e investigadores hasta los artículos. Esto refuerza la sensación de que. Es decir. Las cerca de 270 páginas del libro se componen de dos partes principales (bloques). Su clásico trabajo publicado en la revista Science hace 60 años proporcionó la idea nuclear para la implementación de los índices de citas de ISI.

La evaluación de la investigación a nivel institucional requerirá a Google Scholar la disposición de información relativa a la afiliación de los autores en un formato y contenido consistentes. Hawaii 2016 April 5 13 . Professor Peter Jacsó Library and Information Science Program Department of information and Computer Sciences Honolulu. El libro contiene ilustraciones muy informativas. objetivo y muy actualizado contenido del libro es muy necesario en tanto que las medidas basadas en métricas del rendimiento e impacto de la investigación son más y más ampliamente utilizadas por las relativamente objetivas evaluaciones del rendimiento a nivel individual de los investigadores y revistas. aunque en la versión impresa utilizada para este prólogo no eran todas bien legibles. La incorporación de enlaces directos a las referencias citadas y la creación de consultas en las que se pueda hacer clic para poder repetir las pruebas de muestra.Prefacio · Parte I · Peter Jacsó algunas utilidades que ayudan en los procesos de input y output. La navegación por todos los elementos de los metadatos será esencial. gráficos y tablas. podrían constituir una característica excepcional para este excelente libro. lo cual no es precisamente el punto fuerte de GS. La edición digital puede ayudar con alta resolución e imágenes en color. El competente. incluyendo el excelente y gratuito software Publish or Perish. pero esto podría revelar demasiado acerca de las limitaciones de GS. La inclusión de búsquedas en las que se pueda clicar a la hora de generar los perfiles de autor de GS. junto a un listado sistemático de las ventajas e inconvenientes (a partir del listado de resultados de GS de los propios autores) podría contribuir al uso de esta obra como un libro de texto digital tanto para los estudiantes como para los profesores.

.

la interfaz de Google Scholar no hacía muy sencilla la tarea de agregar métricas de citas de una forma accesible. hace diez años era muy difícil para un académico del área del Comercio internacional convencer a un tribunal de promoción de que había alcanzado tanto impacto como. En esas disciplinas. debido en gran medida a que muchas de las revistas que las estaban citando no estaban (todavía) incluidas en Web of Science. . mi expediente parecía inmediatamente mucho más brillante. una proporción mucho mayor de revistas académicas sí estaban incluidas en la Web of Science. A consecuencia de esto. investigadores trabajando en disciplinas vecinas como la Economía o Psicología. la cita anterior sería un probable candidato. de tal forma que éstas pudieran ser comparadas entre investigadores. Desafortunadamente. Acceda a Google Scholar… y a publish or perish! Acceda a Google Scholar! Cuando realizaba búsquedas sobre mi obra en Google Scholar.Prefacio II Sacrificar un poco de precisión por una cobertura (mucho) más amplia Si me pidieran que resumiera mi “veredicto” sobre Google Scholar en tan solo diez palabras. por ejemplo. He estado siguiendo a Google Scholar desde su lanzamiento en 2004. Dedicándome al área del Comercio internacional. cuando necesitaba justificar el impacto de investigación en mi solicitud de promoción a Profesor Titular. Resultó que mi trabajo era realmente muy citado. Aquellas revistas que sí se encontraban incluidas tenían bajos factores de impacto. incluso las publicaciones no convencionales (como libros. descubrí que en la Web of Science estaban indizadas muy pocas de las revistas en las que había publicado. aunque mi interés se incrementó en 2006. capítulos de libro o incluso un ranking de revistas) tenían un fuerte impacto en términos de citas.

5% 7. Disciplina Citas en Scopus como % de citas en Google Scholar Citas en Web of Science como % de citas en Google Scholar Humanidades 11. Avances de Google Scholar durante la última década Google Scholar ha recorrido un largo camino desde sus primeros días. Ciencias de la vida. existen actualmente muchos estudios bibliométricos que confían en Google Scholar (generalmente a través de Publish or Perish) para realizar su investigación.6% Ciencias de la vida 70.com/pop. Comparando citas en Google Scholar con citas en Web of Science y Scopus La tabla B1 resume parte de los principales resultados de un reciente estudio sobre 146 investigadores en Ciencias. esto representó además el comienzo de un nuevo “pasatiempo académico”. debido en gran parte a que estas bases de datos no incluyen libros y.6% 45. cubren solamente una fracción de las revistas. Como consecuencia. Para mí. Ingeniería.7% Ciencias 64. Tal y como es evidente a primera vista.5% 66. Desde entonces he publicado más de una docena de artículos en revistas como Scientometrics. 2016).0% 22.2% 65. La mayoría de estos artículos han usado Google Scholar como fuente de datos. Una búsqueda en Google Scholar (incluyendo todas las palabras) para la expresión <Harzing “Publish or Perish”> genera cerca de 2000 resultados. haciendo investigación en el campo de la Bibliometría.0% Ciencias sociales 30. tanto la Web of Science como Scopus pierden un gran número de citas en las Humanidades y Ciencias sociales. Publish or Perish (PoP) nació en Octubre de 2006 (http://www. Journal of Informetrics o Journal of the Association for Information Science & Technology.htm).8% Tabla B1.7% Ingenierías 57.16 La revolución Google Scholar Como consecuencia de ello. PoP es una aplicación informática que recupera y analiza citas académicas. Su cobertura ha mejorado de forma espectacular y en la actualidad es mejor que Web of Science o Scopus para cualquier disciplina (Harzing y Alakangas. 2016).harzing. Utiliza Google Scholar para capturar citas brutas. analizarlas y presentar posteriormente un amplio rango de métricas derivadas. en algunas disciplinas. . Ciencias sociales y Humanidades (Harzing y Alakangas.

Google Scholar ha jugado desde mi punto de vista un papel fundamental en la democratización del análisis de citas (Harzing y Mijhardt. 2016. Países donde en muchas universidades no tienen acceso ni a Scopus ni a la Web of Science. http://www. se propicie un cierto nivel de uso inexperto o sencillamente ignorante.htm). Google Scholar proporciona entre 1. No es de extrañar que el software sea usado en todo el mundo. Google Scholar y Publish or Perish han democratizado el análisis de citas Soy la primera en reconocer que Google Scholar tiene importantes limitaciones. US Environmental Protection Agency o el US Agency for International Development). A nivel general. Ciencias y Ciencias de la vida. es incluso más satisfactorio ver su igualmente alta utilización en universidades con escasos recursos en países como Armenia. Sin embargo. tales como Harvard. Mediante Publish or Perish cualquier persona con un ordenador y acceso a Internet puede ejecutar análisis bibliométricos. Botsuana.CNRS en Francia) hasta laboratorios de investigación (por ejemplo. Hewlett Packard o IBM). tanto el software como Google Scholar son particularmente populares en Italia. incluso en las ingenierías. universidades que poseen un amplio acceso a otras alternativas comerciales. desde investigadores y bibliotecarios particulares en más de 80 países hasta departamentos gubernamentales (por ejemplo. Grecia y Polonia. Sin embargo. com/poptips/index. Así mismo existe un peligro nada despreciable a que. MIT. existen miles de bibliotecas por todo el mundo que listan el software como una alternativa gratuita a Scopus y la Web of Science. Google Scholar y Publish or Perish cubren claramente una necesidad! Más cerca de (mi) casa. Stanford. Es particularmente gratificante observar que el software es ampliamente utilizado en universidades altamente posicionadas. Mongolia.5 y 2 veces más citas que Web of Science y Scopus. Tayikistán y Uruguay.SSHRC en Canadá o el Centre National de la Recherche Scientifique . de las cuales las más importantes se encuentran resumidas en mi tutorial de Publish or Perish (Harzing. gracias a un acceso sencillo a las herramientas bibliométricas.harzing. Microsoft. Oxford o Cambridge. 2015). el US Department of Energy. Paraguay. desde agencias de financiación (como el Social Sciences and Humanities Research Council . Me parece particularmente agradable que tanto en Italia como en Grecia la aplicación haya sido regularmente utilizada para promover la transparencia y la meritocracia en nombramientos universitarios.Prefacio · Parte II · Anne-Wil Harzing Sin embargo. Ade- 17 .

Por tanto. también éstos podrían descubrir que la Web of Knowledge de Thomson Reuters no está particularmente bien versada en distinguir con precisión a los investigadores con nombres no anglosajones (Harzing. Si se requiriera de una precisión del 99-100%. Emilio y su equipo han trabajado sin descanso para explorar el funcionamiento interno de Google Scholar. he terminado prácticamente mis búsquedas en Publish or Perish! ¿Por qué necesitamos este libro? Aunque muchos investigadores han utilizado Google Scholar como fuente de datos. ninguno de ellos ha sido tan diligente en sus esfuerzos para proporcionar una mejor imagen de Google Scholar que el Grupo de Investigación EC3. los investigadores que publican en sus idiomas locales en lugar de en Inglés necesitan confiar en Google Scholar si desean obtener una cobertura de su trabajo más que incidental. recordado mi contraseña y accedido. y que no discrimina las prácticas de publicación fuera del campo de las Ciencias (de la Vida) (Harzing. En la mayoría de los análisis bibliométricos. ¿El veredicto? Utilizar Google Scholar significa sacrificar un cierto grado de precisión. como investigadora en el campo de las Ciencias sociales. estoy encantada de que su experiencia hasta la fecha se haya integrado ahora en una monografía. Para el momento en que he puesto en marcha el sitio web de la Web of Knowledge o de Scopus. Desde 2008. especialmente en aquellos con elevados niveles de agregación o centrados en métricas robustas como el h-index. A lo que podría añadir… “y una respuesta a la velocidad de un rayo”. 2015). estoy más que feliz por aceptar el error ocasional de Google Scholar a cambio de una cobertura que es muy superior a la de Scopus y Web of Science. 2013). Lo único que lamento es que no esté (todavía) disponible en inglés! . Google Scholar necesitaría siempre ser triangulada con otras fuentes de datos. Del mismo modo que los asiáticos del Este. Sin embargo. De ahí mi cita de apertura: “Sacrificar un poco de precisión por una cobertura (mucho) más amplia”. tanto en éstos como en otros países. esto es poco consuelo para las (pocas) personas a las que se les ha “robado” sus publicaciones más citadas porque Google Scholar no ha analizado gramaticalmente bien su nombre. En cualquier caso.18 La revolución Google Scholar más. los inevitables deslices de Google Scholar no influirán significativamente en los resultados.

Publish or Perish tutorial. A.co. A.W. 105(3). Scientometrics.com 19 .W.harzing.thetimes.W. (2015). Mijnhardt.timeshighereducation. Disponible en: http://www. Disponible en: http://www. “Document categories in the ISI Web of Knowledge: misunderstanding the Social Sciences?”.. harzing. (2016). Scientometrics.W.com/papers. January 29 www. a collection of tips to introduce users to the program’s main functions in 80 easy chunks. 727-749.harzing.harzing. (2013).htm Harzing.ece https://www. Disponible en: http://www. 93(1).com/papers.uk/tto/science/article4543774. (2015).co. 102(1).Prefacio · Parte II · Anne-Wil Harzing Referencias Harzing. A.htm#top40 Harzing. Disponible en: http://www. “Health warning: Might contain multiple personalities. W. The problem of homonyms in Thomson Reuters Essential Science Indicators”. London 2016. Scientometrics.htm#esi [Cobertura de prensa en: http://www. “Proof over promise: Towards a more inclusive ranking of Dutch academics in Economics & Business”.harzing.htm#isi Professor Anne-Wil Harzing Middlesex University London Hendon.com/poptips/index. 2334. 2259-2270.com/papers.uk/news/week-higher-education-%E2%80%93-3-september-2015 ] Harzing. A.

.

por lo que era importante no sólo conocer las creaciones literarias sino también sus entresijos. celebrado en San Sebastián. en esa sesión. no se entiende la vida sin la obra. en algunos casos como el de nuestro egregio premio nobel Ramón y Cajal. Pues bien. sabia máxima que no es más que una constatación existencial: en lo que hacemos está lo que somos. concluyendo con un relato de sus fortalezas y limitaciones. y Google Scholar apareció ante mí. como una alternativa novedosa y extraordinariamente sugestiva para buscar y acceder a documentos científicos imposibles de recuperar con las bases de datos tradicionales. por qué podía ser interesante su uso. Pero inmediatamente advertí de sus potencialidades para la evaluación de las publicaciones científicas. Todo empezó allá por el año 2008 cuando los organizadores del V Foro sobre evaluación de la calidad de la educación superior y de la investigación. es por lo que la ponencia que presenté en el siguiente foro llevó ya por título “Google Scholar: ¿herramienta de evaluación científica?”. Llevó por título “Qué es y cómo utilizar Google Scholar” y. qué ofrecía. aparte de dar a conocer a una audiencia expectante en saber lo que era y prometía el nuevo buscador académico. A partir de ahí empecé a bucear y pes- .Introducción Cuando yo cursaba el bachillerato. mis manuales de literatura dividían invariablemente el estudio de un autor en dos partes: la dedicada a desvelar la vida y la enfocada a conocer la obra. pretende esta breve introducción explicar cuál es la tramoya vital que explica la concepción y ejecución de esta obra. allá por los años setenta del siglo pasado. porque créanme hay casos en que la obra es la vida. cómo funcionaba. desde el primer momento. nos recalcaban que no es posible entender la obra de un autor sin indagar sobre su vida. Mis profesores. me encargaron la organización de una sesión docente sobre Google Scholar. Venía yo de publicar una serie de artículos sobre la Web of Science y su universo de productos bibliográficos y bibliométricos. Para empezar diré que es el resultado de siete años dedicados de forma intensa y extensa a descubrir las entrañas de Google Scholar. intenté por primera vez explicar qué cubría. y ahora vienen a mi memoria las figuras del padre Severino y de Don Francisco. Añado yo que.

21 documentos de trabajo y 15 informes.y sin ánimo de ser pretencioso . después. 2011-2015). la obra es el resultado inexorable de la vida. generosidad. primero. Classics Scholar’ Profiles. quedando atrapado en sus redes. 2008-2012. Journal Scholar Metrics. Proceedings Scholar Metrics. Enrique. —— La edición de un boletín (http://googlescholardigest. es) para dar cuenta de los resultados de investigación que se vayan publicando sobre Google Scholar como fuente de información y evaluación científica. Publishers Scholar Metrics.22 La revolución Google Scholar car en las vastas y cambiantes aguas por las que navegaba el buscador. Formamos un auténtico equipo. más que dichosa y venturosa fue la incorporación al grupo de trabajo de Juanma. La suma de habilidades diversas (siempre el todo es superior a las partes) es posible porque se asienta en personalidades caracterizadas por la bondad. 2010-2014. becario FPI (2013). becario FPU (2014). —— La publicación de 17 artículos en revistas. . Si feliz fue el encuentro con Enrique. que ya hizo unos primeros tanteos sobre el estudio de la presencia de las universidades españolas en Google Scholar. Indice H revistas científicas españolas según Google Scholar Metrics (ediciones 20072011. fraternidad y camaradería que reina entre nosotros.que. La Biblioteconomía y Documentación española según Google Scholar Citations). y todos los logros alcanzados se deben a la concordia. y Alberto Martín y Juan Manuel Ayllón. La tenacidad. 2009-2013. En definitiva. Todo este trabajo entusiasta y prolongado en el tiempo permite que pueda afirmar con orgullo . como buscadores de información en la Web. Pero el impulso decisivo para llevar a buen puerto toda nuestra labor fue el feliz encuentro con los otros firmantes de esta obra: Enrique Orduña. somos seguramente uno de los grupos que más saben acerca de los secretos que atesora el buscador. Y a las pruebas me remito: un balance del trabajo desplegado durante estos años ha dado por fruto: —— La confección de 9 productos de evaluación bibliométrica (H Index Scholar. Sobre estas bases hemos construido un más que exitoso conjunto de resultados. laboriosidad y las brillantes habilidades técnicas de que hacen gala han sido el complemento perfecto para los resultados alcanzados por nuestro grupo. y Alberto. comprensión. Scholar Mirrors. compromiso y honestidad. desplegó en su excelente tesis un portentoso abanico de técnicas y herramientas webmétricas. fundamentales para conocer los intestinos de Google y Google Scholar.com.blogspot. después de los creadores de Google Scholar.

Con ello se hace realidad el sueño de Anurag Acharya de poner a disposición de los que menos recursos tienen toda la información científica que cuelga de la Web. Se ha convertido. sin duda una manera de ayudar a transformar el mundo en la buena dirección… Subtitulamos la “caja de pandora académica” porque GS proporciona información que permite evaluar el interés y el impacto de los documentos. contribuyendo decisivamente al masivo uso del buscador y a la popularización de la propia bibliometría. como no podía ser menos. de este libro. El libro viene precedido de dos prólogos firmados por dos de sus mejores conocedores: Peter Jacsó. Y hay que empezar necesariamente por sus prolegómenos. como herramienta de evaluación científica. sin quererlo. resume sintéticamente todo lo que pensamos sobre GS: ha supuesto una auténtica revolución en la forma de buscar y de encontrar información científica y de acceder a ella de manera fácil y rápida. de patentes. Y todo ello ofrecido de forma gratuita. costosa (la mayoría de las bases de datos exigen cuantiosas suscripciones) y con complejas y poco amigables interfaces de búsqueda. Ahora ya queda lejana a la par que anacrónica la forma de buscar información científica anterior a la aparición de Google Scholar: dispersa en múltiples fuentes (catálogos de bibliotecas. el que lo ha hecho más inquisitivamente y con más acierto. sólo recalcar que lo hemos dividido en dos secciones. que se ha implantado como un estándar de facto. un magnífico software que ha hecho factible el uso bibliométrico de Google Scholar.). Dado que este es un libro con múltiples caras. de tesis. Hoy la simple Caja de búsqueda de Google. bases de datos bibliográficas de revistas en distinta disciplinas. y de los autores que los publican. el investigador que más ha escudriñado GS. se encarga por sí sola de traducir las palabras que se escriben en ella en numerosos y pertinentes resultados de búsqueda escritos en cualquier lengua.Introducción · Emilio Delgado López-Cózar Y ahora que ya conocemos las mimbres y la urdimbre toca hablar del cesto. sometiendo al tercer grado al buscador para desvelar sus virtudes y carencias. esto es. que constituyen todo un lujo. con estos prefacios se muestran esos dos rostros que conviven en Google Scholar. la del buscador y la de la herramienta bibliométrica. bajo cualquier formato y tipología documental. en una valiosísima fuente de datos con múltiples usos bibliométricos. La sección A dedicada a describir minuciosamente 23 . y Anne-Wil Harzing. creadora de Publish or Perish. producidos en cualquier país. la faz crítica frente a la faz loable… Respecto a la estructura del libro. etc. El título.

nacido en abril de 2012 como ranking de publicaciones científicas ordenado en función del h-index a partir de los datos de citaciones de Google Scholar. así como el número de citas que cada uno de ellos ha recibido. En el segundo apartado hemos incluido aquellos productos independientes a la compañía y que se han gestado para ofrecer distintas herramientas bibliométricas: Publish or Perish. En fin. Dado que Google Scholar presenta una doble cara. Y Google Scholar Metrics (Estadísticas en español).24 La revolución Google Scholar las características y prestaciones de Google Scholar. de manera que viene a ser un estado de la cuestión. creo que este libro ofrece una revisión omnicomprensiva a la par que minuciosa sobre lo que es a día de hoy Google Scholar y sus derivaciones. Publishers Scholar Metrics. Scholarometer. funciones y prestaciones. La sección B la hemos dividido en dos apartados. H Index Scholar. Journal Scholar Metrics. se realiza un repaso exhaustivo de toda la literatura científica que ha indagado empíricamente sobre el comportamiento de Google Scholar hasta hoy en esta doble faceta. Proceedings Scholar Metrics y Scholar Mirrors. 11 de marzo de 2016 . en español). se pormenorizan las prestaciones y servicios que proporciona como buscador y se apuntan sus fortalezas. el primero dedicado en exclusiva a la descripción de los principales productos derivados de Google Scholar. debilidades y peligros. De forma sintética hemos descrito sus características. la de buscador (razón por la que nació y que realmente lo identifica) y la de herramienta de evaluación (una aplicación sobrevenida y no buscada inicialmente por sus creadores). señalando sus fortalezas y debilidades. se examina su tamaño. se desmenuza su funcionamiento general. generando una serie de indicadores bibliométricos. nacido en julio de 2011 como un servicio a los autores para que generen un perfil donde se muestren los documentos publicados y recogidos en Google Scholar. cobertura y crecimiento. que permitiera a los usuarios identificar las más influyentes revistas. y que conforman lo que denominamos la familia Google Scholar: Google Scholar Citations (Mis citas. congresos y repositorios. Emilio Delgado López-Cózar Profesor de la Facultad de Comunicación y Documentación Universidad de Granada Huétor Vega. Se traza su origen y evolución.

Bloque A Google Scholar: el buscador académico universal .

.

.psu. etc. 1 http://www. Google Scholar.). CiteseerX 2 destaca por sus prestaciones para la exportación de registros. cada uno con sus propias características y funcionalidades.net 2 http://citeseerx. Scirus 3 (actualmente deshabilitado) destacaba por una interfaz de búsqueda superior mientras que Microsoft Academic Search 4 (que tras desactualizarse ha renacido de sus cenizas recientemente) por sus servicios de valor añadido.microsoft. que incorpora además ciertos elementos de valor añadido (indicadores de naturaleza bibliométrica como número de citas a los documentos académicos) que puedan ser utilizados para la evaluación científica y que estén finalmente abiertos a cualquier tipología documental (no sólo artículos sino patentes. describir sus características y funcionamiento y presentar algunas de sus aplicaciones métricas más importantes. con el fin de conocer cómo ha contribuido definitivamente a la popularización y democratización de la evaluación de la actividad científica. presentaciones. el motor de búsqueda académico desarrollado por Google Inc. Dada la revolución que ha supuesto este buscador. es el que dispone de una mayor cobertura de material académico. siendo ésta la aproximación seguida por Ortega (2014) en su completo y exhaustivo estudio comparativo de motores de búsqueda académicos.edu 3 http://www. BASE 1 es quien aporta un mayor número de contenidos en acceso abierto.base-search. este libro está dedicado exclusivamente a conocer su historia.com/scirus 4 http://academic. material docente. tal y como proponía Codina (2007). Finalmente.research.com .ist.sciencedirect.Capítulo 1 Los orígenes No es sencillo encontrar una definición exhaustiva y globalmente aceptada de motor de búsqueda académico (academic search engine). En la actualidad cohabitan diversos motores de búsqueda académicos. Por ejemplo. Podría ser considerado como un buscador especializado en localizar información académica en la Web. tanto en la búsqueda como en la evaluación de la actividad científica.

2014). donde se graduó en Computer Science & Engineering en el campus de Kharagpur del Indian Institute of Technology. Crecer y estudiar en una zona en desarrollo implicaba. procedimiento que el todavía estudiante Anurag utilizó en más de una ocasión.28 La revolución Google Scholar Google Scholar es un buscador web académico (Ortega. el acceso directo a los textos completos (cuando esto es posible por cuestiones legales) o la indicación del número de citas recibidas por cada registro. Acharya nació en Bikaner (Rajasthan. Tal y como el propio Acharya ha reconocido en diversas entrevistas (Van Noorden. . 2014) gratuito que indiza la literatura científica en un amplio abanico de disciplinas. tipologías documentales e idiomas. Está por tanto especializado en buscar e identificar material bibliográfico de carácter académico proporcionando además una serie de servicios adicionales de gran valor. Sin embargo. informe o material académico. un enfoque amplio que resulta necesario para comprender el verdadero impacto que este buscador especializado está generando en la sociedad académica de principios del siglo XXI. tales como la disponibilidad de las referencias bibliográficas de los registros en distintos estándares (permitiendo su posterior descarga a gestores de referencias). Nacimiento No sería posible relatar la historia y los orígenes de Google Scholar sin indagar en la figura de Anurag Acharya. Aunque no se pudiera acceder a ella por diversos motivos. libro. advertir que “existían” contenidos relevantes en algún lugar suponía un auténtico cambio en las reglas del juego. siempre cabía la posibilidad de escribir una carta al autor solicitándole una copia (Levy. co-creador y alma de este buscador. actual distinguished engineer en Google. si conocías la existencia de cierto artículo. terribles dificultades a los estudiantes para poder costearse y tener acceso a materiales académicos que fueran realmente relevantes en sus estudios. India). Estos y otros muchos servicios serán desgranados a lo largo de la presente obra con el propósito de facilitar una visión holística del entorno académico que Google Scholar supone en la actualidad. entre otras muchas cuestiones sociales y políticas. 2015). ya en su época de estudiante (a mediados de los 1980s) tuvo conciencia de la importancia que suponía el hecho de conocer la existencia de información “ahí fuera”. Para un estudiante medio indio esto era prácticamente imposible.

Acharya marchó a los Estados Unidos para realizar el doctorado en Computer Science. que obtuvo en la Carneggie Mellon University en 1994. Posteriormente tuvo la oportunidad de trabajar como investigador posdoctoral en la University of Maryland para finalmente obtener una plaza como Assistant professor en la University of California – Santa Bárbara (Giles. Sin embargo.Bloque A · Capítulo 1 · Los Orígenes En la figura 1 se muestra a modo de ejemplo una postal típica de solicitud de artículo científico. para un estudiante en India no era tan obvio en aquella época (la Web. Sin embargo. 2015) y que presumi- 29 . transformando el modo en que se produce el intercambio de material académico entre pares. todavía no existía). 2005). Este recuerdo. que el propio Anurag Acharya hacía accesible desde el blog oficial de Google Scholar. 2005).blogspot. Figura 1.es) Los desarrollos en tecnologías de la información y comunicación han revolucionado la compartición mundial de material de todo tipo en la Red. Tras completar sus estudios universitarios. Ejemplo de postal de solicitud de artículo científico Fuente: Anurag Acharya (http://googlescholar. todavía común hoy día.com. por ejemplo. tras unos años de vida académica que podríamos etiquetar como estándar. es no obstante fundamental para comprender parte del funcionamiento interno de Google Scholar para indizar la inmensidad de la Web académica en todo el planeta. que hoy día hace esbozar una sonrisa al Doctor Acharya (Giles. el Dr. que definitivamente marcaran la diferencia (Levy. Acharya sintió la necesidad de dar un cambio de rumbo a su trayectoria y aplicar sus conocimientos en proyectos más complicados.

Más allá de los éxitos de la compañía. precisamente en un momento en el que se cuestionaba su futuro profesional y académico. 2014).6% de cuota de mercado.html 8 https://www.com/Insights/Market-Rankings/comScore-Releases-December2014-US-Desktop-Search-Engine-Rankings 7 http://www. Según datos de Netmarketshare 8. To organize the world’s information and make it universally accessible and useful. como China o Rusia). aspx?qprid=4&qpcustomd=1 . Un predominio realmente abrumador. Google ha confirmado recientemente de forma oficial que las búsquedas que se realizan desde los teléfonos móviles inteligentes han superado por vez primera en número a las realizadas desde ordenadores portátiles y de sobremesa en los Estados Unidos 7.comscore. Si el análisis lo exportamos a las búsquedas desde dispositivos móviles.washingtonpost.netmarketshare.2% del mercado mundial de los motores de búsqueda móvil (tableta + teléfono inteligente). período en que consiguieron dominar el mercado de los buscadores a escala global (a excepción de unos pocos países con gran aceptación y uso de motores de búsqueda nacionales. Según datos de Comscore 6 a fecha de noviembre de 2014. denominada Google. seguido de Microsoft con el 19. que terminaron por quemar laboralmente a Acharya por completo.com/business/technology/googling-on-mobile-devicessurpasses-pcs-in-us-for-1st-time/2015/05/05/909a9c6a-f344-11e4-bca5-21b51bbdf93e_ story.30 La revolución Google Scholar blemente tuvieran un impacto más claro e intenso en la sociedad. Según sus propias palabras. debía dejar 5 Cfr. donde se mantuvo por cuatro años que a la postre resultaron vitales en la compañía californiana.google. concretamente en el equipo de indización (es decir. https://www. Google representa a fecha de junio de 2014 el 92. Un predominio que siguen manteniendo en la actualidad. en la arteria vital de la compañía). gracias en parte a la amplia aceptación del sistema Android en los Smartphones. En 1999 tuvo la oportunidad de visitar a un colega que había comenzado a trabajar en una nueva startup en Palo Alto (California).es/intl/en/about 6 http://www. también fueron años de mucho trabajo y demasiado estrés. La terrible carga de trabajo llegó a tal punto de hacerle plantear una salida. Google (y todos sus sitios web asociados) supone el 67% del mercado de las búsquedas desde escritorio en los Estados Unidos. Acharya se integró finalmente en el equipo de Google en 2000 (Van Noorden. el resultado todavía es más impactante. La misión de esta empresa (organizar la información del mundo y hacerla universalmente accesible y útil) 5 tuvo un calado importante en la mente de Acharya.com/search-engine-market-share.

El proyecto evolucionó y viró por tanto de dirección. 2006). ¿qué impacto podrían haber tenido ciertas obras si su distribución no hubiera sido tan limitada al no disponer de plataformas de difusión de este tipo?. puedan estar las respuestas. En cambio. Algo que hubiera cambiado la vida a millones de estudiantes que. 2015) 9. con el propósito de integrar estos resultados en el buscador general (Hughes. 2014).Bloque A · Capítulo 1 · Los Orígenes la empresa o hacer algo que fuera interesante para él. los dos ingenieros pronto se dieron cuenta de una circunstancia que a la postre devino fundamental en el desarrollo futuro del proyecto. Los datos que manejaban Acharya y Verstak indicaban que los usuarios estaban enviando consultas puramente académicas a Google. por ello comenzaron a experimentar la extracción automática de metadatos y posterior posicionamiento y ordenación de la literatura científica. Sin embargo. Ante esta situación de crisis. Durante esta época de “descanso” ambos comenzaron a trabajar por su cuenta en la mejora de la indización del buscador. presumiblemente. fue entonces cuando Acharya pudo darse cuenta de lo valiosa que podría ser una herramienta dirigida a estudiantes y académicos que pudiera proporcionar información y acceso a la literatura científica y académica circulante. la idea que tenían en mente no era la de crear ningún Google académico. Es decir. decidieron tomarse un año sabático. simplemente buscan respuestas a sus preguntas. ¿En qué medida tal circunstancia había podido privar a grandes mentes. Una diferencia absurdamente sencilla. pero con menor presión (Levy. de inspiración para su vida y obra? Y al mismo tiempo. tanto Acharya como un compañero del equipo de indización (Alex Verstak). El usuario que busca material académico sabe que está buscando material académico. but is lower pressure. en su país y en muchos otros lugares. ¿habría cambiado la vida de cientos de investigadores? A lo que podríamos añadir… ¿está efectivamente cambiando hoy día? 9 Cfr. Existía una gran diferencia entre el usuario que realizaba la búsqueda de un material académico y el usuario que realizaba la búsqueda de cualquier otro tipo de información (como buscar una pizzería o un fontanero).” (Levy 2015)” 31 . no podían acceder a material académico de calidad. “Either I have to leave the company or I have to do something that can be interesting to me. sino simplemente la de mejorar el ranking de documentos académicos en las búsquedas web (Van Noorden. como él en su juventud. el resto de usuarios no tienen ningún conocimiento o idea prefijada del tipo de resultado que van a obtener. el buscador les proporcionará documentos donde.

fundamentalmente Web of Science. su relevancia sería mayor de entre aquellos otros textos que hubieran recibido apenas alguna o ninguna cita. los artículos científicos recibían citas de otros artículos publicados con posterioridad que mostraban o reflejaban una deuda científica con los textos pioneros. Entre las características de este ya viejo algoritmo se encontraba la de imitar el comportamiento de las bases de datos bibliométricas (en aquella época. propiedad de Thomson Reuters). La mayor novedad. http://en. la inmediata reacción de éste fue: ¿por qué no está “vivo” esto todavía? Evolución Google Scholar nació finalmente el 18 de noviembre de 2004 con solo dos personas en su equipo (Acharya y Verstak). 2015). Este acto de citación podía entenderse como un “voto” a un documento (este concepto se debe entender de forma general y sin entrar en el arduo debate acerca de las distintas motivaciones de los científicos para citar o no citar). Verstak y Acharya estamparon el objetivo definitivo de Google Scholar: hacer que los problemas del mundo se resuelvan un 10% más eficientemente (Levy. así como en la identificación de las relaciones entre los distintos artículos (linking). El elemento que permitió a Google distinguirse del resto de competidores en el mercado de los buscadores web fue el PageRank (Brin y Page. He aquí una bella paradoja en la historia de la búsqueda y recuperación de la información. Ambos provenían del mundo académico por lo que conocían sobradamente las necesidades reales de los investigadores cuando éstos se enfrentan a la ardua tarea de localizar información científica: las fuentes.32 La revolución Google Scholar Con esas ideas en mente.org/ wiki/Google_Scholar . 10 Cfr. 2012). Efectivamente. la materia y los autores eran y son las piedras angulares sobre las que bascula cualquier consulta de esta naturaleza.wikipedia. más allá de su enorme cobertura y dinamismo (aspectos que serán estudiados en capítulos posteriores). radicaba en la aplicación de la tecnología de Google a la hora de posicionar los artículos mostrados en los resultados de una determinada consulta. Cuantos más votos hubiera alcanzado un determinado artículo. To make the world’s problem solvers 10% more efficient. permitiendo un acceso más fácil y preciso al conocimiento científico 10. Cuando tras varias pruebas enseñaron finalmente el prototipo a Larry Page (co-creador de Google).

La cantidad de factores que intervienen en la relevancia de una página web en la actualidad es enorme (se estima que existen más de 200 posibles factores) 11. Esta analogía que la bibliometría había llevado a los motores de búsqueda volvía al mecanismo de Google Scholar para crear un sistema novedoso en el acceso a la literatura científica. tienen diferentes matices a la hora de contabilizarlos.com/google-ranking-factors 12 https://moz. 2004). por lo que la precisión y relevancia de los resultados incrementaba sin cesar. propiedad de Elsevier). la posibilidad de posicionar los resultados ante una consulta determinada en función de los “votos” que tuvieran las páginas web que aparecían en la página de resultados (y que ya tenían por tanto una relación con la consulta realizada por los usuarios). Un hecho es que el algoritmo funcionó. A pesar de disponer de una interfaz sencilla y de pocas funcionalidades extra. aunque acciones con innegables similitudes. en los inicios de Google el factor clave se basaba principalmente tanto en la cantidad de enlaces (considerados como citas o votos) que una página recibía como en el establecimiento de pesos en función del lugar donde provenía el enlace (es decir.Bloque A · Capítulo 1 · Los Orígenes Esta idea de los “votos” sugirió a Sergey Brin y Larry Page. utilizando para ello la tecnología y el conocimiento del buscador general de Google. y el resto ya es Historia. El éxito de Google Scholar como buscador (y como marca) fue inmediato pese a coincidir en el tiempo con el anuncio de una nueva base de datos bibliográfica (Scopus. creadores de Google.com/google-algorithm-change 33 . El sistema era asimismo capaz de acceder a una cantidad de artículos a texto completo cada vez mayor. Ninguna otra base de datos bibliográfica o bibliométrica del momento proporcionaba esta funcionalidad más allá de posicionar los artículos según su número de citas (Giles. Por supuesto. mientras Web of Science y Scopus iniciaban una rivalidad como bases de datos bibliográficas de referencia en el mundo científico. presentada el 3 de noviembre de 2004 (Reed Elsevier. El sistema era capaz de posicionar los artículos en función de su relevancia ante una determinada consulta. 2005). Google Scho 11 http://backlinko. y además la fórmula completa es secreto industrial. el algoritmo era en realidad mucho más complejo pues determinar un “voto” y contabilizar una cita. no era lo mismo recibir un enlace del Washington Post que de la página personal de un estudiante de secundaria). de una variabilidad y dinamismo muy alto (se estima que Google realiza entre 500-600 modificaciones menores de su algoritmo durante un año y ocasionalmente modificaciones de gran envergadura) 12. A pesar de todo ello. apenas unas semanas antes.

seguidas a cierta distancia de Yahoo! (57. Tanto Verstak como Acharya eran plenamente conscientes de que una base de datos académica sólo puede sobrevivir si los materiales más relevantes están incluidos en su catálogo. En cualquier caso. simplemente el hecho de poder incluir una descripción o un resumen ya implicaba mostrar al usuario que ese contenido existía. 2004) ya se habían hecho eco del impacto de este buscador. tanto Science (Leslie. Estos mismos datos a fecha de 2015 (para aquellos servicios que todavía siguen vivos) deben ser tan escalofriantes como privados. Y para ello Acharya tuvo que negociar duramente con las editoriales privadas desde el principio y durante años. Pubmed-Medline (14. Y eso marcaba la diferencia (de ahí la obligatoriedad de que los textos dispongan de un resumen para ser incluidos en Google Scholar.756) y Google Scholar (105.34 La revolución Google Scholar lar iba creciendo en otro sector básico: en la búsqueda y localización de información académica. Butler señalaba que las primeras impresiones de Google Scholar por parte de los expertos (tanto bibliotecarios como informáticos) sugerían que el servicio era impresionante tanto en escala como en funcionalidad.522). Las negociaciones de Google Scholar con las editoriales académicas más potentes fueron complicadas. quienes reclamaron que Google . Pubmed central (9. aunque algunos manuscritos estuvieran detrás de una plataforma de pago (y por tanto no accesibles aunque aparecieran en los resultados de búsqueda).185) son las dos fuentes desde donde se reciben más visitas.616). como se verá en el capítulo dedicado a la indización). Es más. El caso más mediático tal vez lo constituyó la American Chemical Society (ACS). 2004) como Nature (Butler.336). Antes de que el producto hubiera cumplido su primer año de funcionamiento. Proporcionar información era la base fundamental sobre la que se sustentaban y con la que Acharya deseaba cumplir ese sueño que comenzó a imaginar durante sus años de estudiante. en el sentido amplio del término.617) y MSN (2. Highwire press (8. El acceso al texto completo de los artículos constituyó uno de los principales campos de batalla con los que el equipo de Google Scholar tuvo que lidiar durante los primeros años del producto. informando que Google (345. Giles (2005) ya informa que Google Scholar dirige más tráfico a las sedes web de Nature que cualquier otro motor de búsqueda académico multidisciplinar mientras que Giustini (2005) proporciona datos de visitas al British Medical Journal (noviembre de 2005). se comenzaba a detectar una tendencia que resultaría clave en las posteriores negociaciones de Google con los editores: Google Scholar aumentaba las visitas a las páginas web de las revistas.967). En concreto.

asuntos todos ellos que serán discutidos con mayor profundidad en el apartado dedicado a la cobertura). pese a que Pubmed ya se encontraba indizada en 2005. District Court for the District of Columbia (Mehta. Pese a ello. Google Scholar indiza los textos completos con el fin de que los resultados ante determinadas consultas sean los más pertinentes.Bloque A · Capítulo 1 · Los Orígenes Scholar ejercía una competencia desleal a su plataforma SciFinder Scholar (una aplicación de escritorio de pago que servía para indizar información almacenada en la base de datos de la ACS). autores o materias. cuyos términos no trascendieron a la luz pública y donde las partes se limitaron a firmar un acuerdo en el que se comprometían a costear los honorarios de los abogados. Springer o Wiley. la demanda se centraba especialmente en el uso del término “Scholar” y no en la herramienta como tal (Hines. siempre ha sido genuinamente complejo conocer los acuerdos específicos a los que había llegado con las distintas editoriales. Blackwell. En este sentido. Otra cosa bien distinta es que los usuarios finales puedan o no acceder a los textos completos proporcionados por las editoriales. entre otros: Association of Computer Machinery (ACM). Institute of Electrical and Electronic Engineers (IEEE). hecho que limitaba ampliamente su uso para investigadores que precisaran información médica actualizada. 2005). el acuerdo de acceso completo se refiere a Google Scholar y no a los usuarios finales. Al parecer. así como de importantes archivos online como el de la NASA Astrophysics Data System o repositorios como Arxiv o Pubmed.S. En este punto se debe aclarar un tema de suma importancia y que generalmente suele dar pie a errores y malinterpretaciones. permitiendo solamente ser indizadas por Google Scholar utilizando la información bibliográfica y el resumen. tanto Elsevier como Highwire y la American Chemical Society no estaban todavía incluidas en los acuerdos para acceder al texto completo de los artículos publicados por estas importantes editoriales. aunque no todos ellos en su completitud (Notess. en 2005 ya incluía en su catálogo a los principales editores. Por ejemplo. 2004). Es decir. Nature Publishing Group. hecho que dependerá de las posibles subscripciones que tengan contratadas los usuarios. Ingenta. La ACS interpuso una querella el 9 de diciembre de 2004 (menos de un mes después del lanzamiento del buscador) en el U. 2004). las instituciones que tienen acuerdos con 35 . Dado que Google Scholar no proporciona una lista detallada de las editoriales incluidas (ni tampoco de las revistas. En la revisión posterior realizada por Vine (2006). Vine (2005) descubre que Google Scholar indiza sus contenidos con casi un año de retraso. La demanda terminó con un acuerdo extrajudicial en Washington en 2006.

notifica que el buscador ya tiene acceso al texto completo tanto de Highwire como de la American Chemical Society. en su faceta de negociador y evangelista de Google Scholar. Y disponer de un resumen en abierto (aparte de la información bibliográfica) es requisito obligatorio para ser indizado en el buscador académico. a la que seguramente no deseaban perjudicar en favor de Google Scholar (Scirus fue deshabilitada definitivamente en 2014). aunque sin duda éste facilita su descubrimiento. Bowen (entonces Rector de la Princeton University) constituye en la actualidad la mayor plataforma de artículos online del mundo (Levy. Finalmente. pues no se precisa de Google Scholar para acceder a dichos contenidos. El principal problema de JSTOR tenía para ser indizada en Google Scholar era que solamente ofrecía acceso de pago para artículos escaneados. La indización de la plataforma JSTOR 14 supuso otro importante hito en la evolución de Google Scholar.36 La revolución Google Scholar las editoriales (bibliotecas académicas fundamentalmente) pueden configurar OpenURL Link resolvers (como SFX). por lo que no tenían posibilidad de separar de forma efectiva los resúmenes de los artículos (tarea costosísima en tiempo y dinero). Una de las posibles razones de la renuncia inicial de Elsevier a ser indizados por Google Scholar a texto completo. 2015). convenció a los responsables de JSTOR para ofrecer la primera página de cada artículo de forma gratuita (pues en la primera página suele estar incluido el resumen). en su posterior análisis de Google Scholar. De esta forma. Acharya. 2007).jstor. y esta primera página podía servir adicionalmente de aliciente a los usuarios para solicitar la compra de un artículo que pudiera ser de su interés tras leer 13 https://www. podrían estar indizados en Google Scholar (aunque no a texto completo).researchgate. Cecchino (2010). Esta biblioteca digital fundada en 1995 por William G. para autenticar usuarios y proporcionar acceso a los textos completos en el caso de que estén disponibles a través de las distintas subscripciones institucionales. más allá de las posibles cuestiones legales o de competencia.net 14 http://www.org . No es hasta 2007 cuando las revistas de Elsevier comienzan a ser incluidas a través de Science Direct (Brantley. El acceso al texto completo gracias a la existencia de copias privadas de los autores depositadas en repositorios institucionales (en la forma de preprints o postprints) o en plataformas de intercambio de material académico (como ResearchGate 13) constituye igualmente un asunto aparte. podría deberse a que disponían de su propia plataforma web (Scirus).

que se incluye entre los “buscadores especializados” como Google Finance o Google Trends. y que ha ido poco a poco creciendo hasta las nueve personas que lo conformaban en 2014. hecho que pudo directamente observarse en 2011 cuando se eliminó el acceso directo al producto desde el menú desplegable de opciones de la página principal de Google. 2014). Este hecho puede deberse a que Google Scholar actualmente no genera beneficios a la compañía. 2015). En la actualidad se precisan hasta tres clics y un scroll (todo un mundo en la Web) para poder acceder al servicio. Otros buscadores especializados como Google Patents todavía corren peor suerte al no estar siquiera incluidos en esta página de productos. una década después de su lanzamiento (Van Noorden. duramente criticados en sus inicios (Jacsó. La inclusión de publicidad o de resultados patrocinados (tal y como ocurre en el buscador general) se antoja de complicada aplicación en un entorno académico. Este hecho ha llevado en ocasiones a ser ligeramente discriminado dentro de la misma compañía de Mountain View. En cualquier caso. Pese a ello. el producto ha ido mejorando progresivamente durante sus primeros diez años de existencia no sólo en la calidad de sus resultados. Un número absolutamente ridículo si lo comparamos con las extensas plantillas de otros productos y servicios de Google (y de otros productos de la competencia). todos ellos productos portentosos pero alejados del usuario común. 2005b).Bloque A · Capítulo 1 · Los Orígenes el resumen. JSTOR tiene indizados alrededor de tres millones de registros en Google Scholar. Más allá de los distintos acuerdos alcanzados con diversas editoriales académicas. Google Scholar ha ido paulatinamente ampliando la gama de servicios y prestaciones desde su lanzamiento. sino por la cantidad de nuevos servicios adicionales de gran utilidad. una reflexión que parece sonar más bien a una cortés excusa que a un argumento con sólidas raíces. un esfuerzo digno de alabanza si consideramos que el equipo inicial estaba únicamente formado por Acharya y Verstak. En la actualidad (septiembre de 2015). el distinguised engineer responde que este hecho no afectó a las visitas que el producto recibía (que siempre han ido en continuo ascenso) y que además aquellos usuarios que desean utilizar el producto no tienen mayor problema en encontrarlo. Aunque 37 . tanto por parte de los posibles anunciantes como de los usuarios. constituyendo uno de sus principales proveedores de contenidos. cuando Acharya es preguntado respecto a este asunto (Levy. no sólo por la escasez de plantilla asignada sino por la publicidad y difusión del producto.

que ofrece listados de revistas académicas en función del h-index). las aportaciones más mediáticas hasta la fecha han sido indudablemente Google Scholar Citations (noviembre de 2011). en 2006 se incorporó una herramienta de exportación de referencias de forma que los resultados obtenidos ante una determinada consulta pudieran ser exportados a distintos gestores de referencias (RefWorks. superior izquierda) se observa la pantalla austera de Google Scholar en su lanzamiento. superior derecha) ya se incluye la posibilidad de realizar una búsqueda avanzada. En 2006 (figura 2b.org/ . prestación que ya incluía desde sus inicios. Por ejemplo. El año 2006 es igualmente importante pues aparece la versión de Google Scholar para China.38 La revolución Google Scholar bien es cierto que estas mejoras han ido apareciendo de forma más bien irregular y sin apenas publicidad (Quint. con los que Google Scholar ha comenzado a proporcionar indicadores de naturaleza bibliométrica más allá de los datos de citas recibidas a cada artículo. es preciso remarcar que la finalidad de las citas recibidas en Google Scholar era (y es) básicamente la de ordenar los resultados para presentar en las posiciones superiores a los “presumiblemente” más relevantes ante una consulta concreta (este asunto se tratará con mayor profundidad en el capítulo dedicado a las prestaciones de Google Scholar). japonés y coreano) o incluso proyectos de digitalización y almacenamiento de revistas académicas impresas. RefMan. La incorporación de Google Scholar Library (una biblioteca personal para gestionar y etiquetar artículos). como el chino. desarrollada en asociación con Beijing Wan- 15 https://archive. Endnote y BibTeX). ha pasado en cambio algo más inadvertida. la caja de búsqueda imitando al buscador general y simplemente un botón de información y de enlace directo a Google. Otras herramientas que se han ido incorporando a lo largo de los años han sido el botón “Artículos relacionados”. así como una herramienta de preferencias del buscador (disponibles desde principios de 2005). Sin embargo. accesible desde noviembre de 2013. donde destaca la declaración “beta” del producto. 2007). y Google Scholar Metrics (abril de 2012). No obstante. En 2004 (figura 2a. que permite la creación de perfiles individuales de investigadores. funcionalidades de enlazado (linking) entre una amplia variedad de idiomas (de especial importancia el soporte a idiomas no europeos. En la figura 2 se puede observar a título ilustrativo la evolución de Google Scholar a partir de su página de inicio con diversas capturas de pantalla realizadas a través de Internet Archive y su Wayback machine 15.

“Vídeos”.com. En 2012 (figura 2e. patentes y textos de jurisprudencia. dedicado al proceso de búsqueda en Google Scholar). cada vez más completa. El 2012 constituyó un año especialmente importante.cn/english/doc/2006-02/21/content_522254. donde ya se permite seleccionar la búsqueda de artículos.Bloque A · Capítulo 1 · Los Orígenes fang Data y Chongqing VIP Information 16. que ya no aparece en 2010 (figura 2d.chinadaily. donde ya se ha incluido el servicio de biblioteca personal. así como la incorporación en la parte superior izquierda de la pantalla del acceso a los perfiles personales. en el que se destaca fundamentalmente la incorporación de filtros a los resultados a través tanto de un menú lateral izquierdo como superior (todavía presentes aunque con ciertos retoques y cambios). fue el año en el que el sistema modificó gran parte de la interfaz interna de los resultados 17. inferior izquierda) se observa la desaparición de la declaración de beta. centro-derecha). centro-izquierda) al integrar el antiguo menú de inicio de Google (“Google Imágenes”. “Mapas” y “Más servicios”). aparte de la configuración del buscador.htm 17 http://googlescholar. en 2014 (figura 2f. eliminada oficialmente a mediados de 2011). 16 http://www. pues además de dejar definitivamente atrás la etiqueta de “beta” y lanzar productos derivados de gran impacto. mostrándose más cercana a la caja de búsqueda. que sigue vigente en la actualidad (la búsqueda avanzada será descrita con mayor detalle en el capítulo 6. al ranking de revistas y a los sistemas de alerta. La integración con Google sigue presente no sólo con el enlace al buscador sino con un enlace a la ayuda de Google. Esta integración se hace todavía más patente en 2008 (figura 2c. se recoge el momento de la celebración del décimo aniversario. inferior derecha). “Noticias”. aparte de un botón de “Acerca de” y “Ayuda” específicos de Google Scholar. así como el acceso a la búsqueda avanzada a través de una pequeña pestaña situada a la derecha de la caja principal de búsqueda.html 39 .es/2012/05/our-new-modern-look.blogspot.com. y el menú de opciones se ha movido desde la parte superior derecha hacia el centro superior de la pantalla. Finalmente.

2012 y 2014) Superior izquierda: noviembre 2004. 2008. medio derecha: noviembre 2010. medio izquierda: noviembre: 2008.40 La revolución Google Scholar Figura 2. inferior derecha: noviembre 2014. inferior izquierda: noviembre 2012. 2010. 2006. superior derecha: noviembre 2006. Evolución de Google Scholar (2004. .

dios de la mitología romana que tenía dos caras mirando hacia ambos lados de su perfil. dios de los comienzos y los finales (de ahí que le fuera consagrado el primer mes del año). por otra parte. Google Scholar es por una parte un buscador (facilita el inicio de la búsqueda de material científico) y. una herramienta susceptible de ser utilizada para evaluar la actividad científica. Figura 3. así como en la percepción de éste en sus diferentes usuarios. Efectivamente. Las dos caras de Google Scholar . Google Scholar tiene dos caras que representan asimismo un comienzo en la búsqueda científica y un final en la evaluación de la actividad científica. Este segundo capítulo se centra exclusivamente en el papel de Google Scholar como buscador de información académica hegemónico.Capítulo 2 Las dos caras de Google Scholar (I): El buscador académico Al igual que Jano (Figura 3). Su papel hegemónico actual tanto en las búsquedas académicas como en la gestión de perfiles académicos personales es fiel reflejo de los tiempos de cambio que se viven actualmente en el mundo de la comunicación científica y la tendencia hacia la democratización bibliométrica.

google. Wright.com 2 Los datos reales de visitas al servicio no son públicos.com>. A día de hoy. Evaluando tanto su gran potencial en el mercado de las búsquedas académicas como todas las posibles amenazas que su uso irresponsable o impreciso podrían suponer.42 La revolución Google Scholar El buscador académico hegemónico A pesar del relativo eco recibido tras su lanzamiento. el número de sitios web desde donde se recibe al menos un enlace (Referring domains) 3 y la calidad del sitio (Trustflow) a partir de los datos obtenidos mediante Majestic Site Ex 1 https://siteanalytics. en ningún momento. Una definición de su significado se puede encontrar en el siguiente recurso: https://majestic.487. Boughan y Roberts. desarrollado por dos ingenieros durante su año sabático que. la visibilidad es elevadísima 2. este mismo indicador mostraba 2.google. tenían en mente su creación como tal.com/scholar.411 millones de usuarios únicos en el mercado norteamericano a fecha de marzo de 2015 para el sitio web <scholar. creado a partir de la tecnología flow metrics de la empresa Majestic. la visibilidad web del producto es incuestionable en todo el mundo. tratando de desvelar sus puntos fuertes y débiles. Y sin ninguna campaña de marketing especial por parte de la empresa matriz. Google Scholar ha sido ampliamente analizado y cuestionado tanto por la Academia como por el mundo de los profesionales de la información (Howland.974.com/support/glossary#TrustFlow . 2009). Aun considerando las limitaciones de este servicio para calcular las visitas reales al sitio (la metodología está basada en paneles de usuarios a partir de los cuales se realiza una inferencia estimada de las visitas). mostrando el número de enlaces externos que recibe cada uno (Inlinks).612 millones de usuarios únicos en marzo de 2014. desde su publicación en 2004.compete. Compete 1 muestra la escalofriante cifra de 6. que dirigen a distintas versiones del producto). En la Tabla 1 se ofrece un ejemplo de los URLs de acceso a 30 países aparte de la matriz norteamericana. Sin embargo. se podría decir que el nacimiento de Google Scholar fue un tanto humilde. otros servicios gratuitos con estimación de visitas (Quantcast o Alexa) no proporcionan información del sitio al constituir un subdominio dentro de Google 3 Trustflow es un parámetro similar al PageRank (pero de rango 0 a 100). Las visitas al dominio general de Google Scholar (que corresponden exclusivamente a la versión estadounidense) deberían complementarse con las visitas a cada una de las versiones nacionales existentes (el URL de acceso al producto está conformado por un conjunto de URL alias. Un proyecto menor para Google. El objetivo de este capítulo es pues el de ofrecer un repaso histórico acerca de la reacción del mundo científico y profesional ante este producto.

127 3. En todo caso.210 1.google.se scholar.au scholar.be Bélgica 1.289 30 scholar.co.806 36 Australia 499.com 7 Además.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) plorer (historic index) 4. y los países mostrados constituyen únicamente una muestra selectiva 7.google. 43 . los datos de esta tabla deben leerse obligatoriamente de forma ilustrativa y comparativa pues éstos poseen una enorme variabilidad (incluso diaria).google.no Noruega 853. pueden ser muy diferentes a los obtenidos mediante otros servicios similares como OpenSiteExplorer 5 o Ahrefs 6.es scholar.ca Canadá scholar.co.336 31 Suecia 269.com.022 26 Brasil 391.529 1.616 2.google.586 7. Google Scholar redirige a la versión norteamericana (por ejemplo.714 30 1.google.437.030.632 29 India 2.088.302 5.com.google.148 39 2.google.059 42 Alemania 3. 6 de enero 2016) Inlinks Referring Domains Trustflow 614.in 4 https://majestic.nl Países Bajos scholar.711 1.google.google.hk scholar.uk scholar.983 3.475 21 scholar.com. bien por no disponer de versión nacional de Google (como Nigeria. o porque a pesar de tener versión nacional.fi Finlandia 553.367 31 España 762.google.628 24 scholar.416 33 China 871.115 1.kr Corea del Sur 1.164 30 826.090 32 scholar.149.com Estados Unidos scholar.136 188.175 14.it Italia 503.634 4.630 27 scholar.com 5 https://moz.google. algunos países no disponen de versión propia.413 17.com/researchtools/ose 6 https://ahrefs.209 53 Reino Unido 4.fr Francia scholar.google.435.br scholar. por ejemplo).de scholar. están redondeados.google.278.tr Turquía 667.530.598 31 scholar.google. URLs alias de Google Scholar e indicadores web (Majestic Site Explorer.google. el caso de México).google. Tabla 1.com.183 5. una de las principales herramientas de indicadores web actuales.007.google.419 7.634 2.344 22 URL PAÍS scholar.google.845 5.co.131 7.

887 686 28 scholar. Es decir.ar Argentina 179.412 407 20 scholar.293 473 19 scholar. su simpleza. seguida sorprendentemente por Alemania. Como muestra de ello. Web of Science.020 26 scholar.google.google. a través de un rápido vistazo. La versión inglesa es la segunda en visibilidad.uk> hacia <scholar.nz Nueva Zelanda 70. la asignación de enlaces no es restrictiva.44 La revolución Google Scholar URL PAÍS Inlinks Referring Domains Trustflow scholar.cl Chile 14.356 803 29 scholar.ch Suiza 22.co.google.ru Rusia 421.jp Japón 39 11 11 Además.google. 2014) sino frente a otras bases de datos bibliométricas.351 1.pt Portugal 262. pues en realidad pertenecen a dominios web independientes.co.google.google.dk Dinamarca 63. Los más de 660 millones de enlaces desde más de 170 mil sitios web que recibe la versión norteamericana de Google Scholar constituyen un claro indicio de la amplia difusión y penetración de este motor de búsqueda académico.311 688 31 scholar. Pubmed.google.google.google.co.569 790 25 scholar. . Por ejemplo. La facilidad de uso de Google Scholar. Microsoft Academic Search) desde 2004 hasta la actualidad.428 990 28 scholar. el sistema no filtra los posibles enlaces que puedan dirigir de un alias a otro.097 912 24 scholar.google. las versiones más populares y utilizadas y la orden de magnitud de su impacto. aparte del hecho de ser multilingüe. los posibles enlaces desde <scholar.google.com.com. en la figura 4 (superior) se muestra la evolución de las tendencias mundiales de búsqueda en Google de los términos asociados a diversas bases de datos (Google Scholar. sencillez.210 750 19 scholar.co Colombia 24.330 29 scholar. rapidez. Resultan no obstante datos útiles para conocer.il Israel 9. han contribuido a su actual popularización.za Suráfrica 19.google.471 988 31 scholar.google.google. Scopus.gr Grecia 164. universal y sobre todo gratuito.google.co. no sólo frente al resto de motores de búsqueda académicos (Ortega.513 1.at Austria 208.com> se cuentan como enlaces externos a este último.

En la actualidad (mayo de 2015). Ayllon y Delgado López-Cózar. aunque la compañía de Redmond nunca indicó esta circunstancia oficialmente en la plataforma web (Orduña-Malea. Figura inferior izquierda: tendencias de búsqueda geográfica entre enero-julio de 2004. si la navegación lo requiere. amarillo: “Web of Science”. sino que aparecen como accesos o visitas desde Google Scholar a Pubmed. Figura inferior derecha: tendencias de búsqueda geográfica entre febrero-mayo de 2014 En la figura 4 (superior) se pueden destacar los caminos divergentes que han seguido Google Scholar (en color azul) y Pubmed (en color rojo). los perfiles de usuarios son inaccesibles. violeta: “Microsoft Academic Search”. Este hecho provoca que los usuarios tiendan a comenzar sus búsquedas en este último y. Sin embargo. especialmente Microsoft Academic Search. Tendencias de búsqueda (Google Trends) Figura superior: azul: “Google Scholar”. verde: “Scopus”.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) Figura 4. aunque el sistema seguía funcionando. El resto de bases de datos permanecen a una distancia considerable. terminen accediendo a Pubmed para consultar datos bibliográficos más completos o metaanálisis. 2014). En la actualidad el 100% de la cobertura de Pubmed está incluida en Google Scholar. estas visitas ya no se reflejan como consultas al buscador de Google. Adicionalmente. Martín-Martín. en la figura 4 (inferior) se ofrecen los patrones de 8 La desactualización se detectó debido a la caída abrupta en la cobertura de la literatura reciente. Nota: en marzo de 2016 el buscador volvió a funcionar. rojo: “Pubmed”. pero con una interfaz y funcionalidades distintas 45 . desactualizada durante años por Microsoft 8.

depresión y finalmente aceptación). China y sorprendentemente Brasil. profesor. 2006). se pasa a una tercera fase de cierto optimismo acerca del potencial de Google Scholar para lograr el 100% de la disponibilidad de la información online para una institución (Pomerantz. ni siquiera inmediato. estudiante) y muy significativamente del área de conocimiento. principalmente). Su aceptación nunca fue (ni es) completa. el camino de Google Scholar no ha sido sencillo. Desde el sector académico las opiniones diferían fundamentalmente en función del usuario (investigador. enfado. 2007) donde recibe críticas durísimas. Aparte de las zonas anglófonas (Estados Unidos. A esta fase le sigue un período de estudio sistemático (Robinson y Wusteman. Por ejemplo. Finalmente. donde Brasil ocupa un puesto prominente. En un primer momento. cada una de ellas con sus espinas correspondientes. Su travesía podría definirse como un camino de rosas. A estos dos importantes focos (profesional y académico general) se añadiría con cierta posterioridad un tercero (el sector de la Bibliometría). Jacsó (2006) usa los términos “shallowness” (superficial) y “artificial unintelligence” (desinteligencia artificial) para describir el programa. Desde el sector bibliotecario se pueden vislumbrar tres fases diferenciadas. se podría decir que las bibliotecas han ido cumpliendo las distintas fases clásicas del duelo (negación. se destacan las consultas desde los países escandinavos. Reino Unido y Australia.46 La revolución Google Scholar consulta geográficos a nivel mundial entre enero-julio de 2004 (izquierda) y febrero-mayo de 2015 (derecha). Google Scholar es observado con curiosidad. Tanto desde el sector del profesional de la información (usuarios intermediarios) como desde el académico (los usuarios finales) el producto fue acogido con una amplia diversidad de opiniones y sentimientos: desde la más exagerada admiración hasta la más injustificada crítica. En cierto modo. negociación. cuyos objetivos se centraron exclusivamente en el estudio del buscador con el propósito de analizar su capacidad como herramienta de evalua- . Este hecho ya es detectado por Ortega (2015) en su estudio de la demografía de los perfiles creados en Google Scholar Citations. El grado de cobertura de Google Scholar dependía en sus inicios fuertemente de los acuerdos con las editoriales y de su capacidad de rastreo de la web profunda (deep web) para localizar literatura gris. aunque escepticismo (Brophy y Bawden. aunque por supuesto la tarjeta de presentación de Google Scholar en 2015 no tiene comparación alguna con la de 2004. A pesar del impacto actual del producto. 2005). lo que tenía un efecto negativo en las ciencias sociales y humanidades.

6%). 10 http://www.2%) y Medicina (16.5%). por otra parte.com 47 . Publicaciones por área de conocimiento (Scopus. a aquellos para los que Google Scholar es el propio objeto de investigación. 9 Google Scholar no permite la exportación masiva y estructurada de registros bibliográficos.6.vosviewer. Figura 5. La literatura científica ha reflejado pues estos tres frentes de trabajo a lo largo de los últimos años.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) ción científica. En la figura 6 se ofrece el mapa de acoplamiento bibliográfico obtenido. se han recogido hasta 472 trabajos publicados desde 2004 hasta 2014 en los que el término “Google Scholar” aparecía en el título o en las palabras clave. 2004-2014) Estos datos se exportaron posteriormente con el fin de ser visualizados a través de la herramienta VOSViewer 10 (v.1) (Van Eck y Waltman. La distribución completa por área de conocimiento se ofrece en la figura 5. Por tanto. mientras que las áreas científicas desde las que se ha abordado el tema han sido las Ciencias sociales (46. Scientometrics (23) y Online Information Review (22) han sido las dos revistas científicas en las que se ha publicado la mayor cantidad de trabajos. Informática (42. dentro del sector académico resultaría necesario distinguir por una parte a los investigadores que utilizaban Google Scholar como herramienta de búsqueda de información científica y. 1. Realizando una búsqueda en la base de datos Scopus 9. 2010).

48 La revolución Google Scholar Figura 6. Mapa de acoplamiento bibliográfico (Scopus 2004-2014) .

el espinoso tema de la cantidad y calidad de estas citas será tratado más adelante.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) Se puede observar por una parte la creación de dos clusters (figura 6. donde se pueden apreciar claramente tres grandes bloques: el orientado a la biblioteca (cluster azul). a la sazón los más importantes en la literatura científica relacionada con el estudio de Google Scholar. superior). Figura 7. Mapa de conceptos (Scopus. El documento más citado hasta la fecha (mayo 2015) es “Impact of data sources on citation counts and rankings of LIS faculty: Web of Science versus Scopus and Google Scholar” (Meho y Yang. siendo uno de ellos (redondeado en rojo) el núcleo de la literatura con mayor grado de similitud en función de las referencias comunes contenidas en cada documento. con 304 citas recibidas. El análisis del corpus textual de estos registros bibliográficos permite la elaboración de un mapa de los principales conceptos o temas abordados. a los análisis bibliométricos (cluster rojo) y finalmente a los métodos. Este mapa se muestra en la figura 7. así como la relación entre éstos. Este mismo artículo recibe 483 citas en Google Scholar. 2004-2014) 49 . 2007). se pueden observar con mayor detalle las conexiones establecidas entre estos documentos. Pero no nos adelantemos a los acontecimientos. Si se realiza un zoom a este núcleo (figura 6. procesos y estudios comparativos (cluster verde). inferior).

ya sean estudiantes. En ese sentido De Rosa et al (2005). Los usuarios y Google Scholar Entre los estudios que abordan el análisis de Google Scholar como buscador académico se pueden distinguir por un lado aquellos que pretenden conocer el grado de percepción de la calidad y utilidad del producto por parte de diferentes tipos de usuarios (estudiantes. bases de datos bibliográficas. académicos y profesionales de la información) y. Los resultados de su trabajo muestran que el 45% de los estudiantes analizados había empleado Google como primera opción a la hora de localizar este tipo de información. por otro lado. comisionados por la Online Computer Library Center (OCLC). utilidad y grado de utilización ¿Qué piensan los estudiantes? La irrupción de Google Scholar en el mercado de los buscadores de información académica supuso una auténtica revolución en el comportamiento de los usuarios a la hora de comenzar sus procesos de búsqueda y recuperación de información científica.). Por claridad expositiva. etc. realizan un amplio estudio . Griffiths y Brophy (2005) llevan a cabo uno de los trabajos pioneros en este ámbito al realizar un estudio de usuarios en el Reino Unido con el propósito de ampliar el conocimiento acerca del comportamiento de los estudiantes a la hora de utilizar recursos académicos. a continuación se van a desgranar los principales hallazgos y discusiones científicas en torno a Google Scholar. herramientas de descubrimiento. comenzaremos con la línea de investigación centrada en Google Scholar como buscador (desde el punto de vista de los usuarios. Una explicación razonable a estos resultados puede deberse a la popularización de los motores de búsqueda como herramienta entre los alumnos. las investigaciones orientadas a comparar las prestaciones de Google Scholar con otros productos de información bibliotecarios (catálogos. Dada su sencillez y potencialidad no es de extrañar que pronto surgieran los primeros estudios tratando de valorar el impacto de este nuevo buscador en los estudiantes. profesionales o académicos) y posteriormente nos ocuparemos del frente de investigación que toma Google Scholar como objeto de estudio. a) Percepción de la calidad.50 La revolución Google Scholar Tomando como punto de partida los datos obtenidos en las figuras anteriores. concretamente para analizar su validez en la evaluación de la actividad académica.

Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) a través de una encuesta a 3. En ese sentido.y en especial de Google . sino que está propiciando un notable cambio en la forma de trabajar en el sentido amplio. Este hecho no sólo confirma los estudios anteriores (que detectaban el amplio uso de estas herramientas como punto de partida de sus búsquedas informacionales) sino que trae a colación otro grave problema: ¿deben ser todos los resultados obtenidos a través de un motor de búsqueda considerados en la misma medida?. El impacto de los motores de búsqueda . concentración en 51 . confían excesivamente en los motores de búsqueda. Singapur. del total de encuestados. Los sorprendentes resultados del informe muestran que el impacto de las Tecnologías de la Información y Comunicación (TIC) en los jóvenes se había sobreestimado. Los resultados de este informe indican que el 89% de estos estudiantes en activo utilizaban los motores de búsqueda para comenzar sus procesos de búsqueda de información mientras que sólo el 2% utilizaba el sitio web de la biblioteca para este propósito. la British Library y el JISC (anteriormente Joint Information Systems Committee) financian un informe con el fin de identificar el modo en el que los investigadores del futuro (aquellos nacidos después de 1993) iban a acceder e interactuar con los recursos digitales en un margen de 5 a 10 años (Rowlands et al. el virus Google había sido inoculado. aunque las personas jóvenes demuestran una aparente facilidad y familiaridad con los aparatos electrónicos y los ordenadores. Canadá. ¿es capaz el usuario de distinguir los contenidos de calidad de los banales o incluso falsos? Efectivamente. Reino Unido y Estados Unidos). comprendiendo un amplio rango de edades (de 15 a 57 años).ya había superado un punto de no retorno en los usuarios. Conscientes de ello.348 usuarios para conocer las percepciones que los estudiantes tenían de los recursos bibliotecarios y de información. Nótese que este fenómeno ya ocurría nada más y nada menos que en mayo-junio de 2005. El principal objetivo del estudio era pues el de conocer el impacto de la transición digital en el comportamiento informacional de la llamada Generación Google y guiar a los servicios bibliotecarios para que éstos pudieran anticiparse y reaccionar de forma más efectiva ante los cambios emergentes en el comportamiento de los usuarios. 2008). transformando de ese modo los hábitos de consumo de información. India. 396 eran estudiantes en activo (tanto de grado como de posgrado) de seis zonas geográficas diferentes (Australia. los autores indican que. el efecto de Google (buscador general o académico) va mucho más allá de un cambio de la herramienta usada como punto de partida de las búsquedas.

. los datos mostraban diferencias importantes en función de las distintas disciplinas académicas. realizada entre 2009 y 2011. En paralelo. Por ejemplo. Del total de la muestra analizada. mientras que las bases de datos bibliométricas e interfaces de búsqueda de revistas electrónicas eran más populares en los campos de la Biología y Ciencias biomédicas (el efecto de la cobertura de Google Scholar en las disciplinas se detallará en capítulos posteriores). los usuarios ven modificadas sus estructuras y rutinas de pensamiento al ser expuestos de una manera inmersiva (tanto a nivel profesional como personal) al funcionamiento de los motores de búsqueda. de no revertirse. 2011). 2012). abarca las fechas de nacimiento entre 1980 y comienzos de la década de 2000 aproximadamente. Endnote y Mendeley). unos 17. Sin embargo.000 estudiantes respondieron al menos a un informe anual. Este estudio comprende sin embargo solamente a los nacidos entre 1982 y 1994. pues habrían simplificado sus procesos y tareas de investigación durante sus estudios. participaron hasta 72 instituciones de educación superior a través de la promoción y difusión de un cuestionario entre sus alumnos de doctorado. la British Library y el JISC financian un nuevo proyecto de investigación de tres años de duración (Carpenter. Los resultados generales obtenidos en los estudios mencionados anteriormente (uso predominante de los motores de búsqueda. Ciencias Sociales (cerca del 40%) e Ingeniería e Informática (más del 40%). puede llevarnos a una preocupante superficialidad intelectual (Carr. Si estos datos no fueran ya suficientemente reveladores por sí mismos. siendo especialmente usado en Artes y Humanidades (con apenas el 13% de los usuarios) y Ciencias sociales (10%). En la investigación. situación que. se podría añadir que una amplia mayoría de estudiantes indicaron que hubieran deseado haber conocido antes ciertas tecnologías y aplicaciones (especialmente Google Scholar. los recursos de Google eran preferidos especialmente en Artes y Humanidades (cerca del 30%).52 La revolución Google Scholar el estudio y profundidad de lectura y pensamiento crítico. centrándose en esta ocasión en el comportamiento en la búsqueda de información e investigación de los estudiantes de doctorado pertenecientes a la Generación Y 11. El catálogo de la biblioteca constituía uno de los recursos menos requeridos. Debido a un efecto de neuroplasticidad. espe 11 También conocida como la generación del milenio. el 30% de los estudiantes utilizaba Google o Google Scholar como fuente principal para localizar literatura científica. no se consideran “nativos digitales”. Por tanto. se reclutaron 60 estudiantes de 36 instituciones con los que se realizó un estudio cualitativo longitudinal. Con la intención de complementar los resultados obtenidos en este primer informe acerca de la Generación Google.

038 alumnos distribuidos entre estudiantes de grado (26%). igualmente. en ese orden. el catálogo de la biblioteca. guías temáticas. Tutorial de Infoquest.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) cialmente Google. el 75% había utilizado Google Scholar. ayuda específica de un bibliotecario. este porcentaje ascendía al 20. se puede destacar el trabajo de Mussell y Croft (2013). Wikipedia. Summon (herramienta de descubrimiento). 53 .6% en el caso de Summon y al 39. y “otras”. tal y como señalan el 42% de los encuestados (22% indican Google Scholar y el 20% Google general). Dubicki (2010) examina por su parte los hábitos de investigación de los estudiantes de grado y posgrado en el área de Negocios hallando que Google era el punto de inicio en las búsquedas de al menos el 50% de los estudiantes. Por ejemplo.988 estudiantes de posgrado en la University of Minnesota en 2009. facilidad de uso. Cothran (2011) analiza por otro lado en qué medida los estudiantes graduados perciben Google Scholar como un recurso útil y fácil de utilizar. Tal vez.141 (11. El 14.1% de los estudiantes indicó que no usaba Google Scholar. la encuesta LibQual+ 2009 (Cook et al. quienes estudian los hábitos de investigación de los estudiantes de la Royal Roads University a partir de una encuesta a 1. más del 76% son propensos a usar Google. la percepción de Summon se encontraba fuertemente 12 Los usuarios disponían de las siguientes fuentes para evaluar: Google. seguido de Google Scholar. los hallazgos más interesantes de este estudio se reflejen en las contestaciones proporcionadas ante la pregunta “Cuán útiles eran los resultados que encontraste en la búsqueda más reciente a través de las siguientes fuentes” 12. Bagget y Williams (2011) realizan igualmente una encuesta en este caso a 58 estudiantes de la Shenandoah University. más del 25% de éstos nunca usaba las bases de datos bibliotecarias. entre los estudiantes en detrimento de los productos bibliotecarios. Finalmente.4%) estudiantes que finalmente contestan el cuestionario. Para ello realizan una encuesta a 9. bases de datos de editores (por ejemplo. EBSCOhost). Google Scholar.7% en el caso del catálogo de la biblioteca. Nuevamente Google demuestra ser el lugar favorito para comenzar una búsqueda. 2009) concluye que los estudiantes norteamericanos utilizan los motores de búsqueda a diario. el análisis estadístico revela utilidad percibida. lealtad y. en menor medida. De los 1. especialmente el catálogo de la biblioteca) han sido posteriormente comprobados y ratificados en multitud de trabajos. En todo caso. las bases de datos de artículos y Wikipedia. Las bases de datos bibliotecarias logran un porcentaje alto (26%) pero inferior a Google si combinamos los porcentajes de sus dos buscadores (general y académico). Los resultados obtenidos revelan que cuando los estudiantes comienzan la búsqueda de información. el catálogo. posgrado (62%) y otros estudiantes que continúan estudios (12%).

Sin embargo. los datos empíricos que aportamos en este apartado vienen a demostrar todo lo contrario. Ciencias de los sistemas de información y decisión. Y este argumento sería completamente lógico. al menos desde un punto de vista teórico. Haglung y Olsson (2008) realizan un estudio observacional de los investigadores en Suecia de 2005 a 2006. La mayoría de los investigadores utilizan sólo ocasionalmente la página web de la biblioteca como punto de partida en sus búsquedas. Aunque en el momento del estudio Google Scholar es apenas conocido por los investigadores analizados.4% de los alumnos). estos datos serían menores. tenderían a utilizar otras herramientas más precisas y controladas.54 La revolución Google Scholar polarizada (el 39. según avanzamos en rangos de edad y nivel educativo. de una posible extensión del sistema académico a través del uso de reposito- . 2013). N= 755). En otro estudio similar. uno podría estar tentado a pensar que el uso de estas herramientas estaba más extendido entre los jóvenes y que.1%. posdoctorales y senior. mientras que Google Scholar era marcada en esta misma categoría por el 35. Como dato de interés. adicionalmente se detecta un amplio uso de marcadores de páginas web en el navegador para acceder con mayor rapidez a los recursos o lugares de interés. El propósito de la encuesta era conocer la utilidad. Inglés. traspasando asimismo generaciones (Mussell y Croft. Ingeniería eléctrica y computación.4% de los estudiantes encuestados la marcaba como esencial. Matemáticas. Filosofía y Ciencias políticas). Es decir. que los investigadores predoctorales. La preferencia de los motores de búsqueda sobre los recursos bibliotecarios se extiende desde los estudiantes a los estudiantes de posgrado. el recurso considerado “esencial” para un mayor porcentaje de alumnos era las bases de datos de los editores (64. el buscador general de Google domina como punto de partida a la hora de localizar información científica. teóricamente más formados en el manejo de herramientas profesionales de búsqueda (imprescindibles para su trabajo) y con una mayor madurez intelectual y capacidad adquisitiva. Historia. en función de las necesidades de los investigadores. Lercher (2008) realiza una encuesta dirigida a los profesores de ocho departamentos en Louisiana State University (concretamente los de Química. Los investigadores lo usan tanto para buscar información metodológica como para localizar números de ISSN. ¿Qué piensan los investigadores? Según los estudios vistos anteriormente acerca de la Generación Google y su confianza excesiva en los motores de búsqueda.

Se debe reconocer no obstante que no existe una coincidencia plena en todos los estudios realizados hasta la fecha (algunos resultados son incluso contradictorios). Las principales diferencias 13 http://www.6%) seguida de Pubmed (21.csuc. No obstante. el 86% indica que utilizan los motores de búsqueda para localizar trabajos no publicados (unpublished) en sus campos de especialidad. el resultado quizás más interesante se produce cuando el 67% de los profesores indican que enviarían un trabajo a una colección web (se entiende dentro del repositorio) si el trabajo se pudiera encontrar así de forma más sencilla a través de Google Scholar. pero sí se comienza a percibir que para muchos investigadores los motores de búsqueda académicos han comenzado a “suplantar” a las bases de datos tradicionales. Consorci de Serveis Universitaris de Catalunya) 13. profesores e investigadores) acerca de las preferencias de éstos en el uso de bases de datos. la muestra de este estudio es muy pequeña y desigual. solamente con el 36%). integrado actualmente en el CSUC (Consorcio de Servicios Universitarios de Cataluña. Ollé y Borrego (2010) consideran una muestra algo más amplia. Los autores obtienen 137 respuestas a su cuestionario (datos de 2007). El 83% de los investigadores había usado Google Scholar mientras que un 13% adicional mostraba una intención en probarlo. donde se refleja que tanto Google como Google Scholar son explícitamente citados por casi una cuarta parte de los encuestados a pesar de que en el cuestionario no se menciona explícitamente a ninguna base de datos o motor de búsqueda concreto. Hightower y Caldwell (2010) realizan una encuesta a 220 miembros de la University of California – Santa Cruz (principalmente estudiantes de posgrado. la base de datos preferida era WoS (seleccionada por el 41. por lo que los resultados deben considerarse con cierta cautela. Sin embargo. el 90% indican que utilizarían Google Scholar en la búsqueda de material académico o científico.5%) y Google Scholar (18.cat 55 . con académicos pertenecientes a diversas instituciones. Aun así.7%). gracias en parte a la velocidad y relevancia de los resultados que proporcionan. Su objetivo principal no es el análisis de Google Scholar sino el estudio cualitativo del impacto de las revistas electrónicas en el comportamiento informacional de los investigadores de las universidades que pertenecen al Consorcio de Bibliotecas Universitarias de Cataluña (Consorci de Biblioteques Universitàries de Catalunya). De las 72 respuestas obtenidas (de un censo de 347 profesores). los datos por departamento no son representativos (la tasa más alta de respuesta por departamento corresponde a Filosofía.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) rios. Adicionalmente.

Si nos transportamos desde el Reino Unido hacia los Estados Unidos. Por ejemplo. Y prácticamente el 70% de los usuarios no usan “nunca” los repositorios institucionales. De los 2. En cualquier caso. Google es utilizado “frecuentemente” por el 65% de los investigadores encuestados. también se disponen de estudios más amplios con un mayor número de instituciones analizadas y en diferentes países.519 artículos considerados. mientras que Google Scholar por el 40%.025 profesores tanto en colegios como en universidades. Manejando datos empíricos de 2. Google Scholar.250 investigadores y 300 bibliotecarios. Todavía resultan más impactantes los datos acerca de las fuentes utilizadas específicamente para localizar contenidos en acceso abierto. El uso de fuentes específicas de acceso a material en Open Access fue igualmente estudiado por Norris. destacando levemente en Economía. Google y Google Scholar eran capaces de localizar el 76. 2010). mientras que los resultados de OpenDOAR y OAIster eran desalentadores. Ciencias sociales y Humanidades han abandonado las . resulta obligado mencionar el Informe Ithaka 2009 (Schonfeld y Housewright. los autores observan que tanto Google como Google Scholar son herramientas frecuentemente utilizadas por los investigadores (61% y 35% respectivamente). y al igual que Lercher (2008).84% de éstas. el tamaño muestral es excesivamente reducido y centrado en instituciones concretas. Economía y Sociología.56 La revolución Google Scholar detectadas por los investigadores radicaban en las razones detrás de las preferencias. Afortunadamente. Windows Live Academic (versión anterior de Microsoft Academic Search) no es usado “frecuentemente” por ningún investigador (más del 90% no lo utiliza “nunca”). El estudio concluye que los investigadores de Ciencias. hasta 967 disponían de versiones en acceso abierto. aquellos que preferían WoS se sentían más confiados acerca de la calidad de los resultados. OAIster y OpenDOAR) a la hora de localizar versiones en acceso abierto de artículos científicos (peer-reviewed) en las áreas de Ecología. Oppenheim y Rowland (2008) quienes se proponen demostrar el grado de efectividad de diversas herramientas (Google. en el que se encuestaron a 3. Mientras que Google Scholar era elegida principalmente por su facilidad de uso y rapidez. es necesario disponer de muestras mayores para analizar este fenómeno con mayor precisión. Brown y Swan (2007) llevan a cabo un estudio financiado conjuntamente por la Research Information Network (RIN) y el Consortium of University Research Libraries (CURL) con el objetivo de conocer la forma en la que los investigadores interactúan con las bibliotecas académicas en el Reino Unido.

498 científicos británicos. los datos varían por disciplina. excepto en Medicina. En cualquier caso. están fuertemente influidos por la distinta cobertura de Google Scholar en las distintas áreas. y que tanto Google como Google Scholar se encuentran entre los métodos preferidos para localizar información en las revistas académicas. tema que se detallará y desarrollará con mayor amplitud en el apartado 1.4. En Artes y Humanidades el uso de las bases de datos específicas se reduce y aumenta el uso de los catálogos. En agosto de 2014 la revista Nature publica los resultados de una encuesta realizada con el fin de conocer el conocimiento. 2015). Con todo. Academia. mientras que un porcentaje menor (en torno al 15%) indica que comienzan sus búsquedas mediante el catálogo de la biblioteca o alguna base de datos o catálogo nacional o internacional. seguido de los motores de búsqueda (en torno al 25%). 2010). Si bien es cierto que estos porcentajes. Esta tendencia todavía se acentúa más con la aparición de redes sociales académicas (ResearchGate.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) instalaciones bibliotecarias y los recursos de búsqueda tradicionales (catálogos y bases de datos) para utilizar motores de búsqueda. que constituyen e integran el llamado movimiento de las Altmetrics (Priem y Hemminger. parece demostrada la tendencia creciente hacia el uso de motores de búsqueda en detrimento de los productos bibliotecarios. como ya se ha comentado anteriormente. cobertura que ha ido evolucionando a lo largo de los años. manejando en esta ocasión una muestra de 3. no sólo entre los estudiantes sino también entre los profesores e investigadores. sólo el 2% de los profesores manifiestan que comienzan la búsqueda mediante una visita física a las instalaciones de la biblioteca. En Medicina el uso de las bases de datos específicas es mayor (40%). Un tercio de los encuestados indica que comienzan la búsqueda en una base de datos o recurso electrónico específico. Por lo tanto. Si en el Informe Ithaka 2009 el descubrimiento de contenidos a través de Google y Google Scholar ocupaba el tercer lugar cuando se les preguntaba a los usuarios con qué frecuencia utilizaban diferentes métodos para localizar información en revistas científicas. En noviembre de 2012 se tomaron datos para la elaboración de una nueva edición de esta encuesta (Housewright et al. uso y visitas a 57 . 2013). los motores de búsqueda constituyen el recurso más utilizado en todas las áreas. en esta nueva edición hasta el 40% indican que comienzan sus procesos de investigación a través de un motor de búsqueda de propósito general.edu) productos bibliográficos plenamente adaptados al mundo web (Mendeley) o el uso de otros canales sociales para difundir y consumir contenidos académicos o de apoyo a la investigación (Mas-Bleda y Aguillo.

cubriendo todas las regiones del mundo y todos los sectores profesionales. utilizado regularmente por cerca del 50%). sino que predomina respecto a otros motores de búsqueda académicos: el 80% de los encuestados ni siquiera conoce Microsoft Academic Search. Estos autores se proponen comprender cómo los lectores (en sentido amplio. para lo que usan preferentemente los sistemas de alertas o la navegación por la propia página web de la publicación. Google Scholar no sólo predomina respecto a los productos bibliotecarios más tradicionales o respecto a las plataformas sociales orientadas a la Academia. por lo que estos datos resultan lógicos en cierta medida. señalan igualmente que los usuarios encuentran información de una forma mucho más sencilla a través de Google que a través de las propias páginas web de las universidades. 2014). Este factor asciende al 70% en Ciencias sociales. los motores de búsqueda académicos son el segundo recurso más popular como punto de partida de la búsqueda (solamente superados por las bases de datos bibliográficas especializadas). como los E-Expectations research reports 14. los autores observan que los motores de búsqueda son considerados con una menor importancia cuando los lectores desean descubrir artículos más recientes. Arte y Humanidades (n=480). Como aspecto digno de ser mencionado. 2014). Para ello realizan una amplia encuesta a lectores (n=19.000) conoce y visita regularmente Google Scholar (sólo se le acerca en uso ResearchGate. favorece ligeramente a los artículos más antiguos. Aunque los datos específicos acerca del procedimiento seguido en esta encuesta no se dan a conocer.58 La revolución Google Scholar diversas plataformas y sitios de redes sociales por parte de los investigadores (Van Noorden. Probablemente Gardner e Inger (2013) son los que han realizado el estudio más amplio hasta la fecha. Estudios más recientes. aunque este aspecto será tratado en capítulos posteriores. Las conclusiones del estudio vienen a reflejar que cuando los lectores buscan contenidos. Esto constituye un verdadero inconveniente para la utilización y visibilidad de los propios repositorios insti 14 http://omniupdate.064) entre mayo y julio de 2012. El ranking de relevancia de Google Scholar (basado principalmente en el número de citas). se estima que en el área de Ciencia e Ingeniería aproximadamente el 60% de los encuestados (n=3. acceden y navegan por el contenido de las revistas científicas. especialmente los investigadores (50% de los encuestados) y estudiantes (20%).html . tanto estudiantes como investigadores o profesionales) descubren.com/resources/research. pretendidamente su máxima competencia en la tecnología de los motores de búsqueda académicos (Orduña-Malea et al.

así como su potencial como servicio de valor añadido a los recursos que la biblioteca ofrece (Hartman y Mullen. Muchos de ellos comienzan a evaluar la utilidad de este nuevo buscador. 2008). En 2005 sólo el 24% de las instituciones (27) listaban a Google Scholar en los índices alfabéticos de bases de datos y en el 14% de los listados de bases de datos organizados por materia. revelando que la aceptación e integración del buscador como recurso en las páginas web de las bibliotecas pertenecientes a la ARL había crecido.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) tucionales pues. basándose tanto en los estudios empíricos mostrados en los apartados anteriores como en su propia experiencia diaria. 2012). un auténtico jarro de agua fría al producto que realmente está proporcionando los contenidos al motor de búsqueda. En 2007 estos porcentajes habían ascendido al 68% y 32% respectivamente. si no se realizan los ajustes oportunos. que estudiantes y profesores están empezando a emplear masivamente los motores de búsqueda. Hartman y Mullen (2008) realizan un amplio y detallado estudio para conocer la presencia del buscador como recurso de información entre los productos de las bibliotecas. en este caso tomando como muestra las sedes web de las 113 instituciones pertenecientes a la Association of Research Libraries (ARL). aunque los usuarios acaben accediendo a un documento alojado en un repositorio. ¿Qué piensan los profesionales de la información? Tras la aparición en escena de Google Scholar muchos bibliotecarios comienzan a informar. la visita directa desde Google Scholar al texto completo alojado en un repositorio institucional puede no reflejarse en las estadísticas de visitas del repositorio (Arlitsch y O´Brian. ¿debe estar plenamente integrado entre las colecciones y servicios a través de su presencia en la web de la biblioteca? Con el propósito de conocer precisamente el grado de integración de Google Scholar como recurso en las bibliotecas. El gran reto en esos momentos para las bibliotecas académicas es planificar qué hacer con este nuevo producto gratuito. 2005). cuantificando si Google Scholar aparece enlazado desde la página de inicio del OPAC (Online Public Access Catalog) o en diversos listados de bases de datos y guías temáticas. la sospecha a que Google Scholar pueda reemplazar a corto plazo a otras herramientas de búsqueda más establecidas (y caras) existe entre el colectivo de profesionales de la información (Giles. De hecho. Las autoras realizan el estudio en dos momentos temporales (2005 y 2007) y comparan los resultados. éstos no han iniciado la búsqueda desde la página web del repositorio. 59 .

pero de una forma muy cautelosa. distinguiendo por una parte las sedes web institucionales y por otra las bibliotecarias. donde un mensaje del tipo “Scholar está bien. . desde donde se enlaza a Google Scholar con mayor frecuencia. El término en ingles suele variar. desde estudiantes jóvenes a investigadores senior. aunque el sentido es el mismo. “Trying to come to terms with the new 800-pound dragon in their living room” (York. 2005). se trata de una expresión metafórica que hace referencia a un problema obvio que nadie quiere afrontar.60 La revolución Google Scholar En un estudio similar. Primero Internet y posteriormente la Web (junto con el desarrollo de los motores de búsqueda gratuitos) habían provocado que la inmensa mayoría del conocimiento residiera por primera vez en la historia fuera de la biblioteca física (Blankenship. sin previo aviso. 256 Master’s institutions. que nadie espera 15 Cfr. 2005). usándose en ocasiones “elefante” o “gorila”. Sin embargo. Neuhaus y Asher (2008) analizan el grado de adopción de Google Scholar en instituciones y centros universitarios (en concreto. Era absolutamente comprensible que la irrupción en el mercado de un producto de las características de Google Scholar supusiera un importante reto y una gran preocupación en el sector bibliotecario. el miedo a que los usuarios se acercaran a Google Scholar y se alejaran de la biblioteca ya se respiraba en el ambiente. identificándose por un lado a los “puristas” (aquellos que deseaban proteger a los usuarios de contenidos no estrictamente académicos) y. Los autores comprueban que las instituciones de investigación enlazan con mayor frecuencia a Google Scholar que las instituciones de menor tamaño. Neuhaus. 2007). La posición además de los bibliotecarios respecto al uso de Google Scholar se polarizó muy rápidamente (York. Quizás una de las principales reticencias del sector bibliotecario proviniera del hecho de que las bibliotecas nunca habían formado parte del desarrollo de Google Scholar (Walters. a los que sí introducían el producto a los usuarios. hecho que explicaba la utilización masiva de los buscadores por un amplio abanico de usuarios. 2009). un total de 948 universidades y colleges. 2005). por otro lado. y no las bibliotecarias. 267 Baccalaureate institutions y 293 Associates institutions) a partir de un análisis webmétrico para determinar el número de sitios web desde los que se enlaza a Google Scholar (a fecha de 2007). York utiliza muy acertadamente el término “intentando manejarse con un elefante en la habitación” 15. pero inesperadamente encuentran que son las sedes web de las facultades y de los estudiantes. Un producto que llegó al mercado de las búsquedas de súbito. 132 Research institutions. pero todavía nos necesitas a nosotros y a nuestras bases de datos exhaustivas” comenzaba a hacerse pervasivo en la mayoría de guías bibliotecarias (York.

2015). pero no para la amplísima mayoría de usuarios (Google Scholar no es un producto orientado a los profesionales de las búsquedas sino a los usuarios finales). se percibe por tanto como un desarrollo ajeno e invasivo al sector de la información. y que. tras realizar una búsqueda básica 16. Google Scholar no participó en el NISO Open Discovery Initiative). Este sentir se refleja en el informe “The future of library resource discovery” (Breeding. Aparte de la razonada crítica relativa al grado de academicidad de los contenidos (debido al filtro automático desarrollado por Google). no se tenía una idea clara de los requisitos técnicos que se debían cumplir para poder incluir nuevos contenidos. Y para más inri. sostiene que más que lamentarnos del uso de herramientas como Google Scholar (con sus virtudes e inconvenientes. A esto nos debemos preguntar lo siguiente: ¿ilógico para quién? Probablemente sea ilógico para un bibliotecario. existía cierta incomprensión en torno a un producto del que no se conocía su cobertura. pero con una penetración mundial imparable). los artículos de 1990 son listados primero. y lista los artículos en función de lo relevantes y populares que son”. Por ejemplo. y no los artículos más recientes”. en el que se confiesa que las bibliotecas tienen muy poca influencia en Google Scholar en comparación con los servicios de descubrimiento que producen las empresas del sector (por ejemplo. por si esto fuera poco. ni siquiera habían sido consultados como expertos. Una definición que no es del todo precisa (el algoritmo PageRank en ningún caso decide qué es o no académico). de forma acertada. que precisa controlar o filtrar la ordenación de resultados. Ettinger (2008). que podía provocar comprensibles dificultades a los usuarios para determinar si los resultados eran o no académicos. las bibliotecas deben pensar ineludiblemente en formas de asimilarlo estra 16 “common cold” and “vitamin c” 61 . Los autores clarifican posteriormente este conflictivo punto al lector: “el algoritmo PageRank hace una conjetura calculada acerca de lo que él cree que es académico. elaborado por la National Information Standards Organization (NISO). indican que “ilógicamente. un producto en el que los profesionales de la información no habían sido tenidos en cuenta para su diseño. A esto debe unirse un cierto desconocimiento inicial acerca del funcionamiento real del buscador. Giustini y Barsky (2005). y que ilustra a la perfección las dudas e intensos debates que surgen a mediados de la primera década del 2000 entre los profesionales de la información.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) ba. utilizaba un sistema de ordenación de resultados diferente cuyo funcionamiento era secreto. una caja negra.

62

La revolución Google Scholar

tégicamente. Hartman y Bowering Mullen (2008), conscientes de que
Google Scholar supone un lugar familiar en el que comenzar los procesos
de búsqueda de información ya difícilmente sustituible, resaltan la habilidad de éste para conectar a los usuarios afiliados a una biblioteca con
los contenidos disponibles por las suscripciones a través del servicio de
link resolvers 17, circunstancia igualmente señalada por Giustini y Barsky
(2005), quienes muestran a Google Scholar como una pasarela gratuita
hacia información científica para los usuarios no afiliados a una universidad u hospital, o que simplemente realizan sus búsquedas fuera de los
dominios de estas instituciones (pensemos igualmente en los estudiantes que puedan realizar búsquedas desde su hogar).
La tecnología del link resolver ofrece adicionalmente la posibilidad
de cuantificar el número de usuarios que llegan a la biblioteca a través
de enlaces desde Google Scholar y conocer por tanto el tráfico que éste
está proporcionando o redirigiendo a los contenidos contratados por
las bibliotecas (Detlor y Lewis, 2006), aunque los productos y bases de
datos bibliotecarias no hayan sido utilizados para localizar y acceder a
estos contenidos. Esta circunstancia permite a Herrera (2011) conocer
el número de clics (a través del link resolver de Google Scholar) que habían terminado en visitas web a los contenidos alojados en la University
of Mississipi Library. Para ello realiza un análisis longitudinal (de 2006 a
2009) constatando un crecimiento del porcentaje de clics procedentes
de Google Scholar desde el 4% en 2006 hasta el 27% en 2009. Así mismo
observa un crecimiento del porcentaje de clics procedentes de la Web of
Knowledge (del 2% al 11%).
El producto que más porcentaje de visitas proporcionaba a la biblioteca (EBSCO) no había cambiado durante el período de análisis, aunque
el porcentaje de visitas que proporcionaba sí había bajado considerablemente (del 61% al 52%). Otro resultado importante de esta investigación
es que se observaban más clics desde Google Scholar a los recursos bibliotecarios (10.522), que desde los usuarios del sitio web de la biblioteca
a Google Scholar (801). Estos apabullantes datos tal vez contesten por sí
mismos a las dudas iniciales de los bibliotecarios acerca de la posible
integración de Google Scholar entre las colecciones y servicios de la bi 17 Link resolver (o link-server): es una aplicación que permite conectar de forma especial la
fuente y el destino de un hipervínculo. En este caso, la fuente tiene la forma de un OpenURL (enlace estandarizado que contiene información bibliográfica). Cuando un usuario
hace click en el enlace, la aplicación comprueba, basándose en la información bibliográfica del OpenURL, si la biblioteca de una determinada institución ha adquirido o suscrito
el acceso al texto completo del recurso solicitado. Si es así, lo recupera si el usuario es
capaz de autenticarse como miembro de dicha institución.

Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I)

blioteca a través de su página web. Nos guste o no, esta cuestión resulta
hoy en día indiferente a los usuarios; éstos encuentran Google Scholar
con cierta facilidad (esté o no enlazada desde el sitio web de la biblioteca) y comienzan sus búsquedas desde su austera pero sencilla y efectiva
página de inicio.
Posteriormente, Wang y Howard (2012) analizan los datos de uso de
Google Scholar desde 2006 a 2011 desde tres herramientas (SFX link resolver, Web Access Management proxy server y ILLiad interlibrary loan server)
de la San Francisco State University. Los datos indican una preferencia de
Google Scholar respecto a la herramienta de búsqueda federada de la
universidad (Metalib), convirtiéndose en una importante fuente de solicitud de préstamos interbibliotecarios.

b) Estudios comparativos con otros productos bibliotecarios

Entre los estudios dedicados a Google Scholar en su faceta de buscador destacan por una parte aquellos orientados a la comparación con las
tradicionales bases de datos bibliográficas y, por otra parte, a su comparación con otros productos más modernos, como son las herramientas
de descubrimiento.
Bases de datos bibliográficas
La literatura pronto comprueba el efecto de dos importantes variables externas a la hora de realizar comparaciones entre Google Scholar y
otras bases de datos bibliográficas:
—— La disciplina y área de conocimiento: los distintos acuerdos con editoriales o el cumplimiento de ciertos requisitos técnicos en las sedes
web de éstas influyen en los contenidos que finalmente son indizados. Y esto a su vez influye en la precisión y amplitud de los resultados ante consultas determinadas.
—— El tipo de consulta: la precisión del buscador varía significativamente
de consultas con términos generales y amplios a consultas con términos concretos y específicos.
Veamos con mayor detalle cada uno de estos enfoques:
Tipo de consulta:
Dado el carácter multidisciplinar de Google Scholar (aunque su cobertura fuera muy desigual en sus inicios), muchos profesionales se planteaban la necesidad de evaluar las prestaciones de Google Scholar a la
hora de localizar información relevante en una disciplina y comparar los

63

64

La revolución Google Scholar

resultados con los ofrecidos por distintas bases de datos bibliográficas
especializadas, que eran entonces tradicionalmente adquiridas bajo licencia por las bibliotecas universitarias y de centros de investigación.
Obviamente, los resultados obtenidos eran diferentes en cada disciplina
(lo que se traducía en mensajes contradictorios a la comunidad respecto
a las prestaciones y cobertura del buscador), pero todas incidían en la
facilidad de uso, gratuidad y amplia cobertura general.
Por ejemplo, Cutler (2010), compara los resultados de búsqueda de la
Energy Technology Data Exchange – World Energy Base (ETDEWEB) con Google y Google Scholar con el propósito de determinar si ésta todavía era capaz de proporcionar resultados únicos no contenidos en los buscadores
web. Los resultados muestran que ETDEWEB proporciona resultados únicos en el 86.7% de las 15 consultas realizadas en el ensayo. Sin embargo,
más allá de este resultado, el autor descubre diferencias en la tipología
y enfoque de los resultados obtenidos: Google proporciona resultados
para no especialistas; Google Scholar por su parte proporciona resultados académicos, pero de propósito más general, mientras que ETDEWEB
proporciona resultados específicos en Energía, Tecnología y Desarrollo.
Con ello, Cutler concluye que Google y Google Scholar aportan o añaden
valor en el proceso de descubrimiento de literatura en tecnología.
Es probable que este hecho convirtiera a Google Scholar más eficiente
en áreas con mecanismos de comunicación científica diferentes a los tradicionales, como por ejemplo las ingenierías, en las que el uso de Google
Scholar estaba creciendo, como ya indicaba el informe Ithaka 2009 (Housewright et al, 2013). Meier y Conkling (2008) comparan Google Scholar y
Compendex en ocho áreas de la ingeniería, concluyendo que el buscador
académico es una herramienta útil tanto para localizar literatura en esta
disciplina (especialmente por su cobertura en los últimos 10-15 años)
como para servir de punto de partida en los proyectos de investigación
de los estudiantes. Sin embargo, Cusker (2013), quien también compara
Google Scholar y Compendex, pone de relieve las grandes prestaciones de
esta última respecto a Scholar, especialmente a la hora de reordenar artículos por fecha de publicación, autor y relevancia. Igualmente reclama
que el buscador ofrece un número de resultados relevantes realmente
amplio, pero que no ofrece en cambio medios suficientes para organizarlos y combinarlos de manera eficiente y útil. A pesar de todo, el autor
se decanta, como balance final entre ambas bases de datos, por Google
Scholar, pues ofrece sus limitadas prestaciones, ciertamente inferiores,
de forma gratuita.

Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I)

Más recientemente, Stirbu et al (2015) se centran en el área de la
Geografía, comparando los posibles beneficios de Google Scholar frente
a tres bases de datos (WoS, FRANCIS y GeoRef), pero poniendo el énfasis
en la evaluación de los resultados obtenidos y no tanto en las prestaciones de las bases de datos. Para ello, aplican búsquedas bibliográficas
idénticas a todas las bases de datos analizadas restringiendo los resultados a la literatura más reciente (2005 a 2009). Google Scholar muestra un
amplio grado de solapamiento con el resto de las bases de datos, pero
ofrece además un importante número de resultados únicos (independientes del año de publicación, campo o palabra clave buscada). Aunque
el resto de productos permiten localizar ciertamente información más
especializada, los autores indican la utilidad de Google Scholar a la hora
de localizar distintos tipos de literatura relacionada con la Geografía humana y física.
Esta complementariedad y capacidad de localizar información útil no
recogida en otros productos es igualmente recogida por Tober (2011),
quien compara Pubmed/MEDLINE con ScienceDirect, Scopus y Google Scholar para evaluar qué producto es más efectivo en el área de medicina
láser, mediante la aplicación de una serie de criterios de evaluación
(recuperación, precisión e importancia). Mientras que Pubmed aparece
como el producto más excepcional, Scopus destaca en efectividad y Google Scholar en importancia.
Tipo de consulta:
Los estudios anteriores confirman a Google Scholar como un producto con una cobertura amplia y complementaria a las bases de datos
bibliográficas especializadas, aunque de comportamiento desigual en
función de la disciplina estudiada. Sin embargo, independientemente
del área de conocimiento, el tipo de consulta efectuada en el buscador
es vital a la hora de valorar los resultados. Una cuestión es realizar consultas generales y amplias con el objetivo de localizar artículos y material
académico de calidad acerca de una disciplina y otra bien distinta localizar material específico y especializado a partir de consultas concretas y
búsquedas sistemáticas. Y en este sentido, los resultados obtenidos son
ciertamente contradictorios.
Por ejemplo, Callicott y Vaughn (2005) confeccionan cinco búsquedas
con las que pretenden reflejar temas típicos de estudiantes universitarios en sus trabajos de investigación. Cada una de las búsquedas son
posteriormente aplicadas a los siguientes buscadores: Google Scholar,

65

66

La revolución Google Scholar

el catálogo en línea del College of Charleston, EBSCO’s Academic Search
Premier, y a una base de datos suscrita con acceso a diversos recursos
(MLA International Bibliography, Business Source Premier, Environmental
and pollution management, Art full text, y America: History and Life). Los
resultados de las búsquedas realizadas en Google Scholar resultaban, en
la mayoría de las ocasiones, mejores en comparación con el resto tanto en cantidad como en calidad de los resultados, aunque los autores
constatan diferencias importantes en función de cada una de las cinco
búsquedas analizadas.
Gardner y Eng (2005) comparan los resultados ante una consulta sobre el tema “homeschooling”, tanto en Google Scholar como por PsycINFO, Social Science Citation Index y ERIC; las bases de datos se comparan
en función del contenido, actualización, relevancia y solapamiento de
los resultados. Los autores confirman que Google Scholar es el producto
que mayor número de resultados proporciona, así como en una mayor
variedad de tipologías, fuentes y relevancia, aunque se observa una menor actualización de los resultados. El estudio concluye que la carencia
de control de calidad y la imposibilidad de dejar al usuario organizar los
resultados lo hacen menos efectivo que las bases de datos de pago a la
hora de encontrar material académico en ciencias sociales.
Cambiando de disciplina, Jones (2005) se propone testar las capacidades de diversos buscadores a la hora de recuperar información en Biología; para ello utiliza el término “Nodilittorina” 18 y observa que Google
Scholar recupera un mayor número de registros relevantes que a través
del resto de bases de datos de su análisis (BasicBIOSIS, ArticleFirst, ECO,
ProQuest, WilsonWeb, SciFinder Scholar, HighWire y MEDLINE). Sólo BIOSIS
previews obtiene una mayor tasa de recuperación en la búsqueda; así
mismo, Jones informa que la cobertura de literatura reciente en el buscador es impresionante, más allá de los criterios de ordenación y relevancia, demostrando así la fortaleza de Scholar en búsquedas específicas.
Por otra parte, Robinson y Wusteman (2007) diseñan ocho búsquedas con el propósito de examinar la relevancia de los 10 primeros resultados de búsqueda tanto en Google Scholar como en los buscadores
generales Google, Ask.com y Yahoo!; las ocho búsquedas se dividen en
cuatro consultas específicas sobre Ciencias de la vida y ambientales (denominadas consultas científicas) y en cuatro consultas generales (denominadas consultas no científicas) 19. Los resultados indican que Google
18 Género de molusco gasterópodo marino, de la familia de los caracoles.
19 La nomenclatura de consultas científicas y no científicas (scientific queries and nonscientific queries en el original), se consideran poco apropiadas y susceptibles de generar confusión, pero son los términos usados por los autores.

donde además puede suponer un riesgo que la interfaz de búsqueda simple y básica de Google pueda comenzar a modificar los patrones y procesos de búsqueda de información científica (Giustini. mientras que el solapamiento (registros en ambas bases de datos) es solamente del 10. una mejor disposición ante consultas sobre temas específicos por palabra clave. lo que la hace excesivamente dependiente del tipo de consulta realizada. Otro estudio de gran interés es el realizado por Levine-Clark y Kraus (2007). Sin embargo. Por ejemplo. los estudios anteriores vienen a confirman una amplia cobertura de Google Scholar y. Anders y Evans 67 .1%.9% están únicamente en CAS. Desde entonces las comparaciones entre Pubmed y Google Scholar han sido frecuentes en la literatura a la hora de valorar sus prestaciones para ser utilizados en consultas clínicas. Google Scholar carece de todas las prestaciones importantes de MEDLINE: no trabaja con las Medical Subject Headings (MeSH). Giustini (2005) concluye finalmente que. en términos generales. especialmente críticos en la medicina basada en la evidencia. en algunos casos contradictorios (por ejemplo en el caso del grado de actualización de los resultados). 2005). quienes comparan la cobertura de Google Scholar con Chemical Abstracs Service (CAS) ante seis búsquedas diferentes.76% de resultados relevantes) que para las generales (algo menos del 20% de resultados relevantes). CAS devuelve más resultados para compuestos químicos y búsquedas de nombres personales (gracias a la búsqueda avanzada). los autores hallan que el 55% están indizados únicamente en Scholar y el 34. aunque no para revisiones exhaustivas de literatura científica. De los 702 registros recuperados. constituye una herramienta de búsqueda útil para el descubrimiento de contenidos por navegación o serendipia. Los autores concluyen que Google Scholar devuelve más resultados para búsquedas de temas (gracias a que las búsquedas se hacen a texto completo). no permite la búsqueda booleana. a pesar de que Google Scholar no está especialmente diseñada para la búsqueda exhaustiva acerca de cuestiones clínicas. Pese a la amplia variedad de resultados. Esta excesiva dependencia de los resultados en función de las búsquedas específicas no es aceptable en áreas sensibles como la Medicina. carece de límites para las tipologías documentales y no permite beneficiarse de la extraordinaria indización que proporciona la National Library of Medicine. gracias a la indización del texto completo de los contenidos de las revistas y editoriales con las que ha llegado a algún tipo de acuerdo comercial.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) Scholar proporciona resultados más relevantes para las cuatro búsquedas específicas (38.

Estos términos se introducen tanto en Pubmed como en Google Scholar y se analizan los primeros 40 resultados (denominada consulta rápida) para comparar las prestaciones de relevancia y precisión de ambos buscadores. para guiar en el cuidado de pacientes individuales o en propósitos educacionales. Shariff et al (2013) contactan a través de una encuesta con un conjunto de nefrólogos canadienses. aunque la precisión es similar en ambos (8% para Google Scholar. haciendo de Google Scholar una mejor herramienta para consultas “rápidas”. Los resultados más controvertidos son probablemente los obtenidos por Gehanno. eficientes y útiles para informar sobre protocolos de cuidado de pacientes basados en la evidencia. El 67. aunque el porcentaje de recuperación de resultados es similar en ambos buscadores (Pubmed: 71%.6% de los artículos recuperados en Pubmed son considerados como “posiblemente” relevantes. evaluando posteriormente los resultados en función de la relevancia y calidad de éstos. Los investigadores participantes proporcionan posteriormente los términos de búsqueda que ellos introducirían en un recurso bibliográfico para recuperar estudios relevantes que permitieran resolver la consulta clínica que habían recibido. a cada investigador que acepta participar en el estudio se le proporciona una consulta clínica aleatoria centrada en terapia renal (obtenida previamente de una revisión sistemática). mientras que ese porcentaje asciende al 80% en el caso de Scholar. Los autores demuestran la importancia de Google Scholar en los procesos iniciales de búsqueda de literatura sobre cuestiones clínicas. Los resultados indican que Pubmed tiene una mejor precisión y parece superior a la hora de realizar búsquedas validadas.68 La revolución Google Scholar (2010) comparan los resultados sobre tres temas clínicos relacionados con cuidados respiratorios. 6% para Pubmed). y recomiendan finalmente su utilización siempre en combinación con Pubmed. La relevancia de los resultados es abordada igualmente por Nourbakhsh et al (2012). Los resultados indican que. quienes realizan un estudio con el . Google Scholar: 69%). Este hecho es debido presumiblemente a la influencia del número de citas recibidas en los criterios de ordenación de los resultados (unido al hecho de que Scholar proporciona un mayor número de citas totales recibidas). Google Scholar recupera el doble de artículos relevantes (22% frente al 11% de Pubmed) y proporciona un mayor número de artículos en acceso abierto que Pubmed (14% frente al 5%). Rollin y Darmoni (2013). quienes comparan los resultados obtenidos en Pubmed y Google Scholar a través de cuatro consultas basadas en cuestiones clínicas. usando para ello el filtro “clinical queries” en Pubmed y la búsqueda avanzada en Google Scholar.

y que son reconocidas internacionalmente con los más altos estándares salud basada en la evidencia. y posteriormente buscan cada estudio en Google Scholar para evaluar el porcentaje de trabajos que podrían haber sido identificados buscando únicamente en este buscador. Por tanto. 20 Las revisiones de Cochrane son revisiones sistemáticas de investigación primaria en salud y política sanitaria. El 80% de las referencias incluidas en las 21 revisiones sistemáticas se encontraban en Google Scholar (frente al 68% de Pubmed). Estas conclusiones son fuertemente criticadas por Giustini y Boulos (2013).000 resultados. el buscador podría convertirse en una base de datos bibliográfica líder en Medicina. Para ello recogen 29 revisiones sistemáticas publicadas en la Cochrane Database Systematic Reviews 20 y en JAMA (Journal of the American Medical Association) en 2009. sino de forma conjunta con Pubmed.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) firme propósito de evaluar la cobertura de Google Scholar específicamente en las revisiones sistemáticas sobre ensayos clínicos. Se investigan los efectos de intervenciones para la prevención.000 ítems). quienes identifican 21 revisiones sistemáticas en Biomedicina y estudian la recuperación teniendo en cuenta el límite impuesto por Google para la visualización (1. solo el 72% de las referencias incluidas podían realmente ser usadas al encontrarse listadas dentro de los primeros 1. Se publican online en la Biblioteca Cochrane: http://community. La importancia de la mayor o menor utilidad de Google Scholar como base de datos bibliográfica para la búsqueda de revisiones sistemáticas genera un importante debate que prosigue con el estudio de Bramer et al (2013). Los resultados reflejan una mayor cobertura de Google Scholar. por lo que Google Scholar no debería ser utilizada como fuente única en las búsquedas de revisiones sistemáticas. de algoritmo y de su estructura de la base de datos no la hacen idónea para estos fines. tratamiento y rehabilitación.org/cochrane-reviews 69 . dado que no es lo mismo buscar artículos para los que ya conoces su título (método utilizado por Gehanno). y ser usada en revisiones sistemáticas. quienes indican que Google Scholar no puede ser usada de forma única en revisiones sistemáticas pues los continuos cambios de contenido. para determinar si Google Scholar es suficientemente sensible para ser usado como buscador único. Los resultados muestran que los 738 estudios originales contenidos en las 29 revisiones sistemáticas eran localizables en Google Scholar. mejorando las opciones de búsqueda para incrementar la precisión. que descubrirlos en un proceso de revisión sistemática original. Sin embargo.cochrane. Igualmente evalúan la precisión de un test de diagnóstico para una condición dada en un grupo de pacientes específicos.

. Nygren y Widmarck (2007) comparan Google Scholar con Metalib (una herramienta de búsqueda federada que representa a más de 200 bases de datos) 21 21 Metalib es un metabuscador.70 La revolución Google Scholar Boeker. los autores identifican 14 revisiones sistemáticas de Cochrane y trasladan las estrategias de búsqueda a Google Scholar para medir la recuperación y precisión de éste en condiciones derivadas de procedimientos convencionales de búsqueda estructurada en recuperación de literatura científica. Otras variables externas: Aparte de la disciplina (área de conocimiento) y tipo de consulta (general. las limitaciones de la interfaz del buscador deberían considerarse a la hora de comparar este producto con otras herramientas de recuperación profesionales. exportación de un amplio número de referencias. pues simplemente se basan en comprobar la existencia o no de referencias de calidad. Cualquier análisis con dos años de antigüedad ya no resulta representativo de la situación actual del buscador. Para ello. Entrenamiento de los usuarios: La utilidad de las herramientas de búsqueda depende asimismo del posible entrenamiento previo que tengan los usuarios. Los resultados finales sugieren a los autores que Google Scholar no proporciona los elementos necesarios para una recuperación de literatura científica sistemática (tales como una optimización incremental de la búsqueda. En cambio. Haya. Vach y Motschall (2013) también critican las altas expectativas creadas en torno a la amplia tasa de respuesta de Google Scholar en revisiones sistemáticas. incidiendo en el hecho de que dichos estudios no utilizan la interfaz de búsqueda de Google Scholar de forma realista. por lo que el año del análisis resulta necesario para contextualizar adecuadamente los resultados. de forma que cada búsqueda se lanza a un conjunto diversos de recursos y bases de datos para posteriormente recuperar y combinar todos los resultados y presentarlos unificados al usuario. no está preparada todavía como una herramienta de búsqueda profesional para tareas donde es necesaria una metodología de recuperación estructurada. específica). Por ello. existen otras variables externas que pueden afectar a la validez de los estudios sobre Google Scholar en su comparación con otros productos de búsqueda: El período temporal: La calidad de los resultados de Google Scholar mejora continuamente. constructor visual de búsquedas o existencia de un histórico de búsquedas).

cobertura y relevancia). Para ello. 71 . Además. por encima de la calidad media). Los autores utilizan el término “cita” para referirse a cada “hit” que el buscador devuelve ante una consulta. los estudiantes localizaban más del doble de documentos relevantes en Google Scholar que en Metalib. y que puede disponer de distintas versiones agrupadas. desarrollan una consulta basada 22 En el original se usa el término “cita”. objetividad. Relevancia y precisión: Howland et al (2009) constatan por su parte la existencia de demasiados análisis centrados en la comparación de título por título (o registro por registro 22) para evaluar a Google Scholar como herramienta. en este libro se utilizan los términos “resultados” o “registros” para referirse a los “hits”. quienes realizan búsquedas relacionadas con sus trabajos de tesis. hasta siete bibliotecarios de la Brigham Young University. aunque los estudiantes no estaban completamente entusiasmados con ninguna de las dos herramientas. aspectos todos ellos esenciales para valorar correctamente a Google Scholar. calidad media.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) a través un estudio de usuarios compuesto por 32 estudiantes de doctorado en ciencias sociales de la Stockholm University. Este error terminológico se constata igualmente en diversos artículos publicados en la primera mitad del siglo XXI. habiendo recibido formación previa la mitad de los estudiantes. Tras ello. El estudio consistía en contabilizar los resultados que los estudiantes obtenían en sus búsquedas como “relevantes” si éstos marcaban o guardaban los resultados para ser utilizados en un futuro. a lo largo de una sesión de 20 minutos. autoridad. Para evitar la posible y razonable confusión. los estudiantes que habían recibido un entrenamiento previo en las dos herramientas. Los autores advierten que. Los autores plantean que esos estudios (basados en medidas puramente numéricas) no reflejan ni miden la eficacia de ninguna búsqueda particular ni la naturaleza académica o los algoritmos de descubrimiento de los contenidos. actualización. usando para ello tres grados de valoración (por debajo de la calidad media. El entrenamiento había tenido además un efecto positivo tanto en la cantidad como en la calidad de los artículos localizados. reservando “citas” para contabilizar las citaciones que recibe un determinado hit asociado a un documento. Ciencias y Ciencias sociales. especializados en Humanidades. de media. encontraban relativamente más artículos académicos (revisados por pares) en Scholar. estos investigadores aplican el “índice de academicidad” a los resultados obtenidos a través de un modelo basado en categorías (precisión. Estas conclusiones tienen una especial importancia dada la diferencia integral en el funcionamiento de estas dos herramientas.

y Google Scholar) y evalúan los 30 primeros resultados obtenidos en cada una de éstas con el modelo diseñado. GEOBASE. Business source premier. Social Sciences Citation Index. PAIS. . Esto viene a confirmar en parte los resultados previos de otros investigadores: las búsquedas de términos simples (LevineClark y Kraus. PsycINFO. Jstor.72 La revolución Google Scholar en una necesidad de información típica o estándar solicitada por estudiantes. Medline. GEOBASE. 2007) obtienen resultados precisos y relevantes en Google Scholar.6% más académico que los materiales encontrados únicamente en el resto de las bases de datos bibliotecarias analizadas. Posteriormente adaptan esta consulta a un conjunto de bases de datos (SportDiscus. Linguistic and language behavior. Los resultados muestran además que las búsquedas simples en Google Scholar. un 17. En otro trabajo representativo. Esa “falta” de lógica a la que aludía Giustini (2005) para indicar que Google Scholar no mostraba los resultados ordenados por fecha queda pues resuelta del siguiente modo por Howland y sus colegas: la clave del éxito es la relevancia y el amplio universo de información contenida. Es más. Sorprendentemente. 2007) y temas específicos (Robinson y Wusteman. Para ello se evalúan las respuestas obtenidas a 32 búsquedas (9 de ellas consultas simples construidas mediante palabras clave y 23 construidas por bibliotecarios expertos). POPLINE. llevado a cabo por Walters (2011). Tal vez podríamos creernos que la potencialidad de Google Scholar sólo reside en los primeros 20 ó 30 resultados. la indización del texto completo resulta pues esencial a la hora de conseguir la máxima relevancia en las búsquedas. PubMed. inciden especialmente en indicar que las bases de datos han fallado principalmente en ordenar los resultados por fecha en lugar de por relevancia. relacionadas todas ellas con el tema de la “migración”. El análisis de los resultados revela que Google Scholar es una de las pocas bases de datos capaz de recuperar resultados relevantes y con una precisión razonable a partir de la posición 50 en la página de resultados. Social Sciences Full Text y Sociological Abstracts). pero prestando especial atención a la efectividad de las búsquedas simples y las realizadas por expertos. se plantea precisamente un análisis comparativo de la recuperación y precisión de los resultados de Google Scholar con otro conjunto de bases de datos (EconLit. Pubmed y Sociological Abstracts tienen consistentemente una mayor respuesta y precisión que las búsquedas diseñadas por los expertos. Applied Science and Technology Abstracts. en promedio. los resultados muestran que Google Scholar es.

dependiendo de las preferencias de los usuarios y de las necesidades de información. aunque también depende obviamente de la herramienta con la que se compare. a día de hoy. la precisión de estas herramientas de nueva generación no parece superar en prestaciones a Google Scholar si tenemos en cuenta el coste de su adquisición. descubriendo que la relevancia de ambos productos es similar. Con todo. Kaluza (2013). concluyen que interfaces simples pueden ser igualmente útiles. por ejemplo. concluye que los resultados de Google Scholar son inferiores en todos los aspectos. se centra en conocer la evaluación de los resultados de búsqueda por parte de los usuarios. Otro interesante estudio es el 73 . las bibliotecas académicas comienzan a reconfigurar sus sitios web en torno a ese concepto de caja de búsqueda única para proporcionar a sus usuarios una experiencia de búsqueda similar a Google. simplicidad y facilidad de uso. sino que la relevancia de sus resultados. en lo que podríamos denominar una transición desde los pioneros sistemas de búsqueda federados hacia los modernos recursos de descubrimiento (Mussel y Croft. tras analizar 500 artículos de revistas alemanas en diversas áreas y comparar los resultados de Google Scholar con los de la herramienta de descubrimiento de EBSCO implementada en la University Library of Cologne. Sin embargo. Incluso las diversas tecnologías de búsqueda federada no pueden competir con Google en rapidez. especialmente ante consultas sencillas y basadas en palabras clave de términos específicos. aunque destaca su adecuación como primer paso en la búsqueda científica por su gratuidad y resultados generales satisfactorios. comparando Google Scholar con Ex Libris Primo®.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) Herramientas de descubrimiento Resumiendo. es superior en ocasiones (dependiendo de áreas de conocimiento) a la de bases de datos bibliográficas especializadas. los distintos estudios reseñados a lo largo de este apartado. aunque la herramienta de descubrimiento recibe puntuaciones sensiblemente inferiores en el aspecto de la usabilidad del producto. Con el fin de competir con esa interfaz simple y diseño intuitivo de los motores de búsqueda como Google y Google Scholar. quienes comparan Serials Solution’s Central Search (personalizada por la Florida Gulf Coast University Library) con Google Scholar y Microsoft Academic Search. podemos concluir que Google Scholar no sólo es el buscador preferido por los distintos usuarios para comenzar sus búsquedas. 2013). Zhang (2013). Cooke y Donlan (2008). Chen (2006) es claro por su parte en su diagnóstico de la situación: los sistemas de búsqueda federados han fallado en su propósito de convertirse en ventanillas únicas de consulta y acceso a la información académica.

quienes envían 299 consultas a la herramienta Summon (implementada en la University of Southern California). El 73. Google Scholar es completamente gratuito. cuando las consultas se restringen a ítems académicos (278 consultas).57% en Google Scholar mientras que Google buscador general obtiene el mejor porcentaje (90. que envuelve muchas de las características de los servicios de descubrimiento. especialmente Google Scholar. aunque el hecho de que Google Scholar no revele la escala y amplitud del material disponible (una información necesaria para poder valorar y evaluar sus prestaciones como producto de información académico). resultaría beneficioso para la NISO extender programas o crear grupos de trabajo que. De hecho. se sitúa como uno de los más importantes canales a través del que los estudiantes y académicos acceden a los contenidos proporcionados por las bibliotecas. entre otras cuestiones. entre las conclusiones del reciente informe técnico elaborado desde la NISO acerca del futuro de las herramientas de descubrimiento de las bibliotecas (Breeding. —— La escala y sofisticación de la tecnología implicada en Google Scholar excede con mucho el de los proveedores de servicios bibliotecarios. aunque el porcentaje de Summon mejora (76.65%). —— Google Scholar. Esta circunstancia plantea una discusión y debate crucial para los servicios bibliotecarios actuales.74 La revolución Google Scholar realizado por Namei y Young (2015). Google y Google Scholar y comparan la relevancia de los resultados obtenidos en los tres buscadores. se destacan los siguientes puntos: —— Los motores de búsqueda académicos (como Google Scholar o Microsoft Academic Search) pueden ser vistos como una alternativa a las herramientas de descubrimiento producidas por organizaciones bibliotecarias. todavía mejora más Google Scholar (79.91% de los resultados proporcionados por Summon se consideran relevantes por el 73. El informe indica finalmente que. . a pesar de las múltiples limitaciones que éste indudablemente tiene. Sin embargo.97%).14%) mientras que Google se mantiene prácticamente igual (90. Estos resultados plantean serias dudas acerca de la necesidad de invertir dinero en el desarrollo (y adquisición) de estos productos considerando que. hoy por hoy. exploraran y adquirieran prácticas recomendadas relacionadas con la publicación de contenido en la Web de forma que se maximizara su indización por parte de los motores de búsqueda académicos.26%). 2015). y que serán descritas con mayor detalle más adelante.

Por esta razón. localizar y recopilar la mayor cantidad de trabajos científicos que hayan aportado evidencias empíricas acerca del uso de Google Scholar para la evaluación de la actividad investigadora. Desde los inadmisibles errores en la calidad de la información que afectan a los indicadores proporcionados por Google Scholar (esgrimidos por los detractores) hasta su innegable capacidad para recopilar nuevas 1 http://googlescholardigest. con el que se pretenden dos claros objetivos. y bajo la creencia del hecho de que los investigadores dudan. bajo la forma de diversos informes y documentos de trabajo. Por razones de espacio (y de discurso) no aparecen en esta obra todos los trabajos allí recopilados (que se mantienen accesibles desde el sitio web) sino sólo aquellos necesarios para enarbolar la discusión necesaria acerca de este espinoso asunto. Por otra parte. prueban (en ocasiones aciertan y en otras yerran) y discuten (pero no opinan). este portal sirve de base para el depósito de nuevo material empírico realizado desde el propio grupo de investigación. pero en contadas ocasiones a evidencias empíricas.Capítulo 3 Las dos caras de Google Scholar (II): La herramienta de evaluación Así como las prestaciones de Google Scholar en tanto que buscador han sido continuamente probadas y analizadas (especialmente por los profesionales de la información) de cara a conocer sus principales características. los autores creamos en 2014 el producto “Google Scholar Digest: research on Google Scholar empirical evidences” 1. la evaluación acerca de su mayor o menor pertinencia para ser utilizada como herramienta para el análisis de la actividad investigadora tanto de usuarios como de revistas u otras agregaciones.blogspot. ha estado sujeta en muchas ocasiones a conjeturas y opiniones.es . Gracias a todo el material recopilado en Google Scholar’s Digest se ha elaborado gran parte de este capítulo. Por una parte.com. funcionamiento y funcionalidades para localizar información científica.

El algoritmo de vinculación de citas de documentos citantes a documentos citados no es confiable igual- . renovación o cancelación de revistas o la elaboración de diferentes rankings de actividad académica que pretenden reflejar un supuesto prestigio profesional. Una cosa es buscar material para satisfacer necesidades informacionales y otra bien distinta es buscar para evaluar. Pese a ello. como por ejemplo hallar el número de citas recibidas o determinar el h-index (tanto de personas como de revistas) es un asunto bien diferente. para ayudar en la toma de decisiones relativas a contrataciones. pues las cuestiones que Jacsó destapaba. el galardón iría a parar . Según sus propias palabras. es probablemente la persona que más influyera durante la primera década del siglo XXI en su mejora y optimización. el uso de Google Scholar con fines bibliométricos.para Peter Jacsó. premios de investigación. promociones.sin duda alguna . Google Scholar es una excelente herramienta para localizar información o documentos que pueden no estar representados en las bases de datos bibliográficas tradicionales. Sin embargo. Jacsó (2008c) somete a Google Scholar al tercer grado. volumen/número o paginación).76 La revolución Google Scholar evidencias de impacto en las Ciencias sociales y Humanidades a través de un producto sencillo y gratuito (requerida por sus defensores). fundamentalmente desde la prestigiosa revista Online Information Review. distribución de la financiación. eran corregidas o minimizadas posteriormente por parte del equipo de Mountain view (al igual que ahora sucede con los Working papers y Reports depositados por nosotros mismos en Google Scholar’s Digest). y en ocasiones incluso hirientes. La evaluación de la actividad académica Si existiera un premio al investigador más crítico con Google Scholar. Sucesivos tests en los que detecta de forma extendida errores en la identificación de nombres de autores. incluso atribuye un gran valor al servicio de versiones (que se verá en capítulos posteriores) pues éstas guían al usuario de una manera sencilla para acceder al texto completo de documentos primarios. en algunos casos completamente justificadas mientras que en otras desmesuradas. este apartado refleja las principales discusiones académicas surgidas durante la última década. revistas y de datos bibliográficos (año de publicación. es decir. Jacsó (2008a) tiene claro desde el principio las diferencias entre un Google Scholar buscador y otro como herramienta bibliométrica. Las críticas que este profesor de la University of Hawai’i at Mãnoa ha dirigido hacia este buscador durante años han sido feroces.

al trabajar con los datos de forma rápida y relativamente superficial. Bornmann et al (2009) destacan que la diversa tipología documental en Google Scholar dificulta los procesos comparativos con fines evaluativos basados en citas. El propio Jacsó (2008b) destaca algunos de ellos: “Google Scholar’s ability to identify citations is at best dodgy.UU. Unless it changes its course. triplicados o cuadruplicados de documentos no agrupados correctamente. Por ejemplo. but more likely misleading and based on very spurious use of algorithms establishing similarity and relationships between references […] Google Scholar should withdraw the “cited by” feature from its Beta version and probably not offer it in the final version. GS well go the way of the dodo bird eventually.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) mente. pues no es posible conocer los tipos de documentos que se están comparando. quienes al analizar a un conjunto de profesores del área de Biblioteconomía y Ciencias de la información en los EE. especialmente por cuestiones de matching (el motor de búsqueda falla a la hora de identificar los documentos pertinentes respecto a la búsqueda realizada). Estos errores hacen que autores al principio optimistas respecto a las posibilidades de un motor de búsqueda académico de funcionamiento automático y cobertura mundial. mientras que el algoritmo de vinculación de versiones no funciona completamente bien. repletos de falsos positivos y negativos.” [Reinhard Wetz] “Scholar is not as useful as promised. obteniendo duplicados. la existencia de estos errores hace que los indicadores bibliométricos que puedan ofrecer sean de poco uso real. aunque existen otras variables de importancia. Todo ello provoca que las estimaciones de hits (resultados ante una consulta) y citas resulten groseras. por lo que los autores reales se ven privados del reconocimiento. Así mismo. comprueban cómo Google Scholar pierde el 12% (501) de las citas relevantes debido a errores del sistema. Por ello. Las críticas de Jacsó. la excesiva dependencia en la cooperación con los editores puede influir en la correcta in- 77 . and many web searchers are now moving back to regular Google for indiscriminate scholarly trawling of the web […].” [Dean Giustini] Los problemas localizados por Jacsó son igualmente identificados por Meho y Yang (2007). Meho y Yang se dirigen fundamentalmente al software empleado. Los errores en las atribuciones de autores generan errores subsiguientes en la asignación de citas. adoptaran una actitud más crítica. lo que genera la obtención de números excesivos o absurdos. aunque los datos y estadísticas aportados por Google Scholar puedan ser informativas.

concluyendo que Google Scholar carece del control de calidad necesario para su correcto uso como herramienta bibliométrica incidiendo. . 2 Pese a ello. que resumen en los siguientes puntos: inclusión de citas no académicas. p. quienes hacen hincapié en la posibilidad que brinda Google Scholar para democratizar el análisis de citas al proporcionar éste a cada académico la disponibilidad gratuita a los datos de citas. en lugar de realizar diseños de investigación a mayor escala. y actualización lenta (cada 2 ó 3 meses). cobertura desigual entre campos del conocimiento. especialmente en la evaluación de la investigación. Teniendo en cuenta el incremento de cobertura del sistema desde 2008 hasta 2015. aunque dependen de la fuente de datos. en los errores de atribución de nombres. especialmente Jacsó. Una búsqueda realizada a fecha de septiembre de 2015 por nuestra parte (Figura 8) muestra apenas cinco resultados. a día de hoy. un producto gratuito mientras que las principales herramientas de uso bibliométrico (WoS y Scopus) son de (prohibitivo) pago. en que su mayor cobertura está constituida por ítems no comparables con aquellos contenidos en las bases de datos bibliométricas. independientemente de los medios financieros de sus instituciones. podemos considerar que la mejora del sistema ha sido sencillamente espectacular. 299) proclama asimismo que. Sin embargo. Google Scholar muestra a “I Introduction” como al autor más prolífico con 40. no inclusión de todas las revistas académicas. al igual que Bornmann et al. Harzing critica a Jacsó precisamente por trabajar igualmente con muestras pequeñas y por centrarse en casos basados en consultas manuales.78 La revolución Google Scholar dización de citas. Harzing y Van der Wal son conscientes no obstante de las importantes desventajas que supone Google Scholar en el análisis de citas. deficiencias para artículos antiguos (tal vez no digitalizados todavía). No olvidemos que Google Scholar es. mientras Jacsó (2006) critica el trabajo de Pauly y Stergiou (2005) por trabajar con una muestra reducida (114 artículos).100 artículos. Harzing. Merece una atención especial el trabajo realizado por Harzing y Van der Wal (2008). Jacsó (2006. Por ejemplo. resultados ilógicos debido al procesamiento automático de las citas. 2 Estas cifras han mejorado sustancialmente. Aguillo (2011) utiliza una aproximación cibermétrica con el fin de comprobar la utilidad de Google Scholar para la realización de análisis bibliométricos. con el fin de mostrar los pasos positivos que el sistema está realizando para mejorar. se muestran disconformes especialmente con las formas empleadas por los detractores de Google Scholar. todo no han sido críticas. replica la consulta en 2008 localizando entonces sólo 956 artículos firmados por “I Introduction”. En otro trabajo.

frente al concepto “one size fits all”. que 79 . Asignación errónea de autores en Google Scholar <https://scholar.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) Figura 8.google. Con ello se pretendía conocer la mayor o menor necesidad de un uso combinado de diferentes plataformas para obtener una imagen completa de las citas recibidas por un autor o revista principalmente.com/scholar?hl=en&q=author%3A%22I+Introduction%22> Métricas de evaluación y bases de datos bibliométricas La irrupción de Google Scholar en el mercado de los productos de información bibliométrica produjo una oleada de trabajos (que todavía dura a fecha actual) en los que se trataba de comparar el número de citas que las diferentes bases de datos proporcionan con el propósito de conocer la posible correlación entre éstas.

80

La revolución Google Scholar

aboga por el uso de un único producto, así como el papel que Google
Scholar juega en este nuevo sistema.
En el campo de la medicina y áreas afines, los estudios han puesto
su interés en la comparación entre Google Scholar y MEDLINE/Pubmed.
Al contrario de los estudios vistos en el capítulo anterior (centrados en
las prestaciones de búsqueda), en este caso se han fundamentado en
la localización de citas. A pesar de la habilidad de Google Scholar para
devolver resultados relevantes y proporcionar - de forma gratuita - una
trazabilidad de las citaciones recibidas por cada resultado obtenido, algunos autores expresan al comienzo serias dudas acerca de su capacidad para proporcionar citas recientes (Henderson, 2005), necesarias en
investigación médica dada la rápida obsolescencia en esta disciplina, así
como ciertos sesgos hacia la literatura más antigua, que podrían limitar
los análisis de citas desde Google Scholar en esta disciplina; de ahí que
la comparación de éste con Pubmed podría proporcionar información
precisa acerca de su mayor o menor utilidad.
Shultz (2007) compara y contrasta un total de 10 búsquedas en Pubmed y Google Scholar. Pese a que el autor concluye que ambos sistemas
funcionan de forma muy diferente (y por tanto no pueden ser comparados directamente), sus resultados ya atisban las principales características de Google Scholar: a) mayor cantidad de citas (en 8 de las 10 consultas, Google Scholar recupera más citas que Pubmed); b) localización de
citas únicas (de las 247 citas recuperadas por Google Scholar, el 50.61%
eran únicas, es decir, no recuperadas en Pubmed); c) diversidad de documentos citantes (el 12.96% de los resultados obtenidos en Google Scholar no eran artículos de revista); y la ampliación del espectro citante (el
4.05% de los resultados únicos de GS provenían de revistas no indizadas
en Pubmed).
Freeman et al (2009) también localizan más citas en Google Scholar
que en Pubmed al evaluar la capacidad de éstas dos bases de datos para
evaluar el impacto de revisiones de consultas sobre información en
drogas publicados en The Annals of Pharmacotherapy Drug Information
Rounds. Sin embargo, constatan la capacidad de Pubmed para localizar
información más específica y relevante.
Estos resultados concuerdan parcialmente con los obtenidos por
Mastrangelo et al (2010), quienes recopilan información acerca de los
factores de riesgo de sarcoma a través de Pubmed y Google Scholar. Los
autores, aparte de subrayar la mayor cantidad de citas recopiladas por
Google Scholar y la muy baja concordancia entre ambas bases de datos
(8%), inciden en el hecho de que muchas de las citas recuperadas por

Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II)

Google Scholar son innecesarias, provenientes de resultados desactualizados e incluso falsos (debidos a fallos en la asignación de autores a
artículos), lo que ayuda en gran parte a la obtención de más resultados,
pero que precisan de un proceso posterior de filtrado.
Los autores detectan adicionalmente un problema ya planteado anteriormente y relativo al grado de comparabilidad entre los productos,
dada la diferente naturaleza de los materiales indizados en ambas bases de datos. La detección de una gran cantidad de las citas de Google
Scholar provenientes de fuentes no convencionales (libros, conferencias,
actas de congresos, posters, cartas, editoriales, etc.) complica la comparación directa de los dos buscadores. El idioma constituye un problema
adicional. Por ejemplo, Mastrangelo et al (2010) solamente tienen en
cuenta los artículos publicados en inglés para llevar a cabo su estudio.
No obstante, la delimitación temática de Pubmed (y su completa indización actual por parte de Google Scholar) 3 ha hecho que la mayoría de
los trabajos comparativos en términos de citas se hayan dirigido a las
tres principales bases de datos bibliométricas: Web of Science core collection, Scopus y Google Scholar.
Desde un inicio, existió un gran interés por la comunidad científica
en conocer las diferencias en términos globales del número de citas que
Google Scholar era capaz de recopilar respecto a Scopus y WoS. Por ejemplo, Jacsó (2005a) recoge los 30 artículos más citados en Current Science y
analiza las citas recibidas por éstos en las tres bases de datos. Sus resultados muestran que, aparentemente, tanto WoS como Scopus recuperan
un número de citas muy similar (977 y 992 respectivamente), mientras
que en Google Scholar los datos son muy inferiores (358), debido a que
éste sólo tiene indizados 14 de los 30 artículos analizados.
Este trabajo constituye una excepción en la literatura al ser de los pocos en los que se recuperan menos citas en Google Scholar. Los procesos
de búsqueda empleados para la localización de los artículos, la meticulosidad del autor para eliminar citas erróneas (labor no siempre realizada
en este tipo de estudios) así como las mayores deficiencias del sistema
en aquel momento a la hora de vincular correctamente las distintas versiones de los documentos pudieron influir en sus resultados.
Sin embargo, una gran parte de los estudios posteriores se han caracterizado de hecho por localizar más citas en Google Scholar. Por ejemplo, Martell (2009) analiza 217 artículos publicados en College & Research
3 La consulta <site:ncbi.nlm.nih.gov> en Google Scholar arroja un total de 3.650.000
resultados (julio 2015). Aunque el comando “site” no es exhaustivo, proporciona una idea
general de la alta tasa de indización en Google Scholar del material contenido en Pubmed.

81

82

La revolución Google Scholar

Libraries entre 2000 y 2006, observando que el promedio de citas por
artículo en WoS es de 3.1, mientras que en Google Scholar es de 6.4. Posteriormente, Minasny et al (2013) observan por su parte que el número
de citas en Google Scholar es 1.9 veces mayor que el de WoS a la hora de
analizar las citas recibidas por más de 300 investigadores del área de
Ciencias de la Tierra. Con todo, este tipo de estudios comparativos de
citas vienen fuertemente delimitados por las distintas disciplinas científicas y su desigual cobertura en cada base de datos.
Uno de los primeros análisis de citas por disciplinas en Google Scholar
fue el realizado por Bakkalbasi et al (2006), quienes estudian las citas recibidas en WoS, Scopus y Google Scholar para los artículos pertenecientes
a dos disciplinas (Oncología y Física de la materia condensada) en dos
momentos temporales (1993 y 2003). Los resultados muestran diferencias en función de la base de datos, del año de publicación y de la disciplina. Centrándonos en la muestra más reciente (2003), en Oncología
es Scopus la que obtiene un mayor promedio de citas (8.9), seguida de
WoS (8.3) y Scholar (6.2). Sin embargo, en Física de la materia condensada
es WoS la que ocupa el primer lugar (3.9), seguida de Scopus y Scholar
(ambas con un promedio de 2.2). Estos datos vendrían a coincidir con los
resultados previamente discutidos de Jacsó (2005a), aunque los autores
reconocen la capacidad de Scholar de aportar citas únicas no contenidas en las restantes bases de datos, aspecto en el que se ahondará más
adelante.
Posteriormente, Kousha y Thelwall (2008) llevan a cabo una de las
contribuciones más importantes en el área al analizar una muestra amplia (882 artículos) conformada por 39 revistas en Acceso Abierto recogidas en la WoS (versión 2011), en diversas áreas (Biología, Química,
Física e Informática). Los autores encuentran diferencias significativas
entre las citas recibidas en WoS y Scholar por área. Por ejemplo, tanto en
Física (WoS: 1.111; Scholar: 1.313) como especialmente en Informática
(WoS: 1.117; Scholar: 2.884), el número de citas recopiladas por Scholar es
claramente superior, mientras que en Biología en ligeramente inferior
(WoS: 1.288; Scholar: 1.113) y en Química claramente inferior (WoS: 668;
Scholar: 279).
Los autores atribuyen las posibles razones de este fenómeno a la tipología de fuentes de citas incluidas en Scholar y no incluidas en WoS. De
este modo, por un lado, la Física (repositorios) e Informática (congresos)
se ven favorecidas, mientras que la Biología y Química (citas fundamentalmente de revistas) se ven perjudicadas. No obstante, en el caso de la
Química, las razones debían buscarse entonces en la cobertura deficien-

Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II)

te de ésta en Scholar, debido a la no inclusión de la American Chemical
Society, como se ha comentado previamente.
Este hecho se confirma nuevamente con el trabajo de Bornmann et
al (2009), quienes tras examinar un conjunto de 1.837 artículos (aceptados para su publicación en la prestigiosa revista Angewandte Chemie
International Edition, o bien rechazados, pero posteriormente publicados
en cualquier otro lugar) calibran la medida en la que el uso de Google
Scholar puede proporcionar citas válidas en el campo de la Química. Los
autores recuperan 44.502 citas a través de la WoS, 44.601 desde Scopus,
48.160 desde Chemical Abstracts, pero solamente 9.320 a través de Google Scholar, demostrando la deficiente cobertura de éste en el campo de
la Química en aquellos momentos.
Dada la dependencia de la disciplina bajo estudio, los autores comienzan paulatinamente a centrar sus estudios en las correlaciones
obtenidas más allá del número total de citas recibidas en cada base de
datos, gracias en parte a los resultados positivos de los primeros análisis
realizados. De ese modo, Pauly y Stergiou (2005), a partir de un estudio
a 99 artículos seleccionados de 11 disciplinas diferentes, obtienen una
buena correlación entre el número de citas en Google Scholar y WoS. De
forma similar, Belew (2005), a partir de un conjunto de 203 publicaciones, encuentra igualmente una alta correlación entre las citas proporcionadas por estas dos bases de datos.
La correlación de Scholar con Scopus es igualmente analizada por
Kousha, Thelwall y Rezaie (2011), quienes encuentran ligeras diferencias
por área de conocimiento. En el caso de Derecho, la correlación entre
Scopus y Google Scholar es de 0.7, mientras que sube hasta 0.9 en el caso
de la Sociología, mostrando su gran utilidad en disciplinas orientadas a
las Ciencias Sociales.
Este tipo de cálculos también se han aplicado a otros niveles de estudio. Por ejemplo, Vaughan y Shaw (2008) obtienen la correlación entre WoS y Scholar en función de la tipología documental, a partir de una
muestra de 1.483 publicaciones que representan la producción científica
de una Facultad de Biblioteconomía y Documentación, encontrando correlaciones altas en el caso de los libros (0.75), intermedias en el caso de
los capítulos de libro (0.59) y sorprendentemente bajas en el caso de las
actas de congresos (0.29).
Por otra parte, Bar-Ilan, Levene y Lin (2007) se proponen testar un
conjunto de medidas para comparar las diferentes bases de datos de
citas, tomando como muestra las citas a los artículos indizados por WoS

83

84

La revolución Google Scholar

por un listado de autores israelitas (un total de 44) altamente citados.
Los resultados obtenidos revelan altas similaridades entre Scopus y WoS,
mientras que la similaridad de Scholar con el resto es menor, indicando
de este modo que su cobertura es considerablemente diferente.
La circunstancia de que, a pesar de las diferencias notables en la cobertura, se obtengan (especialmente en algunas disciplinas) correlaciones elevadas entre el número de citas obtenido en Scholar y el resto de
bases de datos, ha llevado a algunos autores a explorar la relación entre
los contenidos albergados en Scholar (que reflejan en parte una presencia web) y otros indicadores bibliométricos de actividad.
Por ejemplo, Smith (2007) compara la tasa de citas de ocho universidades de Nueva Zelanda a través de Google Scholar con los resultados
del New Zealand’s Performance Based Research Funding (PBRF), un ejercicio de evaluación de la investigación. La alta correlación entre los resultados de producción del PBRF y el total de citas (0.94), así como del total
de hits recuperados (0.85) ponen en evidencia que el número de citas
medida a través de Google Scholar es una medida útil de los datos de
producción de una institución, a pesar de los problemas metodológicos
asociados al buscador.
Orduna-Malea, Serrano-Cobos y Lloret-Romero (2009) estudian
igualmente la validez de Google Scholar como servicio capaz de reflejar adecuadamente la producción científica de una universidad, en este
caso comparando la producción científica de las universidades públicas
españolas a través de Scopus con la cobertura de documentación científica que las sedes web de estas universidades tienen indizadas en Google
Scholar. Los resultados muestran, si se excluyen ciertos outliers (bases de
datos bibliográficas depositadas en los dominios web de algunas universidades como Dialnet y Compludoc), que la producción académica de las
univeridades a través de Scopus y la publicación web en Scholar están
muy correlacionadas, aunque constituyen conjuntos documentales de
diferente naturaleza.

En búsqueda de las citas únicas y del impacto total

Más allá del número total de citas obtenidas por cada base de datos,
de la correlación entre éstas o de la naturaleza de sus contenidos, en lo
que sí existe consenso es en que ninguna base de datos proporciona las
necesidades completas para un análisis de citas si lo que pretendemos
es conocer el impacto “total” de una publicación, revista o autor. Este es
el caso por ejemplo del conocido trabajo de Judith Bar-Ilan (2010), quien
realiza un análisis de citas completo al clásico libro “Introduction to in-

Scopus y Scholar ayuda a revelar una imagen más precisa y exhaustiva del impacto de los autores. Efectivamente. destacando el papel de Google Scholar al recopilar citas de actas de congresos y revistas en idiomas diferentes al inglés. el valor añadido que puede suponer Google Scholar (especialmente en su capacidad para localizar nuevas citas) debe ser tenido en cuenta. publicación o idea en la sociedad en general y en la comunidad científica en particular. tal y como pretendía Bar-Ilan en su estudio. Estos datos corresponden con las apreciaciones de Bauer y Bakkalbasi (2005) al tratarse de material antiguo y probablemente fuera de la Web académica. Los resultados muestran que WoS en la base de datos que más citas recupera para los dos profesores y Scholar la que menos. Meho y Yang (2007) amplían el estudio inicial a 15 autores. Y esta circunstancia no sucede de forma exclusiva (aunque tal vez sí de forma más acusada) en las ciencias sociales. Scopus y Scholar observando 85 . Yang y Meho (2006) analizan las citas recogidas en WoS. La autora descubre que.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) formetrics”.buenos o malos independientemente del metro (base de datos) que utilicemos para medir (lo que es válido hasta cierto punto según qué disciplinas). A pesar de ello. la combinación de WoS y Scholar incrementa el número de citas en un 25. Nisonger) con perfiles ligeramente diferentes (Information Science y Library Science respectivamente). especialmente para Nisonger (WoS: 173. Levine-Clark y Gil (2008) llegan a una conclusión similar al estudiar las citas recibidas por un conjunto de revistas de Economía y Negocios. sí localiza 109 citas no incluidas en éstas. de Leo Egghe y Ronald Rousseu. Dado que ninguna base de datos proporciona las necesidades para un análisis completo de citas (Bakkalbasi et al. las correlaciones nos dicen básicamente que los autores. concluyendo que el uso combinado de WoS. aunque Google Scholar es incapaz de localizar el 30% de las citas que sí cubren Scopus y WoS (unas 90).9% de citas únicas en Scholar) y un 19. Por ejemplo. Scopus: 98.7% en el caso de Nisonger (13% de citas únicas procedentes de Scholar). Google Scholar: 83).4% para Mostafa (5. revistas o artículos buenos (o malos) siguen siendo .más o menos . Por tanto. 2006). Otra cosa bien distinta es la pretensión de recopilar el mayor número de citas reales existentes para valorar la influencia de una persona. Kulkarni et al (2009) comparan los perfiles de citación para 328 artículos publicados en revistas de medicina general (JAMA. New England Journal of Medicine) entre 1999 y 2008 a través de WoS. la combinación de aquellas es necesaria. Scopus y Scholar para dos profesores del área de Library and Information Science (Javed Mostafa y Thomas E. Lancet.

pero mucho menores en Química (21. se ha procedido a calcularlos manualmente. Thelwall y Rezaie (2011) Derecho Scopus – GS: 83. Química. Los resultados arrojan porcentajes de citas únicas en Google Scholar elevados para Informática (78.93% (n= 511) Biología WoS – GS: 29. Para ello toman una muestra de 882 artículos provenientes de 39 revistas de Acceso Abierto a fecha de 2001.33% 81.76% 81.80% (n= 318) Informática Física WoS – GS: 68.8% 58% (n=167) García-Pérez (2010) Psicología WoS – GS: 41.3% 34.67% (n= 1044) WoS – GS: 43. tanto cuantitativa como cualitativamente.87% 90.18% (n= 333) Historia Scopus – GS: 76.86 La revolución Google Scholar cómo las tres bases de datos producen.4% 37.2% 54.9%).9% 11.4% 59. Petrović y Živković (2010) Odontología WoS – GS: 55.94% 86.40% (n=122) Arqueología Scopus – GS: 72. procedentes de diversas disciplinas (Biología.8% Scopus – GS: 55.54% 80. Utrobičić y Petrak (2010) Medicina WoS – GS: 44% Scopus – GS: 51% 22% (n= 86) Adriaanse y Rensleigh (2013) Ciencias ambientales WoS – GS: 15% Scopus – GS: 3.4% de todas las citas recuperadas por Scholar son únicas) y Física (47.07% 82. Kousha y Thelwall (2008) analizan en profundidad este fenómeno.08% (n= 222) Sociología Scopus – GS: 71. Ante esta situación. definiendo “citas únicas en Google Scholar” como aquellas citas recuperadas por Scholar pero que no se encuentran en las bases de datos bibliométricas con las que se compara (esencialmente WoS y Scopus). Recopilación de trabajos relativos a citas únicas en Google Scholar AUTORES DISCIPLINA SOLAPAMIENTO CITAS ÚNICAS GS Bakkalbasi et al (2006) Oncología WoS – GS: 4% Scopus – GS: 5% 13% (n= 614) Materia condensada WoS – GS: 9% Scopus – GS: 3% 50% (n= 296) Mikki (2009) Ciencias de la Tierra WoS – GS: 26% 68% (n= sin datos) Jaćimović.89% (n=792) Filosofía Scopus – GS: 71.27% (n= 2737) Química WoS – GS: 53.99% (n= 517) Comunicación Scopus – GS: 77.6% (n= 27) Kousha.02% 81.62% (n= 707) Kousha y Thelwall Elaboración propia. .4%).7% (n= 380) Šember. Tabla 2. Física e Informática).1% (n=563) Zarifmahmoudi y Sadeghi (2012) Medicina nuclear Scopus – GS: 23.35% 81.73% (n=222) Ciencias políticas Scopus – GS: 73. citas diferentes. En aquellos casos en los que los datos porcentuales no se ofrecían en la fuente original.47% 66.

Tipologías documentales citantes Más allá de calcular el número de citas y citas únicas que proporciona cada base de datos. destaca la corriente de autores que razona que la consideración de fuentes alternativas supone una ventaja de Google Scholar. Los datos mostrados en la Tabla 2 deben leerse de forma muy contextualizada. por el contrario. fuentes indizadas en WoS/Scopus vs fuentes no indizadas. pues el año de realización del estudio. 2008). la comunidad ha adoptado en este punto claramente dos posiciones bien diferenciadas. mostrando las disciplinas analizadas. Y. la disciplina y el tamaño de la muestra afecta significativamente a los resultados obtenidos. especialmente en Ciencias Sociales y Huma- 87 . en la que se muestra una recopilación de los principales trabajos empíricos relativos al cálculo de citas únicas en Google Scholar. así como el porcentaje de citas únicas que cada una de ellas proporciona.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) Estos resultados llevan a la comunidad científica a desarrollar numerosos trabajos dedicados a conocer tanto el grado de solapamiento entre bases de datos bibliométricas. Por un lado. En cualquier caso. pues esta circunstancia puede ser útil para el seguimiento de citas en un amplio rango de documentos académicos y proporcionar de ese modo un tipo de impacto más amplio y completo (Kousha y Thelwall. A pesar de la dificultad que supone medir el impacto intelectual que pueden aportar las citas en función de su procedencia. la procedencia y tipología de estas citas introduce obviamente una nueva y necesaria discusión: ¿deberíamos valorar una cita procedente de un artículo publicado en una revista recogida en los Journal Citation Reports igual que una cita de una revista no indizada? ¿Y de un informe? ¿Y de un trabajo final de carrera? Tal y como Kousha y Thelwall (2008) indican. la aportación de Google Scholar a la recuperación de citas queda fuera de toda duda. Y en esta discusión aparecen claramente dos dimensiones complementarias: fuentes académicas vs fuentes no académicas. poniendo un especial énfasis en Google Scholar. sobrevalorarían la investigación de menor calidad. el solapamiento entre bases de datos y el porcentaje de citas únicas. es todavía una cuestión no resuelta si la inclusión de citas de documentos no revisados por pares mejoraría el valor de los resultados del conteo de citaciones o si. que puede ser importante en muchos campos. tal y como hacen Vaughan y Shaw (2008). dentro de las académicas. Con el propósito de ofrecer una panorámica general de las investigaciones realizadas se ha elaborado la Tabla 2.

Aunque las revistas constituyen la tipología más presente (25. En el análisis de citas de 15 investigadores que estos autores realizan posteriormente (Meho y Yang. Entre las tipologías de fuentes de citas en Google Scholar sobresale una por derecho propio: las monografías.42%). libros. tesis…) hasta otras fuentes menos académicas (como currículums. Pese a existir proyectos . los autores obtenían un 33. la autora identifica no sólo las citas por categoría documental. capítulos de libro. páginas web.6% de informes técnicos y un 4. pues documentos enviados por estudiantes. otras tipologías como las actas de congresos (22. entre las que se pueden encontrar desde fuentes más académicas (revistas. otros trabajos como los de Mukherjee (2009). destaca la corriente que considera negativa esta circunstancia.2%) proporcionan un porcentaje alto de citas únicas.62%) y libros (1. En el análisis realizado por Bar-Ilan (2010) del libro “Introduction to informetrics”. informes técnicos (2.7%). Un porcentaje de citas realmente significativo (50.9%). Con posterioridad. el estudio de la variedad de tipologías documentales de las fuentes de citas en Google Scholar es actualmente un área de gran interés. 2008a.35%). etc.9%) o informes (9. un 12. Este asunto ya fue abordado por Yang y Meho (2006) en su análisis de los profesores Mostafa y Nisonger. 2007). Por otro lado.86%).88 La revolución Google Scholar nas (Schroeder. En el caso concreto de Mostafa. tesis (13. Van Aalst (2010) o Bergman (2012) discuten igualmente la amplia diversidad de fuentes de citas en Google Scholar.1%. 2008b). comentado previamente. entre otros. capítulos de libros (3.6% de las citas procedentes de actas de congresos. que han sido incluidos en Google Scholar por el mero hecho de estar online (independientemente de su valor académico). que en el caso de Nisonger sólo representa el 17. tesis (4. la alta diversidad de procedencia de las citas obtenida en Google Scholar se confirma: artículos de revista (40. webibliografías. sino que desciende a la identificación de citas únicas en Google Scholar. Independientemente de la calidad de las citas y su influencia en el retrato más o menos fidedigno del impacto científico. pueden influir y tergiversar los conteos de citas y por tanto el impacto científico real (Jacsó. Los libros se encuentran totalmente excluidos de las grandes bases de datos bibliométricas (únicamente aparecen en las referencias citadas). informes. lo que muestra la variación que puede existir entre carreras científicas diferentes incluso dentro de áreas disciplinares similares. actas de congresos (33.32%).). entradas de blogs o listas de discusión. 2007). capítulos de libros (8. actas de congresos.7%).66%).75%). tesinas de máster (4.5% de tesinas y tesis doctorales.8%).

como el Book Citation Index 4 (elaborado por Thomson Reuters en 2011). Una muestra de ello es el trabajo llevado a cabo por Harzing y Van der Wal (2008) quienes. No todos los libros académicos incluidos en Google Books se encuentran en Google Scholar debido a una serie de factores tanto técnicos como de cobertura y filtrado de documentos. Una diferencia más que notable. en las que los libros y capítulos de libros constituyen vehículos esenciales de comunicación científica. Aunque en capítulos posteriores (dedicados a la cobertura de Google Scholar) se incidirá nuevamente en este hecho. Conviene diferenciar las citas a libros proporcionadas por Google Scholar de los datos de citas que pudiera proporcionar Google Books (Kousha y Thelwall.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) en marcha.aspx 89 . Google Scholar se erige como la principal fuente actual de citas procedentes de monografías. unido a la enorme base de datos del buscador. Kousha. En los trabajos señalados al comienzo de esta sección ya se mostraba el importante porcentaje de citas (tanto totales como únicas) provenientes de libros en Google Scholar. 2015). ha permitido abrir una línea de investigación centrada en el impacto de las monografías (tanto como fuentes citantes como documentos citados). En ese sentido. Para ello recogen 1. El promedio de citas localizadas por libro en WoS es de 346. en su exploración de Google Scholar como una nueva fuente para el análisis de citaciones.com/products_tools/multidisciplinary/bookcitationindex 5 Galardón anual entregado por la Academy of Management al libro juzgado por haber realizado la contribución más destacada al avance global en la disciplina de la Gestión del conocimiento en los dos años precedentes. su cobertura es todavía insuficiente y excesivamente sesgada hacia el idioma inglés como para poder ser usada con fines bibliométricos. 2014). contabilizan las citas recibidas por los distintos ganadores del Terry Book Award (10 monografías) 5.org/Meetings/awards/2015George-R--Terry-Book-Award. Este hecho. mientras que en Google Scholar alcanza las 833 citas por libro. Posteriormente. http://aom. se debe dejar claro que las bases de datos de Google Scholar y Google Books son diferentes. Thelwall y Rezaie (2011) realizan un estudio más amplio con el fin de examinar las citas procedentes de Google Scholar y Google Books como fuentes alternativas de evidencia de impacto científico. de gran importancia para la evaluación de autores en disciplinas de Ciencias Sociales y Humanas.000 monografías que habían sido remiti- 4 http://wokinfo. entre otros importantes problemas conceptuales como las citas de diferentes ediciones de un libro (Torres-Salinas et al.

hasta ahora relativamente minusvalorado. seguida de los artículos en revistas (con 1. que fue aplicado por primera vez en 2014 para evaluar el período 2008-2013. Política y Estudios internacionales. y dentro del top 25.ac. y para cada libro comparan las citas recibidas desde Google Scholar. Universitat Autònoma de Barcelona y la Universidad del País Vasco). El efecto de la consideración de las monografías en la evaluación de los autores es tan rotundo que su consideración ya resulta ineludible. Además. es la tipología documental con mayor promedio de citas por documento (2. el 62% son libros.ref. con el fin de evaluar la calidad de la investigación llevada a cabo por las universidades británicas.700). dentro del top 1% de documentos más citados. De los 45. Este sistema fue sustituido por por el denominado REF (Research Excellence Framework).410 documentos (71%) en los que se puede identificar la tipología documental. sin 6 RAE (Research Assessment Exercise): ejercicio de evaluación por las agencias financiadoras de la educación superior británicas (HEFCE. Los autores identifican que ciertos investigadores tienen un nivel internacional y son reconocidos independientemente de la base de datos utilizada. Martin-Martin et al (2014) analizan los 64. el 18% son monografías. Sociología. Filosofía. oculto o simplemente ignorado. Universitat de Barcelona. Los autores contabilizan que la mediana de citas a libros obtenida desde Google Books y Google Scholar era dos y tres veces respectivamente más elevada que la obtenida desde Scopus.90 La revolución Google Scholar das al RAE (Research Assessment Exercise) 6 en 2008 por parte de los autores como evidencia de su producción científica. La mayor sorpresa llega no obstante cuando los documentos se ordenan según su número total de citas. Estos resultados remueven absolutamente los cimientos de la evaluación tradicional del impacto científico basada en análisis de citas desde y hacia revistas de calidad (la elite) en Scopus y WoS. Derecho. Un ejemplo ilustrativo lo conforma el estudio realizado por Etxebarria y Gomez-Aranga (2010).uk .000 documentos más citados en Google Scholar durante el período 1950-2013. Este hecho sugiere a los autores que Google Scholar puede ser una fuente de citas necesaria en aquellos casos donde las publicaciones en tipologías distintas a los artículos de revista son importantes.700). http://www. categorizando las monografías por disciplina (Arqueología. Google Books y Scopus. El hecho de que Google Scholar sea una importante fuente de citas a monografías ha permitido revelar por otra parte el gran impacto científico de éstas. quienes comparan Scopus y Google Scholar a la hora de medir la producción en ciencias sociales en cuatro universidades españolas (Universidad Complutense de Madrid. Historia y Estudios culturales y de medios). realizado aproximadamente cada cinco años. se localizan hasta 14 monografías. HEFCW y DELNI). SHEFC.

En concreto. Tabla 3. la mayoría de los autores prestigiosos en sus comunidades científicas locales ni siquiera aparecen en Scopus. gestión y administración de empresas. informática. economía. Recopilación de trabajos relativos a comparación de citas recibidas por tipología de documento citante (Google Scholar. las disciplinas que más se benefician de Google Scholar en el estudio realizado son las ingenierías. Web of Science. De ahí el enorme beneficio del uso de Google Scholar para la evaluación de estos investigadores. Scopus) AUTORES UNIDAD DOCUMENTO GS WOS SCOPUS Winter & Zadpoor & Dodou (2014) N= 58 (multidisciplinar) Revistas 805 546 -- Conferencias 123 53 -- Libros/Capítulos de libro 63 7 -- Tesis 75 0 -- Informes 13 0 -- Artículos originales 39 30 40 Artículos de revisión Miri & Raoofi & Heidari (2012) Bergman (2012) Meho & Yang (2007) Jaćimović & Petrović & Živković (2010) N= 104 (Hepatología) N= Sin datos (Ciencias sociales) Artículos publicados por 5 revistas durante 2005 N= 1093 (Documentación) N= 158 28 25 25 Informes breves 9 8 10 Editorial 8 4 7 Informe de casos 3 3 3 Carta al editor - 1 1 1951 1735 1782 Artículo Libro 318 -- 1 Artículo en congreso 32 -- 25 Revisión 24 -- 248 Editorial 1 -- 28 Carta 1 -- 10 Artículo 2215 1529 1754 Artículo en congreso 1849 229 359 Revisión 86 172 147 Editorial 25 63 36 Reseña 3 17 0 Carta 2 9 2 Ítem bibliográfico 1 2 1 Artículo 117 50 56 Revisión 13 4 6 Editorial 3 1 3 Actas de congreso 3 2 3 Estas continuas evidencias de impacto global.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) embargo. ha dado lugar al 91 . y especialmente en tipologías documentales básicas para la comunicación de la ciencia en gran multitud de disciplinas científicas sociales y humanas. matemáticas y humanidades.

2007. entre las que destaca por derecho propio el g-index (Egghe. citas únicas y citas procedentes de tipologías documentales alternativas. 2014. universidades. en la Tabla 3 se muestran algunos de los principales trabajos que ofrecen datos de citas recibidas por tipología de documento en Google Scholar. 2015). así como estudios acerca de sus ventajas e inconvenientes (Costas y Bordons. es evidente que 7 Actualmente (septiembre 2015). En este último apartado del capítulo se aborda la construcción de indicadores bibliométricos a partir de los datos extraídos de Google Scholar.). la capacidad de generar comparaciones instantáneas. Wilsdon et al. así como de la aplicación de procesos de normalización. 2006). etc. . en el contexto de la evaluación. Bornmann et al (2015) han desarrollado recientemente procedimientos para comprobar el grado de normalización del impacto de citación en Google Scholar (tomados de los procedimientos de la bibliometría clásica) concluyendo que los datos de Google Scholar resultan adecuados para la normalización. comparándolas posteriormente con Web of Science o Scopus. necesarios para su utilización en distintos campos científicos. 2009). un autor tiene un índice “h” cuando “h” de sus artículos publicados tienen al menos “h” citas cada uno de ellos. Elaboración de indicadores bibliométricos En los apartados precedentes se ha dejado constancia de la importancia de Google Scholar como fuente de citas. El h-index es un indicador compuesto ideado por el físico Jorge Hirsch (2005). A modo de resumen. el artículo en el que se propuso el indicador ha logrado las 1973 citas en la Web of Science Core Collection. Sin embargo. Sin entrar en la discusión acerca de las características de este indicador o la mayor o menor necesidad de sus variantes (un tema que merecería por sí mismo una obra entera dedicada a ello). La insultante sencillez de su cálculo. 2012. En este sentido. mientras que alcanza las 5060 en Google Scholar. esenciales en determinadas disciplinas científicas. mediante el que se pretende conocer el impacto de un investigador a partir del número de publicaciones y el número de citas recibidas. especialmente del h-index. todavía debe prestarse atención a la confiabilidad de los datos y a la necesidad de su filtrado. valores elevados para un artículo en bibliometría. su robustez frente a errores y su posterior aplicación a otras unidades de estudio (revistas. entre algunos otros). provocaron una amplia y rápida expansión 7 así como la aparición de numerosas variantes (Alonso et al. Waltman y Van Eck.92 La revolución Google Scholar testeo de este buscador como posible fuente de citas en programas y ejercicios de evaluación estatales (Prins et al.

por lo que en realidad se precisa tanto de WoS. pues una sola base de datos no puede ser confiable para proporcionar una evaluación exclusiva del impacto de un investigador. también tienen los mejores valores en Google Scholar. Scopus y Google Scholar. Aunque los valores absolutos son superiores en Google Scholar. Las conclusiones apuntan a que Google Scholar proporciona resultados significativamente más altos que WoS. El objetivo detrás de estos trabajos es determinar si una sola base de datos sería suficiente para conocer. la autora declara que en la mayoría de los resultados obtenidos a través de Google Scholar son considerablemente diferentes a los obtenidos por WoS y Scopus. concluyen que Google Scholar es capaz de identificar las principales revistas de la disciplina. Bar-Ilan (2007) compara los h-index de una lista de autores altamente citados de Israel. Sin embargo. pero los rankings (tanto de autores como de revistas) no varían significativamente o sólo de manera moderada cuando se ordenan por el h-index. Sin embargo. las posiciones de los autores más y menos importantes.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) cada base de datos bibliométrica proporciona citas duplicadas y únicas. Los primeros trabajos al respecto no son muy positivos respecto al papel de Google Scholar en este asunto. Por ejemplo. las comparaciones del valor del h-index deben realizarse obligatoriamente en el marco de una base de datos específica para que tengan sentido. Unas conclusiones similares obtienen Amara y Landry (2012). así como a determinar las posibles diferencias en los rankings de autores proporcionados. la comunidad científica precisamente ha construido un creciente corpus dedicado a la influencia de la base de datos en el cálculo del h-index. De forma paralela. los investigadores que exhiben un mejor rendimiento académico en WoS. Por ejemplo. independientemente de que el h-index no fuera el completo de los autores (el formado por todos los trabajos publicados por un autor. quienes comparan por su parte la producción de investigadores en Escuelas de negocio canadienses según WoS y Google Scholar. trabajos posteriores obtienen resultados bien diferentes. tras analizar el h-index de 277 revistas de comunicación a través de Google Scholar Metrics. indizados o no en una determinada base de datos). mostrando resultados tan solventes. a partir de las citas obtenidas en WoS. Delgado-López-Cózar y Repiso-Caballero (2014). Franceschet (2009) analiza tanto autores como publicaciones en el área de Informática a través de WoS y Google Scholar. Scopus y WoS para calcular el h-index más fidedigno posible. con un cierto margen de error tolerable. 93 . Por su parte. fiables y válidos como aquellos generados por Web of Science o Scopus. Aparte de constatar las diferencias entre las distintas disciplinas.

93) como con Scopus (r= 0. las autocitas no se pueden eliminar automáticamente en Google Scholar. en el que precisamente se trabaja con la computación de autocitas. Sin embargo. aunque los valores medios del h-index en Google Scholar son prácticamente un 15% y 30% más elevados a los obtenidos en Scopus y WoS respectivamente. y pese a proporcionar valores de h-index más elevados (47% superior a Scopus. dedicado a los productos derivados de Google Scholar. Los resultados indican que. aunque la correlación entre los distintos rankings es elevada. en concreto al Journal Scholar Metrics. un parámetro al que el h-index es sensible. Los autores demuestran que el h-index a nivel individual incrementa en un 24% de media al contar las autocitas. no existen variaciones importantes en las clasificaciones generadas a partir de cada fuente de datos. Rosenstreich y Wooliscroft (2009) destacan que. obteniendo diferentes h-index en función de la base de datos.895 con WoS. Por otro lado. se observa un gran parecido entre los rankings proporcionados por las tres bases de datos (r= 0. las pobres prestaciones de búsqueda que ofrece Google Scholar (que serán detalladas en el apartado dedicado a sus ventajas e inconvenientes) impiden que el trabajo de recopilación y análisis sea rápido y amigable. Lamentablemente. éste exige un proceso de filtrado y depuración importante de datos Otro importante problema que afecta al cálculo del h-index en Google Scholar son las autocitas.97). quienes desarrollan un servicio web denominado CIDS (Citation Impact Discerning Self-Citations) para analizar la influencia de las autocitas en el análisis de impacto de un equipo de investigación en Informática (formado por 72 personas y un corpus de 229 artículos). a pesar de que Google Scholar proporciona una mayor cobertura y citas que Scopus y WoS. obteniendo correlaciones significativas de Scholar tanto con WoS (r= 0. 40% superior a WoS). Una experiencia interesante la constituye el trabajo de Couto et al (2009). Cabezas-Clavijo y Delgado López-Cózar (2013) comparan el h-index obtenido por las revistas más relevantes en el área de Medicina intensiva en WoS.94 La revolución Google Scholar Del mismo modo. r= 0. Este asunto será tratado nuevamente en el Bloque B. Cambiando de disciplina. en este caso en revistas. Zarifmahmoudi y Sadeghi (2012b) comparan igualmente el h-index de los investigadores en este caso en el área de Medicina nuclear en Irán.79 con Scopus). . y que puede ser controlado tanto en WoS como en Scopus (donde existe la posibilidad de excluir las autocitas en el cálculo de ciertos indicadores como el h-index). Scopus y Google Scholar.

tal y como denuncia Jacsó (2012c). Medicina y Física). tanto individuales. aunque ciertamente pueden ayudar a revelar ciertas limitaciones de WoS y Scopus. quien tras realizar un análisis longitudinal (entre abril 2011 y enero 2012) a 20 investigadores galardonados con el premio Nobel (en las disciplinas de la Química. pero eso podría ser irresponsable. las deficiencias de Google Scholar son particularmente voluminosas de tal forma que sus estimaciones de hits no pueden ser aceptadas ni siquiera como punto de partida para la evaluación del rendimiento académico.423 revistas recogidas tanto en Journal Citation Reports (edición 2011. Cabe destacar el trabajo de Harzing (2013a). Estos datos se confirman con el estudio empírico llevado a cabo por Delgado López-Cózar y Cabezas-Clavijo (2013). confiables ni reproducibles) distorsionan los indicadores de métricas. Lancaster según Google Scholar. Scopus y WoS. quienes comparan los hindex de 3. la autora constata (tras un seguimiento mensual durante 2012) que la base de datos presenta menos diferencias entre disciplinas y que la tasa de crecimiento se ha estabilizado (estabilizándose así mismo el crecimiento del h-index en el tiempo). Economía. Podría listar aquí el h-index de F. Jacsó analiza su impacto académico a través de Google Scholar. n= 19. quien expresa que aunque las tres bases de datos (WoS. n= 5. 95 .567). n= 10. En cualquier caso. mostrando información acerca de publicaciones no cubiertas por éstas a la hora de computar el h-index automático que generan (Jacsó.W. destaca que el h-index promedio para los novelistas en Medicina y Física es bastante similar tanto en Google Scholar como en WoS.667) como en Scimago Journal Rank (edición 2011. corporativos como a nivel de revista. A pesar de esta última declaración. lo que puede convertir a Google Scholar en una herramienta mucho más adecuada para la evaluación del impacto de la investigación.708) y Google Scholar Metrics (edición 2007-2011. con el fin de estudiar la forma más real y justa de calcular su h-index. but it would be irresponsible” 8- 9. Jacsó es implacable: “I could list here the h-index of F. Los metadatos creados por Google Scholar (que no son estándar.W Lancaster. En el caso de la Química los datos son superiores en WoS. Los resul 8 Cfr.W.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) Pero no sólo la poca amigabilidad del sistema o la imposibilidad de eliminar las autocitas afectan al cómputo del h-index desde Google Scholar. Scopus y Google Scholar) muestran limitaciones. mientras que en Economía son claramente superiores en Google Scholar. 2008a). los estudios más recientes ofrecen mejores resultados. En el posterior estudio realizado por Anne-Wil Harzing (2014) a partir de la misma muestra de 20 autores. 9 Para celebrar el 75 aniversario de F. Lancaster as reported by Google Scholar.

Posteriormente. excepto para el número de publicaciones en Scopus. a pesar de la falta de estandarización en GSM y de las diferencias en las ventanas de citación entre fuentes. con excepciones en algunos autores específicos cuyo rendimiento en Google Scholar puede ser mucho mayor debido a la idiosincrasia de su disciplina (o mucho menor si su producción científica no está en el espacio público online). Los resultados para los autores con al menos 100 publicaciones en el área “Computer Science” afiliados a la Universitat Politècnica de València se muestran en la Tabla 4 (superior). las correlaciones entre los distintos indicadores son por lo general altas y significativas (α=0. la Tabla 4 constituye sólo un ejemplo con una muestra muy reducida de autores en una disciplina muy concreta (y considerando únicamente a los más productivos). Como se puede observar en la Tabla 4 (inferior). Sin embargo. Por supuesto. En concreto. hemos procedido a identificar los autores más prolíficos en el área de Informática (una de las disciplinas más favorecidas con el uso de Google Scholar) para una determinada universidad (en este caso la Universitat Politècnica de València). correlaciona significativamente con el resto de bases de datos. que no alcanza correlaciones importantes salvo con el número de citas obtenidas en Google Scholar. Con el propósito de mostrar un ejemplo sencillo a la par de útil que ilustre las diferencias entre el h-index computado entre diferentes bases de datos. hemos recopilado el número total de citas y h-index en Google Scholar (a través de los perfiles creados en Google Scholar Citations). Tras ello hemos recopilado tanto el número de publicaciones como el total de citas recibidas y el h-index a fecha de septiembre de 2015.81). aunque superior en valor en Google Scholar. Estos datos refuerzan las ideas mostradas previamente. para estos mismos autores.82).05). por lo que sus resultados no deben generalizarse. .96 La revolución Google Scholar tados obtenidos indican que las tres fuentes posicionan de manera muy similar las revistas (salvo algunas excepciones como PNAS o PLoS One).88) y con el Factor de Impacto de Journal Citation Reports (0. los datos más importantes son que la correlación entre el h-index obtenido en Scopus y el obtenido en Google Scholar es elevado (r= 0. el h-index proporcionado por Google Scholar Metrics (GSM) obtiene una correlación significativa con el h-index de Scimago Journal Rank (0. el hindex. Para ellos hemos utilizado la base de datos Scopus (simplemente por ser más automática la identificación controlada de autores por disciplina dentro de una determinada institución).

Botti 148 1031 16 3227 30 P. Autor Scopus GSC Publicaciones Citas h-index Citas h-index J.82 *0. Lloret 153 739 12 2234 22 V.050 (two-tailed test) 1 97 .T.78 1 h-index GS 0. Julián 135 739 9 1613 22 C. Vidal 110 1942 24 7166 44 J.12 1 h-index Scopus 0.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) Tabla 4. Calafate 119 752 13 2134 23 M. Alcañiz 114 2212 24 -- -- E. Manzoni 148 1031 15 3503 27 J.58 *0. Flich 100 649 14 2112 26 Citas GS h-index GS Artículos Scopus Citas Scopus h-index Scopus Artículos 1 Citas Scopus 0.51 *0.20 *0.91 * Nivel de significancia alpha=0. Autores más prolíficos en la Universitat Politècnica de València (UPV) en área de Computer Science (Scopus. 2015). Pastor 184 970 15 5164 32 P. Duato 249 1611 25 11567 48 O. Rosso 167 629 13 3976 34 J.C.39 0. Cano 143 739 14 2988 24 V.62 *0.80 1 Citas GS 0.

.

aspecto crucial si recordamos el papel que juega Google Scholar en la búsqueda de información académica hoy día. diferentes de aquellos utilizados para la búsqueda general de Google. Los robots de indización asociados a Google Scholar recogen de manera sistemática los metadatos y el texto completo para todos los contenidos que el sistema considera como “académicos” (Breeding.Capítulo 4 Capturando la Web académica: Funcionamiento general En un reciente informe acerca del futuro de las herramientas de descubrimiento. entre las áreas potenciales de acción para la NISO (National Information Standards Organization). Sin duda. Aunque Google Scholar tiene su propio conjunto de robots. la creación de un grupo de trabajo que podría explorar prácticas recomendadas en relación a la presentación de contenido en la Web que maximizaran la exposición e indización de éstos en Google Scholar. con el propósito de aportar un granito de ayuda a aquellas personas que se dedican a la creación y difusión de contenidos académicos en la Web. Este capítulo está dedicado pues a detallar. en el peor de los casos. Marshall Breeding (2015) destaca. aunque presenta unas diferencias importantes especialmente en la indización de los contenidos. 2015). Algunos de estos robots o crawlers están preparados para detectar recursos académicos disponibles en la Web pública e incluirlos posteriormente en el índice de Google Scholar. Documento académico y Web académica El funcionamiento de Google Scholar es similar al de Google. de forma algo más técnica. el funcionamiento y los requisitos de indización de Google Scholar. el desconocimiento acerca de los pilares fundamentales en los que se sustenta el funcionamiento de Google Scholar puede provocar en el mejor de los casos una pérdida de visibilidad e impacto de muchos contenidos y. Google maneja una red masiva de aplicaciones de robots automatizados que recorren la Web en busca de contenido. la más absoluta invisibilidad en el buscador. existen .

Indización de contenidos en Google Scholar La metodología que Google Scholar ha utilizado para determinar qué es un documento académico es bastante más pedestre y pragmática de la que nos podríamos imaginar a priori. y cómo realiza a grandes rasgos este proceso. La cuestión ahora radica en conocer qué entiende exactamente Google Scholar por documento académico y por Web académica. El sistema se basa fundamentalmente en la estructura del documento y en la posterior identificación de cada una de sus partes constituyentes. Resultados y Discusión). Figura 9. aunque el funcionamiento exacto del sistema no sea conocido con exactitud. Pese a ello. salvo dos importantes excepciones (patentes y disposiciones legales) que se detallarán más adelante. siendo un aspecto delimitado generalmente por las normas específicas de una publicación. no existe ninguna norma obligatoria para determinar el tipo. basado en el siguiente orden de elementos: Introducción. Metodología. Aunque existen diversos métodos más o menos implantados para estructurar un documento científico (como por ejemplo el formato IMRYD para el caso de los trabajos de investigación. existen ciertos elementos que deben aparecer en cualquier texto que se considere académico. nomenclatura y orden exacto de los elementos constitutivos de un documento científico (más allá del sentido común). Simplificando. Google Scholar proporciona en su ayuda cierta información orientativa.100 La revolución Google Scholar evidentes sinergias entre ellos. con independencia de la es- . Google Scholar solamente indiza “documentos académicos” alojados en la “Web académica” (Figura 9). en la que se basa gran parte de este capítulo.

Bloque A · Capítulo 4 · Capturando la Web académica tructura organizativa utilizada. —— Que contenga una sección independiente titulada como Bibliografía. Google Scholar considera los siguientes aspectos (Figura 10): —— Que el documento esté encabezado por un título (a ser posible en una fuente mayor que el resto del documento). Aunque ciertamente no existen normas universales para estructurar un documento. liberar esta primera página (tal y como hace JSTOR. y que la estructura puede variar en función de la tipolo- 101 . —— Que tenga resumen. entre otros. ya comentado en el capítulo 1) es una práctica válida. Estructura de un documento científico en Google Scholar De todos estos puntos. el resumen es completamente obligatorio (tal y como ya se ha comentado previamente). referencias. unos autores o una bibliografía. Como en algunas publicaciones el resumen va incrustado en la primera página del documento. Un documento sin resumen no será indizado en Google Scholar. como son un título. o similar. —— Que posea unos autores (deben mostrarse justo debajo del título en una línea separada). Siguiendo este principio. Figura 10.

En la Tabla 5 se puede observar. asunto que trataremos en la sección dedicada al proceso de indización y a los requisitos técnicos específicos que deben cumplirse. Entre éstas destacan las siguientes entidades: —— —— —— —— —— —— —— Universidades e instituciones de educación superior. Repositorios temáticos. 1 Los datos se han obtenido mediante la aplicación del comando de búsqueda “site”. dada la estructura de sus sedes web. y además está sujeto a procesos de redondeo de datos en la estimación de resultados que proporciona el buscador. pueda estar indizada correctamente en Google Scholar. se debe indicar la existencia de acuerdos comerciales no públicos entre Google Scholar y ciertas editoriales privadas. autor. Una vez determinado qué es un documento académico para Google Scholar. En este punto. . Bases de datos bibliográficas. de la que Google Scholar se nutre y alimenta. siendo por ello un método sencillo de implementar y con ciertas garantías de éxito a la hora de determinar si un documento es o no científico. Servicios de distribución o almacenaje. Google simplemente confía en los espacios públicos web proporcionados por diferentes entidades y organizaciones con cierto marchamo científico o académico. las disciplinas o las normas concretas de una editorial. Adicionalmente. resumen y referencias bibliográficas) es común en la inmensa mayoría de documentos académicos. no se prestan de forma adecuada a este análisis (basado en calcular la cantidad de documentos alojandos en su dominio web). el buscador incorpora a su base de datos los contenidos correspondientes. En cualquier caso.102 La revolución Google Scholar gía documental. nos sirven para reflejar la amplitud y diversidad del espacio académico web. la existencia de estos elementos (título. la cantidad de documentos recopilados por Google Scholar de algunas de las entidades más representativas. Por otra parte. el segundo requisito para la incorporación de un documento a la base de datos es que este recurso esté alojado en la llamada “Web académica”. Aunque estos datos no deben ser tomados al pie de la letra (no son más que estimaciones) 1. por supuesto. En estos casos. Este parámetro no es exhaustivo. aunque no esté exento de errores y causísticas. Editoriales comerciales. algunas instituciones. a modo de ejemplo. Organismos públicos de investigación. nada impide que otro tipo de institución (pública o privada). Otros motores de búsqueda académicos.

especialmente si el proceso se ha realizado en alguna plataforma diseñada con algún tipo de software especial (por ejemplo Dspace o EPrints en el caso de los repositorios.300 Arxiv arxiv.es 31.es 71.com 485.260.670. y no los incorporados directamente debido a cualquier tipo de acuerdo) de forma que sirva igualmente para ilustrar de forma más didáctica su funcionamiento a los lectores menos familiarizados con esta base de datos.987.nlm.000 Bases de datos Pubmed ncbi.000 Dialnet dialnet.000 Wiley onlinelibrary.000 Emerald emeraldinsight.400 Consejo Superior de Investigaciones Científicas (CSIC) csic.nih.Bloque A · Capítulo 4 · Capturando la Web académica Tabla 5.wiley.edu 660.000 ELIS eprints.jp 13.000 Social Science Research Network ssm.100.000 Max Planck Gesellschaft mpg.700 National Institute of Informatics nii.440.com 343. Sin embargo.psu.000 CiteseerX citeseerx.de 85.000 Organismos de investigación Repositorios temáticos Plataformas de editoriales comerciales Motores de búsqueda académicos Proceso y requisitos de indización En el momento en que un usuario deposita un documento en un espacio considerado por Google Scholar como académico.000 Servicios de distribución Ingenta Connect ingentaconnect.com 8. procederemos a continuación a detallar el proceso de indización que sigue Google Scholar desde el principio paso a paso (centrándonos exclusivamente en los contenidos incorporados automáticamente por un crawler. el sistema automáticamente indizará el nuevo registro en la base de datos.600 Stanford University stanford.org 3.com 229. 103 .es 2.rclis.ist. como Google Scholar.430. que disponen de módulos especialmente diseñados para describir los documentos (insertar metadatos) y que sean recolectados por los robots de los motores de búsqueda. o bien OJS en el caso de publicaciones periódicas).edu 39.700 Elsevier sciencedirect.unirioja.com 5. dado que esto no siempre sucede así (por diversos motivos que iremos relatando a lo largo de este capítulo).org 11.edu 86.gov 3. Tipos de entidades en el espacio académico web TIPO DE ENTIDAD ENTIDAD URL REGISTROS Universidades MIT harvard.ac.900 Universidad de Granada ugr.

Figura 11. si es un repositorio. el sistema accederá al URL correspondiente para verificar una serie de parámetros y requisitos técnicos que deben cumplir las sedes web para que sus contenidos sean admitidos.104 La revolución Google Scholar Estas fases de indización están fundamentalmente orientadas a los webmasters o personas encargadas de la puesta a punto de las sedes web que deben albergar los documentos académicos que Google Scholar indizará en su base de datos y no al usuario final (que se limitará a depositar un documento en una plataforma siguiendo unos sencillos pasos). esta información puede ser vital para lograr una correcta indización en la base de datos.google. Para ello. Interfaz de solicitud de inclusión en Google Scholar Fuente: Google Paso 2: requisitos básicos Una vez el usuario ha seguido los pasos de la solicitud de inclusión comentados previamente. una revista u otro tipo de sede web (Figura 11). 2 https://support. aunque en algunos casos particulares (como por ejemplo las páginas personales de los académicos alojadas fuera del espacio web de la universidad). por ejemplo. el buscador dispone de una interfaz desde la que el webmaster debe indicar qué tipo de sitio web desea dar de alta en el sistema 2. Paso 1: inclusión en la Web académica El primer paso que debe realizarse es la solicitud de inclusión en Google Scholar.com/scholar/troubleshooter/2898950?rd=1 .

pese a que no existe restricción técnica alguna para su correcta indización. Respecto al primer punto. Esta decisión permite que los contenidos de pago (no sólo artículos de revistas sino monografías) puedan ser indizados si éstos ofrecen al menos el resumen del documento. —— Tamaño: ficheros que no superen los 5 MB. se deben tener en cuenta adicionalmente dos puntos importantes para asegurar una correcta indización: 105 . el 69.765 documentos a texto completo analizados por Jamali y Nabavi (2015). Por último.3% en HTML. PPTX). PPT.Bloque A · Capítulo 4 · Capturando la Web académica Para que el sitio web sea correctamente admitido. pues estos formatos suelen transformarse en PDF antes de ser depositados en la Web. reflejando de este modo las dos realidades (online y offline) que predominan actualmente.000 documentos altamente citados en Google Scholar analizados por MartinMartin et al (2014). de donde Google Scholar los identifica e indiza. PDF. están claramente en desuso dentro de Google Scholar. el sistema introduce una serie de limitaciones técnicas que deben conocerse de forma obligatoria. Los documentos ofimáticos (principalmente DOC. Estos datos reflejan por sí mismos la importancia de estos ficheros en la base de datos. Un documento sin resumen no será incluido en Google Scholar. De los 4. Entre los 64. En su defecto. DOCX. éste debe ofrecer de forma gratuita y fácil de consultar (cuando un usuario hace clic en un resultado de búsqueda en Google Scholar). Paso 3: Formatos de fichero Aparte de la identificación de un contenido como un recurso académico gracias a su estructura. puede servir de sustituto la primera página del artículo o documento. al menos uno de los siguientes recursos: texto completo o resumen. los documentos sin información de autores o sin título pueden igualmente ser excluidos automáticamente. el 86% lo constituían documentos en formato PDF y el 12% en HTML. PDF (GZ).2% se encontraban en PDF y el 30. En el caso de los ficheros PDF. Volvemos a incidir en que el resumen es un elemento completamente obligatorio. sin necesidad de que el texto completo esté accesible. entre las que destacan las siguientes: —— Tipos de ficheros admitidos: HTML. aunque el formato PDF ya puede ser legible directamente desde un navegador web. PS (GZ). los tipos de ficheros más recomendados son HTML y PDF.

tesinas y otros documentos de trabajo. En el caso de ficheros PDF que son el resultado de un proceso de digitalización.com/books/uploads 4 Google Scholar automatically includes scholarly works from Google Book Search. por ejemplo). siempre y cuando no se incumpla ninguno de los requisitos técnicos impuestos.google. En la ayuda de Google Scholar se indica claramente que los libros. https:// scholar.com/intl/en/scholar/inclusion.google. Es importante por tanto tener en cuenta este punto para cumplir con esta especificación. En otros casos se aconseja reducir el tamaño de los ficheros PDF antes de ser depositados en la Web. Respecto a la segunda restricción. En algunos sistemas de repositorios la especificación del tipo de fichero se omite. aunque es una opción que no recomienda Google Scholar. como veremos más adelante. Esto afecta especialmente a diversas tipologías documentales académicas. De esta forma.106 La revolución Google Scholar —— El fichero debe ser legible por texto. Una posible forma de eludir parcialmente este problema es crear una página web de inicio en la que se ofrezcan todos los metadatos del documento (sin olvidar el resumen) y un enlace al texto completo. Es decir.pdf”. ni de extraer por tanto citas. no debe estar en formato imagen. Todo fichero que supere los 5 MB no será indizado en Google Scholar. el sistema limita el tamaño máximo de los ficheros. con la gran cantidad de planos y pliegos de condiciones de un proyecto arquitectónico. monografías y trabajos finales de carrera. Google Scholar sí podría indizar el documento a partir de los metadatos ofreciendo adicionalmente el enlace al texto completo. cuya presencia es común en los repositorios institucionales de una universidad (pensemos por ejemplo en un trabajo final de grado de un estudiante de Arquitectura. como son las tesis doctorales.html#content . —— El nombre del fichero PDF que contenga el documento a texto completo debe terminar en “. Igualmente. monografías y trabajos que superen el tamaño máximo podrán ser depositados en Google Books directamente por parte de los autores 3. 3 https://play. los documentos deberán ser transformados obligatoriamente a través de un programa de reconocimiento óptico de caracteres OCR (Optical Character Recognition) antes de ser depositados en la Web. se indica claramente que Google Scholar incluye automáticamente los trabajos académicos desde Google Books 4. El troceado de un documento en diversos ficheros más ligeros es igualmente posible. Es importante tener en cuenta que Google Scholar es incapaz de detectar los caracteres incrustados en un fichero tipo imagen.

Figura 12. En el primer caso el fichero tiene un peso de 7. Para ello hemos recogido dos tesis doctorales del repositorio institucional de la Universidad de Granada (Digibug) 5.Bloque A · Capítulo 4 · Capturando la Web académica En la figura 12 se muestra un ejemplo de la indización en Google Scholar en función del peso.39 MB y en el segundo de 1.es/ 107 . Indización para ficheros de más de 5MB de tamaño 5 http://digibug.ugr. Finalmente hemos procedido a buscar estos dos documentos en Google Scholar.1MB.

etcétera: 6 http://www. es fundamental verificar que el sitio web permite la entrada del robot de búsqueda de Google Scholar porque si está excluido (en ocasiones los webmasters excluyen la entrada de ciertos robots porque pueden ralentizar el sitio web o ser potencialmente dañinos). En cualquier caso. el sitio web no será indizado. inservibles para la localización de registros. ofreciendo acceso al texto completo de la tesis en la parte derecha de la pantalla. se debe bloquear a los robots para que no accedan a páginas dinámicamente generadas. y tras múltiples búsquedas realizadas. Entendemos que la norma no supone un umbral fijo y exacto o que no funciona al 100% de su efectividad. el segundo fichero sí se encuentra integrado de forma completa (Figura 12. Pero el texto completo no se encuentra directamente accesible desde Google Scholar. apareciendo bajo la etiqueta de “Citation”. siguiendo los consejos del Robot Exclusion Protocol 6: User-agent: Googlebot Allow: / De forma contraria. como los carritos de compra. En cambio. se aconseja introducir el siguiente código en el fichero “robots. Paso 4: requisitos técnicos (I): aceptar la visita Aunque pueda parecer obvio. a pesar de ello. se aconseja tener en cuenta el límite de 5MB impuesto por Google Scholar. los autores hemos constatado que en ocasiones existen documentos PDF que superan las restricciones de tamaño y. han sido indizados en Google Scholar.org . A pesar de esta restricción.txt” del sitio web. y para evitar posibles problemas en la indización de ciertas tipologías documentales.108 La revolución Google Scholar El primer fichero (Figura 12. formularios.robotstxt. arriba) no se encuentra indizado en Google Scholar de forma completa. abajo). Para asegurarse de que el crawler de Google Scholar no está bloqueado. que ofrece un acceso a la URI del documento (donde se encuentran los metadatos y desde allí el acceso al texto completo proporcionados por el repositorio).

Para cumplir con este objetivo. una página web debe evitar requerir a los usuarios (o robots de búsqueda). Por supuesto. cursos OCW. Clicar en enlaces. Por ello todos sus esfuerzos van encaminados a que los ficheros sean localizados en el menor número de clics. pulsar botones o desplazarse por la página (scroll). el sistema impone una serie de restricciones técnicas a los sitios web. pueda acceder directamente al texto completo o al resumen. Esto es especialmente importante en las sedes web de las universidades. Rechazar ventanas emergentes o anuncios intersticiales. en las que una gran parte de los contenidos están accesibles únicamente a los alumnos o profesores una vez se han identificado con sus cuentas de usuario en la intranet (material docente. Aceptar disclaimers. al clicar en alguno de éstos. Paso 5: requisitos técnicos (II): usabilidad El objetivo fundamental de Google Scholar es facilitar al usuario la localización rápida y sencilla de los documentos académicos. esto facilita igualmente el trabajo de sus robots y sus procesos automáticos de indización de documentos. como se ha comentado anteriormente.php De esta forma. Instalar software especial. En concreto. respecto a los sitios en los que se requiere una contraseña para acceder a los contenidos. y que pueden ralentizar y complicar su trabajo de indización del sitio web. Entre las restricciones anteriores cabe destacar la primera. Google Scholar no lo indiza. las siguientes acciones: —— —— —— —— —— Identificarse como usuarios registrados. 109 .Bloque A · Capítulo 4 · Capturando la Web académica User-agent: * Disallow: /add_cart. antes de leer el resumen (o texto completo). Si el usuario no puede acceder a un contenido. tras realizar una consulta determinada en el cajetín de búsqueda de Google Scholar y haber obtenido un conjunto de resultados. El fin es que un usuario. sino que Google Scholar no pierda tiempo en rastrear lugares donde no va a localizar información académica. no sólo evitamos que el robot pueda acceder a zonas restringidas.

la indización se realizará de forma incorrecta. que lo identifique unívocamente en la Web.). Pensemos por ejemplo en las monografías por capítulos o en las actas de congresos.es/editum/catalog/book/1151 . Toda documentación en una intranet será opaca a Google Scholar. coordinado por Rosa Nortes Martínez Artero y José Ignacio Alonso Roque. Paso 6: requisitos técnicos (III): identificación de ficheros La identificación y localización de los ficheros es igualmente clave para el correcto funcionamiento de Google Scholar.um. Por tanto: Evitemos los ficheros con más de una obra intelectual: Un fichero PDF puede contener en realidad una amplia cantidad de obras intelectuales independientes. Veamos un ejemplo para ilustrar este enorme problema. pero no así cada uno de los capítulos o partes. donde cada capítulo o artículo constituyen obras completamente independientes (en contenido y autoría). La regla a seguir es clara: cada registro debe corresponder con un documento académico y debe disponer de su propio URL. que podrían de hecho estar recibiendo citas de forma independiente. obedece al mero desconocimiento o desinterés. En ocasiones. Es decir. Si ese PDF (constituido por una multitud de trabajos académicos individuales) es depositado directamente en un repositorio u otra plataforma para hacerlo accesible a Google Scholar.110 La revolución Google Scholar etc. que podemos localizar en el sitio web del servicio de publicaciones de la Universidad de Murcia (Editum) 7. La obra completa quedará bien registrada. Si buscamos la obra colectiva “Investigación educativa en educación primaria”. superior). proteger ciertos derechos de propiedad intelectual o proporcionar ventajas competitivas sólo a sus usuarios. que simplemente quedan relacionadas al estar compiladas en un mismo volumen. el almacenamiento de documentación académica en intranets o zonas restringidas puede obedecer a políticas web específicas dentro de una institución u organización para asegurar la confidencialidad de cierta información. Esta obra está compuesta por 37 capítulos completamente independientes (Figura 13. constituye un buen ejemplo de libro por capítulos como tipología documental. pues no se cumplirá la regla de una obra igual a un URL. en otros muchos casos. 7 http://libros.

“El cuento. “Efecto de una unidad didáctica de resistencia aeróbica basada en juegos sobre la capacidad cardio-respiratoria de escolares de 5º curso de primaria”. En estos casos. si buscamos cada capítulo de libro de forma independiente. solamente existe un URL vinculado al registro 9.Bloque A · Capítulo 4 · Capturando la Web académica Si buscamos esta obra en Google Scholar. inferior). medio). no podremos identificarlos (Figura 13. Google Scholar ha obviado completamente la información de la estructura de esta monografía. una ventana hacia el aprendizaje”. “¿Qué programas de televisión ven los alumnos de educación primaria? preferencias según su nacionalidad”. “Relaciones entre autoestima. privando a sus respectivos autores no sólo de la publicación sino de las posibles citas recibidas. En el caso de ejemplo anterior. “Estudio sobre el consumo televisivo de los escolares de educación primaria de la región de murcia”. “HIDEA: cuestionario de aproximación diagnóstica contextualizado del trastorno por déficit de atención e hiperactividad (TDAH)”. pero no los cataloga como registros independientes. Aunque a nivel técnico es una solución completamente válida. En cambio. de forma que cada nuevo fichero tenga un URL propio que lo defina e identifique en la Red.um. a nivel de posicionamiento en buscadores no es la más adecuada. Google Scholar sólo ha sido capaz de describir de forma independiente 9. “La participación de las familias en contextos educativos multiculturales: hacia una escuela intercultural e inclusiva”. aptitudes intelectuales y rendimiento académico: un estudio en alumnos de educación primaria”. De los 37 capítulos. “Libros interactivos multimedia (LIM) al servicio de la competencia comunicativa oral y escrita en educación primaria”. 9 http://libros. y en algunos casos por existir diversas versiones 8. En definitiva.es/editum/catalog/download/1151/1821/1421-1 111 . El resto de capítulos se localizan porque Google Scholar detecta que aparecen en el sumario de la obra colectiva. se aconseja crear un fichero independiente para cada obra intelectual existente y posteriormente depositar cada uno de ellos por separado. 8 En concreto los siguientes capítulos: “Comparación de la intensidad del esfuerzo de actividades cardio-respiratorias en función de la estructura de la sesión en escolares de primaria”. que además no coincide a nivel jerárquico con el URL que contiene la información bibliográfica (el registro de la obra completa está alojado en la carpeta “downloads” mientras que la información bibliográfica está en la carpeta “books”). la podemos localizar sin problemas (Figura 13.

112 La revolución Google Scholar Figura 13. capítulo de libro no localizado en Google Scholar (inferior) Este problema de indización tiene una solución sencilla conceptualmente. Evitemos dividir una obra en distintos ficheros: El caso contrario ocurre cuando un fichero que contiene una única obra intelectual se desea particionar o dividir en diversos ficheros para facilitar su carga/descarga o el acceso a cierto material complementario . obra localizada en Google Scholar (medio). Además. supone adecuar una sede web a los requisitos particulares impuestos por una determinada base de datos privada. Tratamiento de obras colectivas a Google Scholar: obra localizada en servicio editorial (superior). o en grandes colecciones de actas de congresos). pues implica tener que adecuar toda una colección de monografías y sus respectivos capítulos (pensemos en grandes servicios editoriales con cientos de libros y miles de capítulos de libro. que retomaremos en el capítulo final. aunque costosa económicamente. lo que implica una discusión no menos intensa.

net/10481/35673 http://hdl. En el caso de que fuera imposible obtener un único fichero PDF que incluyera todo el contenido y cuyo peso fuera inferior a los 5MB. En la segunda opción. pues solamente ofrece enlace a un fichero. Google Scholar no sabría cuál de los ficheros PDF debería mostrar como acceso a texto completo. se muestran dos URLs que pertenecen a dos tomos de una misma tesis doctoral: http://hdl. La exclusión del texto completo de un documento puede tener un 10 A continuación. resumen y bibliografía). informar a Google Scholar del URL con el documento a texto completo. se muestra un URI al que se asocian 5 ficheros de una misma tesis doctoral: http://digibug. Por tanto. asegurando que al menos sólo existe un URI único.handle. al menos el título del documento debería tener un elemento diferenciador (tomo 1. En el caso de que finalmente se mantuvieran varios ficheros para una misma obra. dadas las restricciones técnicas de Google Scholar a este respecto. y no uno por registro 11. y siguiendo con la norma de “una obra un URL”. a través de los metadatos asociados al registro. parte 1.Bloque A · Capítulo 4 · Capturando la Web académica de forma independiente. Este podría ser el caso de una tesis doctoral que. dada su extensión. al exportarse a un fichero electrónico. Ambas opciones deberían evitarse en la medida de lo posible. se consideraría una mala práctica la fragmentación del contenido pues cada fichero dispondría de un URL independiente y Google Scholar podría no comprender que se tratan de diferentes partes de una misma obra. En estos casos. que podría depositarse o bien en Google Books (para intentar asegurar su indización completa en Google Scholar) o en cualquier repositorio (si el fichero superara los 5MB no se indizaría a texto completo). es importante seguirlas y cumplirlas en la medida de lo posible. etc.ugr.handle. autores.es/handle/10481/6142 113 . se aconsejaría la creación de un fichero adicional que incluyera la información clave (título. se hubieran generado los correspondientes ficheros (un PDF por tomo). se hubiera publicado en varios tomos y.) y posteriormente el autor podría al menos fusionar ambos registros en su perfil académico personal en Google Scholar Citations (como se verá en el bloque B). de forma que Google Scholar indizara al menos correctamente la obra completa y.net/10481/35674 11 A continuación. una opción sería la de generar distintos registros separados (cada uno con un fichero) 10 o bien la de reunir en un mismo registro todos los ficheros. En el primer caso.

pdf . compuesto por dos ficheros PDF 12.ugr.es/tesis/VeraCasares_acciones-caracter-formativo-tercera-edad. solamente encontraremos el documento si buscamos por las palabras del título. resumen y palabras clave (en definitiva. ante cualquier búsqueda que se realice. pequeños detalles pueden impedir no sólo el buen posicionamiento de un documento en un motor de búsqueda académico (será más difícil de localizar) sino que puede impedir además su indización en el sistema (que puede influir claramente en el impacto en citas). en ocasiones los usuarios ni siquiera son conscientes de que el texto completo no está indizado. por los campos del fichero descriptivo o metadatos).ugr. algo imposible si no es capaz de leer el documento a texto completo.pdf y 2460_2.pdf Obviamente. por lo que su personalización puede ser compleja y 12 El URL a cada fichero es el siguiente: http://digibug. pues éstos impiden un correcto posicionamiento de los contenidos. las plataformas utilizadas (como los repositorios) automatizan estas tareas. específicamente remarcadas en la ayuda de Google Scholar. Veamos como ejemplo un registro correspondiente a una tesis doctoral depositada en el repositorio Digibug.pdf http://digibug. Además de las limitaciones técnicas. los resultados en posicionamiento académico web podrían ser abismales: http://digibug.pdf. y no siempre los usuarios son conscientes de ello. símbolos y códigos alfanuméricos.114 La revolución Google Scholar efecto negativo en su visibilidad. En ese sentido se desea remarcar nuevamente que una cosa es que Google Scholar identifique y describa un documento (apareciendo por tanto en los resultados de búsqueda como un registro) y otra muy distinta que ofrezca un enlace directo al texto completo. la disposición del texto completo permitirá la extracción de las posibles citas contenidas en el documento. Entre los URL existentes y otro posible URL amigable (como el propuesto a continuación). Google Scholar podrá bucear dentro del texto para localizar en él la aparición de los términos de búsqueda y devolver. Además. con los útiles a la par de semánticos nombres de 2460_1. Es más. El nombre de los ficheros debe contener información semántica (especialmente información del autor y título) y el URL final debe evitar diacríticos.es/bitstream/10481/14556/1/2460_1.ugr. En caso contrario.ugr.pdf http://digibug. si procede.es/bitstream/10481/14556/1/2460_1. el documento en cuestión entre los resultados. Si el documento está correctamente indizado. autor.es/bitstream/10481/14556/2/2460_2.

al llegar a la página principal de un sitio web. inferior a 5MB y que corresponda con una obra académica independiente. se recomienda que cada artículo sea accesible desde la página de inicio. podríamos encontrarnos de nuevo o con un fichero (texto completo o resumen) o bien con otro hiperenlace. En ésta. Si pulsamos en el hiperenlace (contamos 1 enlace) accederíamos a una segunda página. en ambos casos con sus metadatos correspondientes) o bien un hiperenlace. Es decir. un usuario.Bloque A · Capítulo 4 · Capturando la Web académica tediosa en ocasiones. siguiendo un máximo de 10 enlaces. Las recomendaciones anteriores van encaminadas a la disposición de un URL por fichero (a poder ser HTML o PDF). En concreto. Adicionalmente. Figura 14. En la figura 14 se ejemplifica gráficamente el proceso. pero deberían estar siempre contemplados en los momentos iniciales de diseño. Este proceso podría 115 . Google Scholar propone algunas recomendaciones para acceder de forma sencilla a estos ficheros al navegar por el sitio web académico correspondiente. Esquema de enlaces posibles hacia el fichero final Desde la página de inicio de un sitio web podemos encontrarnos directamente un fichero (a texto completo o resumen. debería poder llegar al texto completo (o resumen) de una obra en menos de 10 clics.

En la figura 15 se observa un ejemplo de metadatos asociados a un documento. para facilitar la tarea al robot de búsqueda. Figura 15. debería accederse directamente al recurso final con el texto completo. se recomienda crear un fichero HTML con un enlace al URL de cada documento. se proponen las siguientes recomendaciones: —— Hasta 1. —— Si se manejan cientos de miles de documentos. —— Si se manejan miles de documentos. Un número superior de pasos supondría una complejidad excesiva para el robot de búsqueda a la hora de indizar los contenidos académicos del sitio web. se recomienda crear una interfaz de búsqueda adicional que liste los artículos incluidos sólo en las dos últimas semanas (para indizar rápidamente las novedades). se recomienda proporcionar una forma de ordenar los registros por fecha de publicación o fecha de registro. Es importante indicar que las etiquetas “citation_title”. Por otra parte. “citation_author” y “citation_publication_date”. con el fin de obtener una descripción bibliográfica de los mismos.116 La revolución Google Scholar repetirse hasta un máximo de 10 veces. Ejemplo de esquema de metadatos recomendado La exportación de datos bibliográficos debe configurarse preferentemente mediante meta-etiquetas HTML. etc. desde la página de resultados del buscador. nombre del autor . correspondientes al título del documento. En el caso de sitios web complejos con cantidades grandes de documentos (editoriales. se proporcionan una serie de recomendaciones a la hora de crear los metadatos asociados a cada registro.000 documentos.). Paso 7: requisitos de indización: metadatos y maquetación Por último. repositorios.

Bloque A · Capítulo 4 · Capturando la Web académica y fecha de publicación. 117 . Por tanto. Por otra parte. para los ficheros PDF se propone como alternativa una indización sin meta-etiquetas. título de la revista…). Dublin Core es un esquema de metadatos sencillo que no incluye un campo de información específico para el número de citas recibidas por los documentos. Estas directrices están principalmente orientadas a los ficheros HTML. Eprints. Por defecto. BE Press y PRISM. en el caso de que no esté incluido en el documento actual. mediante la clase “citation_title”. número. si lo que deseamos es estar correctamente indizados en su base de datos. utilizar la etiqueta “DC. La importancia de este último punto es máxima. Mediante la etiqueta “citation_pdf_url” se puede redirigir al robot de búsqueda al URL que contenga el texto completo. entre otras). cuyas principales características se describen a continuación: Título: —— Usar el tamaño de fuente más grande del documento. —— Usar Dublin Core como última opción. se indican las siguientes consideraciones generales: —— Google Scholar soporta los esquemas Highwire Press. cuando Google Scholar claramente nos indica que no debería utilizarse. La razón por la que probablemente Google Scholar ha adoptado esta decisión es sencilla. Adicionalmente. ¿qué utilidad proporciona Dublin Core a Google Scholar? La respuesta es ninguna. Dublin Core no proporciona etiquetas unívocas para los datos bibliográficos de un artículo académico publicado en una revista (volumen. a menos que se sigan ciertos patrones de uso recomendados por el equipo de Google Scholar (por ejemplo.title” únicamente y exclusivamente para el título del artículo. —— Usar CSS. son obligatorios para la correcta indización. —— Emplear etiquetas <h1> ó <h2>. páginas. Este hecho ha sido empíricamente estudiado por Arlitsch y O’Brian (2012) para diversos repositorios institucionales norteamericanos y posteriormente por Orduña-Malea y Delgado López-Cózar (2015) para el conjunto de repositorios latinoamericanos. La pérdida de visibilidad que este hecho puede suponer a los repositorios es importante si no se corrije. siendo éste uno de los indicadores clave para el posicionamiento de los resultados de búsqueda. los repositorios como DSpace funcionan con Dublin Core.

118 La revolución Google Scholar Autores: —— Deben situarse inmediatamente antes o después del título. . [2]… En HTML: incluir la etiqueta <ol>. “bibliography”. —— Usar CSS. como “references”. Referencias bibliográficas: —— Utilizar una cabecera estándar. Información bibliográfica: —— A incluir en la cabecera o pie de página de la primera página. —— Usar etiquetas <h3>. Fuentes: —— Evitar fuentes Type 3 en los PDF. mediante la clase “citation_author”. —— Las referencias individuales pueden ser numeradas: En PDF: [1].

A lo largo de este capítulo se describen los principales trabajos aportados por la literatura científica en torno a la cobertura de Google Scholar. tanto bibliotecarios (más centrados en la faceta de buscador de contenidos) como especialistas en bibliometría (más enfocados a la faceta de fuente de evidencia de impacto científico). No se trataba de comparar los resultados devueltos por distintos buscadores y bases de datos (aspecto ya tratado en el capítulo 2). pero de gran importancia para los profesionales de la información. sino de comparar el material existente en una editorial y los registros que Google Scholar era capaz de recopilar ante una consulta delimitada a dicha editorial. tamaño y evolución La cantidad y calidad de los contenidos alojados en Google Scholar sigue siendo motivo de agrias y en ocasiones estériles discusiones. El desconocimiento de la cobertura real y la política opaca de la compañía californiana han desencadenado una multitud de elucubraciones acerca del verdadero tamaño de la base de datos. El hecho de co-existir ciertas limitaciones técnicas y acuerdos comerciales ha provocado que algunos contenidos académicos en abierto puedan no estar incluidos en el buscador y sí lo estén en cambio algunos contenidos de pago. La ausencia de una master-list de publicaciones. Cobertura opaca y dinámica Durante el primer lustro del Siglo XXI se sucedieron diversos estudios en los que se deseaba conocer la tasa de indización de Google Scholar para determinadas editoriales y fuentes de contenidos con el firme propósito de testar profesionalmente el producto. así como a su tamaño y evolución. editoriales o al menos fuentes de contenidos ha avivado sin duda este debate.Capítulo 5 El retrato de Google Scholar Cobertura. . de forma que ayuden a retratar mejor al buscador académico. tal vez de menor importancia para la mayoría de usuarios finales (y por tanto de menor importancia para los responsables de Google Scholar).

desarrollado por Peter Jacsó precisamente con el propósito de conocer la cobertura de Google Scholar para determinadas editoriales. Este método permitía conocer el grado de indización de algunas editoriales. Igualmente se descubrieron ciertas inconsistencias en los resultados devueltos en determinados idiomas. Aunque la última actualización data del 22 de octubre de 2005 y el sistema ya no funciona correctamente. que Jacsó (2005a) comprobara que a mediados de abril de 2005 existía un retraso de 6 meses en la actualización de la base de datos de Google Scholar. Los trabajos comparativos entre la cobertura de Google Scholar y las distintas editoriales permitieron. permitía comparar los contenidos alojados en una editorial (y recuperados por su propio buscador) con los resultados que Google Scholar tenía indizados de ese lugar. constataran que el material más reciente estaba mejor recogido en Google Scholar que el material antiguo. japonés o arábigo. la interfaz sigue online (Figura 16). aunque de forma un tanto pedestre. Figura 16. Şenol y Yanar (2008) detectaban errores en la recuperación de caracteres especiales en turco. que Neuhaus et al (2006) detectaran un retraso de al menos 3 meses en la actualización de la información de BioMed Central o que Bauer y Bakkalbasi (2005). . lo que permitía obtener un nuevo retrato de Google Scholar. Interfaz de Polysearch El buscador. por ejemplo. tras realizar un análisis de citas a la prestigiosa revista Journal of the American Society for Information Science and Technology (JASIST). Noruzzi (2005) observa que Google Scholar no indizaba artículos en persa.120 La revolución Google Scholar Debemos destacar muy especialmente el sistema Polysearch. El sistema permitía a grandes rasgos comparar los resultados de una búsqueda directa en el buscador online de una editorial con los resultados de esa misma búsqueda realizada en Google Scholar y restringiendo la búsqueda al dominio web de la editorial. chino. mientras que Kesen.

tras tomar muestras aleatorias en 8 bases de datos distintas. Estos datos son contrastados posteriormente por Chen (2010) quien. Christianson (2007). quienes calculan la cobertura de Google Scholar en función de diversas editoriales. En concreto. Google Scholar proporcionaba una cobertura del 88% a las revistas del Social Science Citation Index. mientras que el porcentaje promedio ronda el 95% para el resto de las revistas. comprueba que Google Scholar solo indiza el 66% de éstos y Lewandowski (2010) comprueba por su parte la indización en Google Scholar de 35 revistas del área de Library & Information Sciences en el período 2004-2006. advierte que la cobertura de Google Scholar oscilaba entre el 30% y el 88% en 2005. cuando precisamente años atrás se había discutido la deficiente cobertura de ésta en Google Scholar. Por otra parte. Bakkalbasi et al (2006) detectan que tras noviembre de 2005 la cobertura de Google Scholar da un salto espectacular. un 86% a las del Science Citation Index y sólo de un 81% a las revistas incluidas en el Arts & Humanities Citation Index. y en el trabajo de Neuhaus et al (2006). tras seleccionar 960 artículos de Ecología en la base Compendex. Los datos son sorprendentes pues reflejan un 100% de cobertura en el caso de Pubmed. Todos estos estudios empíricos deben no obstante contextualizarse en el tiempo. aunque con importantes diferencias entre éstas.Bloque A · Capítulo 5 · El retrato de Google Scholar Otros trabajos han detectado deficiencias en la cobertura y actualización de Google Scholar. Los efectos de la evolución de la cobertura de Google Scholar se observan igualmente en el trabajo realizado por Meier y Conkling (2008). Mayr y Walter (2006. desde un 33% en los 1950s hasta un 88% en los 2000s. detectan carencias importantes en revistas de acceso abierto. Por ejemplo. quienes observan un crecimiento de la cobertura de Compendex en Google Scholar (a partir de una muestra de registros) a lo largo del tiempo. pues la cobertura de Google Scholar ha demostrado ser muy dinámica. Este dinamismo y crecimiento irregular de Google Scholar ha propiciado por tanto que muchos estudios acerca de su cobertura hayan 121 . 2007) constatan la ausencia de revistas importantes sí indizadas en WoS. Así mismo. y en la cobertura de revistas de sociología en alemán. Teniendo en cuenta que los autores consideraban indizada una revista si al menos un artículo estaba indizado en Google Scholar. la cobertura real podría ser dramáticamente menor. por lo que los sesgos o deficiencias advertidos durante los primeros años han ido desaparenciendo en su mayor parte. pero que asciendía al 98% en 2010. Los resultados obtenidos muestran que la indización completa al 100% solamente es lograda por 8 revistas.

en ese caso WoS se convertiría en un subconjunto de Google Scholar. tras ello vino un proceso de rápido crecimiento (Harzing. Estos resultados llevan a los autores a concluir que Google Scholar presenta importantes sesgos por disciplinas y que no es todavía una herramienta válida para la búsqueda de información académica en las Humanidades. por cuestiones de política de publicaciones de algunas de sus principales editoriales). en sus primeros años la disciplina de la Química estuvo mal representada (como vimos. mientras que los defensores de Google Scholar argumentan que éste podría cubrir en breve la tesis de Kilmour del 100% de disponibilidad de la información (Kilmour. Educación. Los defensores de WoS argumentan que esta base de datos actúa como filtro de alto nivel frente al ruido (Winter. 2014). al incorporar todo el material que localiza. sino para la evaluación de su impacto global en la sociedad. Por ejemplo. Google Scholar podría convertirse irremediablemente en la fuente principal no sólo de acceso a la literatura científica. Cobertura adicional: disposiciones legales y patentes Aparte de la colección de artículos (que incluye todas las tipologías documentales consideradas como documentos académicos. en algún momento la cobertura de WoS en Google Scholar podría ser completa. 1989.122 La revolución Google Scholar quedado completamente obsoletos. Negocio y Ciencias Sociales. pues la cobertura en estos campos (así como en la literatura no inglesa) es muy pobre. 2013a) y después cierta estabilización (Harzing. que . Pomerantz. Sin embargo. independientemente de su valor académico. En ese momento. estas presuntas debilidades se han transformando en fortalezas diez años después. 2014). En el caso de las humanidades. Neuhaus et al (2006) obtienen coberturas muy bajas (44% en el caso de ERIC y un 6% en el caso de Historical Abstracts). desde artículos en revistas a monografías). 2006). Zadpoor y Dodou. con el añadido de disponer de acceso a textos completos aparte de sus capacidades de búsqueda y localización de información (superiores a WoS al buscar en el texto completo de los documentos) e información adicional de citas y otros servicios complementarios. va logrando más acuerdos comerciales con diferentes grupos editoriales y se van digitalizando colecciones antiguas de revistas en papel) ha llevado a algunos autores a criticar que la cantidad va en contra de la calidad de sus contenidos. Google Scholar incluye dos colecciones de documentos adicionalmente (disposiciones legales y patentes). Efectivamente. El crecimiento continuo en la cobertura de Google Scholar (conforme va recopilando más fuentes académicas en abierto.

lo que permite buscar casos influyentes (por lo general antiguos o internacionales) que aún no están en línea o disponibles públicamente. Estos materiales están depositados como colecciones independientes con el fin de proporcionar un valor añadido a los usuarios. fiscales y de quiebras desde 1923 y los casos de la Corte Suprema de Estados Unidos desde 1791. éstas incluyen el acceso a las opiniones publicadas de apelación del Estado y de la Corte Suprema de los casos de Estados Unidos desde 1950. desde la búsqueda avanzada. Para realizar una búsqueda se debe seleccionar la opción “Case law” previamente (solamente aparece si el idioma de la interfaz está en inglés). En la figura 17 se muestra un ejemplo de búsqueda de disposiciones legales que hagan referencia a los litigios entre dos compañías (Samsung y Apple). incluye citas de casos citados por opiniones o artículos de revistas indizadas.google. La búsqueda se puede hacer global o bien se puede seleccionar la Corte de Estado o Federal correspondiente. los tribunales federales de Distrito. Figura 17. Además. Búsqueda de disposiciones legales en Google Scholar <https://scholar. a través de un breve comunicado en el Blog oficial de Google Scholar. de apelación.Bloque A · Capítulo 5 · El retrato de Google Scholar no cumplen ni los requisitos de documento académico (a partir de su estructura) ni de estar depositados en la Web académica. y por tanto no siguen los requisitos de indización del resto de materiales académicos. Las disposiciones legales fueron incluidas en 2009.com/scholar?q=samsung+vs+apple> 123 .

124 La revolución Google Scholar Como se puede observar en la figura 17. —— Etc. En cuanto a los documentos de patentes. así como el . en la parte izquierda de la pantalla disponemos de la opción “Case law” (disposiciones legales en la versión española) activada. etc. —— La cobertura excluye estatutos y regulaciones. Pese a que la disposición de este tipo de material es interesante y supone un gran avance hacia el acceso abierto a la documentación legal (además de ofrecer información de valor añadido como las citas recibidas. El resto de opciones son idénticas a las que se ofrecen para la búsqueda de artículos (filtrado por años y ordenación de resultados por año o relevancia. Estos documentos provienen de la base de datos de Google Patents. —— No se permite la búsqueda por materia. la posibilidad de exportar los resultados. Estos aspectos limitan el uso de esta herramienta como una fuente decisiva en asuntos legales. el sistema presenta una serie de importantes limitaciones: —— Está restringido a los Estados Unidos. la posibilidad de recopilar este tipo de material cuando se realiza una búsqueda es interesante para el usuario. Finalmente. pero no en el entorno legal. mediante la opción “Select courts” se pueden seleccionar las Cortes judiciales o tribunales específicos en los que se desea buscar. y la razón por la que están incluidos en Google Scholar es un tanto incierta. éstos se encuentran integrados dentro de la colección de artículos de forma que no se puede restringir la consulta específica a estos materiales (solamente incluirlos o excluirlos en la búsqueda).8% la cantidad de patentes en Google Scholar respecto de las existentes en Google Patents. que pueden estar igualmente incluidos en la colección de artículos. En el mundo académico puede ser tolerable esperar esta cantidad de tiempo para una actualización. —— Las actualizaciones (tanto de los artículos como de las disposiciones legales) pueden tardar entre 6-9 meses en aparecer. Ortega (2014) advierte en cualquier caso que en la colección de disposiciones legales también se incluyen artículos de revista especializados en Derecho. aunque sí de gran utilidad. Es posible que aparezcan aquellos documentos de patentes que hayan sido citados o referenciados en otros documentos académicos indizados por Google Scholar. pues las colecciones de artículos y de disposiciones legales son independientes y se encuentran separadas.). Ortega (2014) cifra en torno al 12. aunque esto es una suposición que debería comprobarse empíricamente. Obviamente. Esto es importante.

Incluso utiliza la expresión “bike-shedding” (Van Noorden. En la figura 18 se muestra un ejemplo de consulta en Google Scholar en la que aparecen documentos de patentes integrados entre los resultados. el desconocimiento de sus criterios de inclusión en la colección impide la realización de búsquedas exhaustivas.Bloque A · Capítulo 5 · El retrato de Google Scholar hecho de ofrecer datos de citas (no incluidos en Google Patents). que deberían realizarse en bases de datos de patentes especializadas. expresa sus dudas 125 .google. más si consideramos la escasa información oficial que se nos ofrece acerca del producto. su postura es clara: esta discusión no es útil. Figura 18. Así mismo. Sin embargo.com/scholar?q=RFID+tag+switched+capacitor> Tamaño y evolución El cálculo del tamaño de Google Scholar (en términos de número de registros) es un tema igualmente candente en la comunidad académica. Inclusión de patentes en Google Scholar <https://scholar. 2014). Cuando Anurag Acharya es consultado acerca de esta cuestión.

están incorporados en el corpus de conocimiento de sus disciplinas a partir de Google Scholar. aunque el autor advierte de los problemas de búsqueda asociados al filtrado de años. Por ello. Posteriormente. Estamos de acuerdo que a un porcentaje importante de usuarios finales los datos de tamaño no van a interesarles o influirles. diversos autores han tratado de cuantificar el tamaño de Google Scholar. Algunos años después. a lo largo de los últimos años. pero constituye un dato esencial si se desea utilizar Google Scholar como objeto de estudio. Los bibliotecarios deben conocer las características y la composición del producto tanto para evaluar el producto como para sus procesos de formación de usuarios. Siguiendo con esta línea de trabajos. Bajo esta idea. Los bibliómetras deben conocer por su parte el tamaño y la evolución de la base de datos para poder dar contexto a sus análisis cuantitativos y conocer la mayor o menor representatividad de la base de datos en función de diversos parámetros. 2006). Los profesionales de la información tienen la obligación de caracterizar y describir exhaustivamente un producto de información como es un motor de búsqueda académico.126 La revolución Google Scholar acerca de la importancia en conocer este tamaño pues. más allá de la cobertura o tamaño total de la base de datos.3 millones . Aunque no podemos dejar de estar de acuerdo con esta postura (centrada en la relevancia del sistema ante las consultas de los usuarios). Scopus y Google Scholar en número de registros desde 1955 a 2005. quien incide en la importancia del corpus de documentos disponibles para una consulta específica. Un ejemplo pionero lo constituye Jacsó (2005a). Smolinsky y Sage (2014) utilizan el modelo Yule-Simon para estimar hasta qué medida el trabajo de los premios Nobel en Química. Bensman. En esos mismos términos se expresan otros autores como SJ Bensman. creemos sinceramente que es una aproximación incompleta. Khabsa y Giles (2014) cifran el tamaño en 99. no vería la forma en la que este dato podría ayudar a los usuarios acerca de cuándo o cómo utilizar Google Scholar (Hughes. que impiden un cálculo preciso del número de registros. Aguillo (2012) estima el tamaño de Google Scholar en 83 millones de registros (a fecha de 2010) utilizando un método basado en el análisis de nombres de dominio (Top Level Domains). incluso si se conociera. y ganadores de la medalla Fields en Matemáticas. Bensman et al (2014) analizan la capacidad de Google Scholar para construir un conjunto documental relevante para la evaluación de los trabajos científicos de un conjunto de autores galardonados con el Premio Nobel de Economía. quien ofrece datos anuales comparativos entre WoS.

Comparación del tamaño de Google Scholar. El cálculo del número de registros contenidos en Google Scholar por año no es preciso debido a una serie de conocidos problemas. de los que 99. Finalmente. Orduna-Malea et al (2015).8 millones corresponden a la colección de artículos (compuesta por 80. utilizando diversos métodos. estiman el tamaño entre 160 y 165 millones de documentos (a fecha de mayo de 2014). Figura 19. En cuanto al crecimiento. y sólo considerando los documentos en inglés) mientras que Ortega (2014) obtiene 109.Bloque A · Capítulo 5 · El retrato de Google Scholar (a fecha de 2013. 18. En la figura 19 se ofrece la comparativa obtenida por Orduna-Malea et al (2015) entre las principales bases de datos.73 corresponden a la colección de artículos y el resto a la colección de disposiciones legales. donde se destaca la igualdad entre WoS y Scopus. la figura 20 muestra el número de registros anuales en las cuatro bases de datos analizadas en el período 1800-2010.5 millones de artículos. aproximadamente). y sólo a nivel orientativo. de los que 94. Scopus y Microsoft Academic Search en número de registros Fuente: Orduna-Malea et al (2015) Estos datos deben no obstante tomarse con extrema cautela. la clara superioridad de Google Scholar y la menor cobertura de Microsoft Academic Search. Web of Science.3 de citaciones y cerca de un millón de patentes. como por ejemplo la cantidad de artículos sin año de publi- 127 .3 millones (a fecha de diciembre de 2013).

estamos ante la mayor base de datos académica que existe en la actualidad. existe un importante problema de falta de replicabilidad. la comparación con la Web of Science tiene ciertos sesgos. Estas características unidas a la filosofía del producto de recopilar automáticamente la Web académica (y una parte importan- . Adicionalmente. Google Scholar y el big data académico Con los datos de cobertura.128 La revolución Google Scholar cación o las versiones de documentos no agrupadas correctamente. Zadpoor y Dodou. Figura 20. dada la imposibilidad de cuantificarlos con precisión. pues en Google Scholar se han contabilizado los registros tipo “citations” (estos registros serán explicados en el capítulo siguiente). 2014). crecimiento y tamaño vistos en los apartados anteriores. Comparación del crecimiento anual de Google Scholar. sin duda. mientras que en Web of Science no se han contabilizado los registros equivalentes (denominados “cited references”). un producto que incluye todas las tipologías documentales en la mayoría de idiomas y con una tasa de crecimiento superior tanto a Web of Science Core Collection como a Scopus. Estos estudios no pueden ser replicados debido al alto crecimiento retroactivo de Google Scholar (Winter. Scopus y Microsoft Academic Search en número de registros Fuente: Orduna-Malea et al (2015) Por otra parte. podemos concluir que. Web of Science. que implican una falta de correspondencia entre los hits obtenidos (un valor además redondeado) y los documentos almacenados.

y sin sufrir ningún control externo previo (el de los repositorios es sólo un filtro técnico que no opera sobre los contenidos). el sistema nos conduce a la voladura de todos los controles o filtros científicos a los que estaban sometidos 129 . que serán comentados en el Bloque B del libro) completamente opuesta a la familia clásica de bases de datos bibliométricas. Las bases de datos clásicas. Figura 21. Esta asunción.Bloque A · Capítulo 5 · El retrato de Google Scholar te de la privada con las editoriales). constituyen sistemas cerrados basados en la selección controlada de una colección de revistas a partir de la cual se construyen índices de citas desde artículos de revistas de elite hacia otros artículos de revistas de elite. derivada de la conocida Ley de Bradford de concentración de la literatura científica. nos llevan irremediablemente a considerar Google Scholar como un sistema de big data académico (Figura 21). y cuyas principales características se pueden observar mejor de forma gráfica en la Figura 22. indiza y vacía cualquier documento de apariencia científica depositado en un dominio académico por voluntad de un autor. no dejan representar la punta del iceberg del impacto científico. pese a tener una cobertura notable. Desde el momento en que Google Scholar automáticamente rastrea. viene en realidad determinada por una serie de restricciones (tecnológicas y económicas fundamentalmente). Sin embargo. Características de Google Scholar La cobertura y el funcionamiento de Google Scholar ha permitido la creación de una familia de productos (junto a Google Scholar Citations y Google Scholar Metrics.

aunque se necesite un filtrado (no siem- . Los índices de citas Google Scholar se construyen desde cualquier recurso académico hacia cualquier recurso académico.130 La revolución Google Scholar tradicionalmente los investigadores. se rompe con la aparición de Google Scholar. Google Scholar frente a las bases de datos bibliométricas clásicas Esta selección de revistas elitistas. ofreciendo un producto gratuito basado en la recolección de cualquier tipo de material sin más moderación que la de haber sido depositado en la Web académica y cumplir ciertos requisitos formales. Sin embargo. Figura 22. sus trabajos y las publicaciones en las que éstos comunicaban sus resultados de investigación (peer review). este concepto no debe llevar a engaño. dando así luz donde antes no había más que sombra (especialmente en las Ciencias Sociales y Humanidades). que refleja estrictamente al mundo científico (en realidad a una parte concreta de éste). permitiendo ver la parte oculta del iceberg de la citación. que representa una apertura desde el estricto mundo científico al más amplio concepto de mundo académico. la elite también está incluida en Google Scholar.

a partir de 64. en un sistema automático. como se puede observar en la figura 23. Efecto en la contabilización de citas de una tasa de error del 10% 131 . el sistema es capaz de lo más importante. Dejamos en el aire si importa la normalidad. Nuestros estudios empíricos indican que podemos asumir una tasa de error no superior a 10% en la contabilización de citas. En el trabajo realizado por Martin-Martin et al (2014).89).000 documentos altamente citados en Google Scholar. Estos datos hablan por sí solos. Es evidente que. de identificar la excelencia y la mediocridad.Bloque A · Capítulo 5 · El retrato de Google Scholar pre amigable). Esto implica. los autores observan que sólo el 51% de estos documentos están incluidos en Web of Science. errores absolutos importantes en investigadores con muchas citas. Figura 23. Si consideramos solamente éstos. es decir. Pero con todo. En un sistema big data académico hemos de olvidarnos sin embargo de la exactitud y buscar la mera correlación. la correlación entre el número de citas obtenidas en WoS y Google Scholar es total (R2= 0. no controlado y tan dinámico. los errores y las imprecisiones vayan a existir.

.

el sistema entiende que los dos términos deben aparecer obligatoriamente en los documentos (es decir.04 segundos). Además.000) así como del tiempo que ha tardado en realizar la consulta (0. “ultrasound” y “dispersion”). En la figura 24 podemos observar un ejemplo de búsqueda básica (en este caso mediante dos keywords.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar Capítulo 6 El proceso de búsqueda en Google Scholar: Prestaciones y servicios En este capítulo vamos a analizar el proceso de búsqueda en Google Scholar. 133 . el sistema devolverá un conjunto documental de registros que en teoría satisfacen la consulta efectuada. el número de resultados es un valor redondeado y que supone tal vez una burda aproximación. Solamente en ese momento el sistema mostrará las funcionalidades de filtrado. a partir de un menú lateral en la zona izquierda de la pantalla. Para ello se describirá la búsqueda sencilla o básica. la configuración del sistema y los servicios de valor añadido. Finalmente se describirá de forma pormenorizada los elementos del registro bibliográfico que Google Scholar proporciona para cada uno de los resultados generados ante una consulta específica. Por defecto. la búsqueda avanzada. un AND en lógica booleana). En la zona inferior al cajetín de búsqueda el sistema nos informa de la cantidad total aproximada de registros que cumplen con los criterios de búsqueda (156. este valor puede ir variando ligeramente conforme nos vamos desplazando por las distintas páginas de resultados. Como se ha dicho ya con anterioridad. Búsqueda básica Google Scholar Una vez introducimos una consulta determinada en el cajetín de búsqueda de la página de inicio de Google Scholar y pulsamos en el adictivo botón de buscar.

Figura 24. a partir de un algoritmo de ordenación. Adicionalmente. Por otro lado. En el ejemplo de la Figura 24 el sistema recomienda “ultrasonic” (ultrasónico) en lugar de “ultrasound” (ultrasonido). el sistema ofrece recomendaciones de búsqueda. El valor por defecto es mostrar todos los documentos. Esta selección también se puede realizar desde la página de inicio antes de efectuar ninguna búsqueda. similar al PageRank. que no son completamente sinónimos. dos o cinco años atrás. pero . En ocasiones el usuario puede haberse confundido. 1995). Debajo de estos elementos se ofrece acceso al gestor bibliográfico (Librería). En todo caso. escrito mal una palabra o simplemente haber usado una forma menos correcta. En un primer bloque de opciones se ofrece la posibilidad de elegir la colección de documentos donde se desea efectuar la búsqueda (artículos o disposiciones legales). no indica nada respecto al término “dispersion” cuando en la literatura especializada el término más correcto debería ser “scattering”.134 La revolución Google Scholar Debajo de esta información. podemos utilizar un selector personalizado donde se puede indicar la búsqueda para un intervalo específico (por ejemplo. El sistema de forma automática sugiere otra búsqueda alternativa. El segundo bloque lo constituye el filtro temporal. Búsqueda básica en Google Scholar <https://scholar. que se comentará más adelante. Se ofrecen dos alternativas.com/scholar?q=ultrasound%20dispersion> En la parte izquierda se ofrecen los elementos de filtrado. supone una ayuda en ocasiones muy válida y oportuna para refinar la búsqueda inicial. El tercer bloque de elementos está centrado en la ordenación de los resultados. desde 2005 al 2015) o un año concreto (por ejemplo. bien ordenar por relevancia (es decir. aunque podemos seleccionar la posibilidad de recuperar solamente aquellos publicados uno.google.

Buscar textos con la frase exacta indicada. mientras que las patentes están alojadas exclusivamente en la colección de artículos. el sistema ofrece dos particularidades: —— Muestra únicamente los artículos “añadidos” durante el último año. En este último caso. Buscar textos en los que no aparezca un término indicado. Buscar textos con al menos uno de los términos indicados. Si el sistema es incapaz de vincularlas a una entrada principal (por algún error técnico o simplemente porque no exista en el sistema). independientemente de disponer o no del texto completo. Búsqueda avanzada Google Scholar Se puede acceder a la búsqueda avanzada tanto desde el desplegable situado en la parte superior derecha. El cuarto bloque de elementos permite la inclusión o exclusión de ciertas tipologías documentales contenidas en la colección seleccionada: —— Patentes: documentos procedentes de Google Patents. En la parte derecha de la pantalla el sistema permite el acceso a la configuración del sistema. podemos especificar distintos tipos de búsqueda avanzada: —— —— —— —— Buscar textos con todos los términos indicados. 135 . o bien ordenar por fecha de publicación. Las citaciones están incluidas tanto en la colección de artículos como en la de disposiciones legales. —— Citaciones: referencias bibliográficas localizadas en los documentos incluidos en la base de datos (cited references). En último lugar aparece la funcionalidad de las alertas. que será comentada posteriormente. servicios derivados (Google Scholar Metrics y Google Scholar Citations) y búsqueda avanzada. el resultado aparece sin ningún hipervínculo. incrustados en la colección de artículos (ver Figura 18). como pulsando en la flecha situada en la parte derecha del cajetín de búsqueda (Figura 25): De esta forma. —— Permite visualizar todos los documentos recuperados o solamente aquellos que posean una página específica con el resumen.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar cuyo funcionamiento exacto se desconoce). aunque su fecha de publicación original pudiera ser anterior. Informa además de los días transcurridos desde su indización en el sistema. actualizaciones personalizadas.

podemos seleccionar la siguiente consulta: buscar textos publicados por el autor Mike Thelwall desde el año 2010. Ejemplo de búsqueda avanzada <https://scholar. también presente en la búsqueda básica. —— Seleccionar el filtrado temporal.136 La revolución Google Scholar —— Determinar el lugar de aparición del término indicado (en cualquier parte del texto o en el título del documento). En la figura 26 se puede observar el resultado de esta consulta. donde aparezcan los términos “altmetrics” o “links” en el título. Figura 25. y no aparezca el término “Bornmann”. Búsqueda avanzada desde la caja de búsqueda general (mayo 2015) Por ejemplo. —— Buscar textos publicados por un determinado autor.com/scholar?as_q=&as_epq=&as_oq=altmetrics+links&as_ eq=bornmann&as_occt=title&as_sauthors=%22M+Thelwall%22&as_ publication=scientometrics> . —— Buscar textos publicados por una determinada editorial. en la revista Scientometrics. que se concreta en dos registros recuperados: Figura 26.google.

137 . de la siguiente forma: allintitle: altmetrics OR links -Bornmann author:”M Thelwall”. el enlace a un gestor por defecto a elegir entre BibText. el usuario puede determinar. el sistema ha transformado la consulta en un conjunto de términos. Finalmente. RefMan y RefWorks. por ejemplo. se puede elegir tanto el idioma de la interfaz de búsqueda como el idioma de los resultados. Idioma En el caso de los idiomas. se permite incluir o no los enlaces al servicio del gestor bibliográfico. Endnote. aunque esto no sirve para todos los comandos (por ejemplo. de las búsquedas. Cuenta Desde este apartado el usuario puede o bien cerrar sesión o cerrar su cuenta en Google Scholar (que habilita. si un resultado seleccionado se abrirá en la misma ventana o en ventana nueva o si la búsqueda se realizará por defecto en la colección de artículos o de disposiciones legales (esta opción aparece únicamente en la versión inglesa). Veamos cada uno de ellos a continuación. el idioma y los enlaces de bibliotecas. Esto significa que los usuarios más avanzados pueden llegar a controlar los términos específicos de una consulta avanzada e introducirlos directamente en el cajetín de búsqueda sin necesidad de acceder a la interfaz de la búsqueda avanzada. la restricción por revista no puede ser introducida directamente). En este último caso. En caso de querer visualizar esta opción. lo que implica tanto una mejora continua de la experiencia de usuario como un mayor control sobre su actividad. Todas las consultas realizadas durante la sesión activa implican que el sistema sea capaz de monitorizarlas para aprender y comprender las necesidades e intereses informacionales de los usuarios. la creación de los perfiles personalizados. Búsqueda El usuario puede seleccionar el número de resultados que desea visualizar en cada página de resultados (10 ó 20). a través de un desplegable.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar Como se puede observar. que se detallarán en el bloque B). Configuración del sistema Desde este apartado el usuario puede realizar algunas configuraciones básicas del sistema. que se comentará en la siguiente sección. Se incluye la configuración general de la cuenta.

mientras que Young (2005). Para ello. a fecha de mayo de 2005. denominados “Library links” (más orientado a los registros electrónicos) y “Library search” 1 (más orientado a los registros impresos).138 La revolución Google Scholar el usuario puede elegir entre realizar la búsqueda independientemente del idioma en el que un documento esté escrito o por el contrario buscar solamente en aquellas páginas escritas en un determinado idioma (a elegir entre 13 posibles). podrán acceder igualmente a estos servicios. proporcionando de este modo un filtro de calidad extraordinario. informa de la existencia de más de 100 Escuelas que trabajan con Google con el fin de acelerar el acceso de los usuarios a los recursos bibliotecarios. Neuhaus y Asher (2008).google. si entre los resultados obtienen un recurso que está accesible a través de los fondos contratados por su biblioteca. Enlace de bibliotecas (Library support) Aparte de las editoriales. sección Evolución). El programa “Library links” permite a los usuarios asociados a una institución (principalmente universidades) acceder al texto completo de los fondos electrónicos de pago a través de la tecnología del link resolver (descrita en el capítulo 1. No existe ningún listado oficial en el que se pueda consultar las instituciones que tienen activada esta funcionalidad. tras analizar 948 campus universitarios norteamericanos entre 1 https://scholar. de forma que al navegar por Google Scholar. Adicionalmente. las bibliotecas también fueron desde el principio uno de los frentes importantes de negociación por parte del equipo de Google Scholar. a los usuarios que navegan a través de una dirección IP institucional se les asigna de forma automática un perfil institucional. Posteriormente Neuhaus. Los usuarios que naveguen fuera del entorno laboral. se establecieron dos programas paralelos. podrán acceder directamente al texto completo. Oder (2005) detecta un crecimiento en el número de bibliotecas que utilizan esta tecnología (25 instituciones a fecha de febrero de 2005). Este aspecto se comentará nuevamente en la sección dedicada a describir la anatomía del registro bibliográfico en Google Scholar. se podrá visualizar en cada registro el número de citas que ese documento tiene en Web of Science. De ese modo. pero tengan activado algún mecanismo de autenticación.com/intl/en-US/scholar/libraries . gracias a un reciente acuerdo de colaboración entre WoS y Google Scholar. sabedores de que los catálogos en línea proporcionaban un acceso organizado y controlado a una cantidad ingente de recursos a lo largo y ancho de todo el planeta.

Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar 2003 y 2004. Se debe disponer de un link resolver compatible con OpenURL. según informa el propio equipo de Google Scholar en la página de ayuda. 2 El funcionamiento de este sistema (válido tanto para instituciones como para usuarios que dispongan de link resolvers en servidores individuales) es sencillo. utilizada en los Estados Unidos: http://classifications. Google únicamente enlaza con el catálogo federado. y éste con el acceso al texto completo final. que deberán ser proporcionados por la biblioteca o centro al vendedor.org 139 . 360 Link (Serials solutions). pero enfocado a los catálogos tanto internacionales (como WorldCat) como nacionales o regionales. Link Source (Ebsco) o Webbridge (Innovative interfaces). una vez la institución madre ha implementado el sistema. Este acceso corresponde al programa “Library Search” de Google Scholar. y ya es éste quien enlaza con los catálogos individuales de las diversas instituciones. Figura 27.rebiun.carnegiefoundation. Estos catálogos dejan disponibles los registros bibliográficos para que sean indizados automáticamente por los robots de Google Scholar. En la figura 27 se puede observar cómo el usuario final puede activar o no la opción. El proveedor del link resolver deberá disponer de la siguiente información: rango de IPs de los usuarios y el texto de los enlaces. Programas de “Library link” y “Library search” en Google Scholar En la figura 27 se observa igualmente el acceso al catálogo Rebiun de la Red de Bibliotecas Universitarias en España 3. No obstante.org 3 http://catalogo. En este caso están activado el link resolver de la Universitat Politècnica de València. desde donde se ha accedido para realizar la captura de pantalla. similar al anterior. 2 La clasificación de las instituciones en este trabajo sigue la llamada Carneggie Classification. como por ejemplo SFX (Ex Libris). detectan que la tecnología del link resolver es utilizada por el 73% de todas las Research institutions y por una tercera parte de las Master’s Colleges and Universities.

Dado que Google Scholar sólo muestra los 1. publicación y modificación de la literatura académica de forma que facilite a los motores de búsqueda su recolección e indización”. Factores como la longitud de los artículos. aparecen los siguientes sub-elementos en la parte derecha de la pantalla: . han comenzado a generalizarse prácticas de posicionamiento en buscadores (clásicas en los motores de búsqueda generales en un entorno comercial) aplicadas al entorno académico. aunque aplicaciones como Publish or Perish sí lo muestran. qué palabras utilizar o no utilizar en el título. y considerando el efecto negativo en términos de visibilidad que supone para un documento no encontrarse entre ellos. se describen cada uno de estos elementos: Rank (rango) Es la posición de un determinado registro en la página de resultados (Search Engine Results Page) de Google Scholar ante una consulta determinada. El valor no es marcado explícitamente por el buscador. resumen y palabras clave o en qué plataformas depositarlo. aunque se incide en el hecho de que depende de la consulta realizada al no ser un valor intrínseco del registro. Marca por tanto la relevancia del registro. En ese caso.140 La revolución Google Scholar Anatomía del registro bibliográfico En la figura 28 podemos observar un registro bibliográfico estándar en Google Scholar. Elementos de un registro bibliográfico en Google Scholar A continuación.000 primeros resultados para cada consulta. Figura 28. Beel. dando lugar a un nuevo concepto denominado Academic Search Engine Optimization (ASEO). Full text (texto completo) Este elemento solamente aparece cuando Google Scholar dispone de una versión a texto completo de la versión del registro analizada. Gipp y Wilde (2010) lo definen como “la creación. pueden por tanto influir positiva o negativamente en el rango final obtenido ante determinadas búsquedas.

Como se puede observar. Los elementos más comunes son los siguientes: —— —— —— —— PDF: indica que el documento original está en formato PDF. edu>). En este caso se refiere al fichero del registro. Este lugar no tiene por qué guardar concordancia con el campo “Domain” del texto completo. se remarcan en negrita las palabras que guarden alguna condordancia con los términos de búsqueda. el registro bibliográfico o el resumen podrían estar en la página de una editorial (lugar al que nos redirigiría este hiperenlace) y el texto comple- 141 . Adicionalmente. incluso en un formato diferente al que esté el texto completo. Title link (enlace del título) Hipervínculo que apunta al sitio web donde el registro ha sido localizado. HTML: indica que el documento original está en formato HTML. en unas ocasiones sí se hace referencia a tipologías documentales (como los libros) pero en otras se especifica únicamente el fichero en el que está contenido. Por ejemplo. pues la información bibliográfica del registro y el texto completo pueden estar en lugares diferentes. que podría ser el resumen o la descripción bibliográfica del documento. —— Domain (Dominio): dominio web en el que Google Scholar ha localizado la versión del documento a texto completo (en este caso <wustl. En cualquier caso.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar —— Format (Formato de fichero): se indica entre corchetes el fichero en el que está disponible el texto completo (PDF). —— Link (enlace): hipervínculo al texto completo. BOOK: el registro corresponde a una monografía. CITATION: el registro hace referencia a un documento no indizado en Google Scholar. Brackets (corchetes) En este campo se indica la tipología documental del registro en cuestión. que aparece entre corchetes justo delante del título. pero que ha sido localizado en las referencias bibliográficas de algún otro documento (por ejemplo: [PDF]) sí indizado en Google Scholar. Title (título) Se muestra el título del documento. no se debe confundir este fichero con el campo “Format” del texto completo visto anteriormente.

Por tanto. en algunos casos. —— Publication source (publicación): aparece el nombre de la fuente donde el documento ha sido publicado y. número. En aquellos casos en los que el autor dispone de un perfil académico público en Google Scholar Citations.142 La revolución Google Scholar to ser una versión disponible en un repositorio (la versión completa de la editorial podría ser inaccesible al ser de pago). incluso el nombre de algunos autores. año y editorial: —— Authors (autores): se muestra la lista de autores del documento. —— Year (año de publicación). lo que limita la utilidad de este campo en la descarga de datos. Éste no tiene por qué corresponder con el campo “Domain” del texto completo. Bibliographic description (descripción bibliográfica) Este elemento está formado por cuatro campos. puede aparecer el nombre de la editorial (por ejemplo. Abstract (resumen) Se muestra a modo de snippet sólo las primeras líneas del resumen del documento. y sólo para las grandes editoriales. el nombre aparece en forma de hipervínculo directo hacia dicho perfil. sumando las correspondientes a todas las versiones correctamente vinculadas por el sistema. que contienen información relativa a los autores. pues éste tiene un espacio límite. en el caso de publicaciones con muchos autores. paginación). podrían no aparecer. . —— URL Domain/Publisher (dominio web/editorial): aparece el URL donde el documento ha sido localizado. fuente de publicación. El sistema está diseñado para mostrar esta información en una sola línea. GS Citations (citas recibidas) Se muestra el número de citas que el documento ha recibido según Google Scholar. Adicionalmente. Las palabras que concuerdan con los elementos de búsqueda aparecen marcadas en negrita. información descriptiva (volumen. GS Citations link (enlace a citas recibidas) Hipervínculo que dirige al usuario al listado de documentos citantes correspondiente. ciertos campos. Elsevier). Este elemento tiene la peculiaridad de que no toda la información se muestra de igual forma en todos los registros.

Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar

Related link (enlace a documentos relacionados)

Enlace que dirige al usuario a un listado limitado de documentos que
Google Scholar ha considerado similares o relacionados con el registro
consultado y, por tanto, de posible interés para el usuario.

Versions (versiones) y Versions link (enlace a versiones)

Imaginemos un artículo científico escrito por tres autores; una vez
aceptada su publicación la editorial podría depositar inmediatamente
un registro bibliográfico en su sede web (incluyendo resumen y acceso
previo pago); el primero de los autores podría depositar posteriormente
un preprint autorizado (o no) en su repositorio institucional; el segundo
autor haría lo propio pero en otra institución diferente; el tercer autor,
que podría no trabajar en una universidad, lo depositaría en una plataforma online (como por ejemplo ResearchGate) así como en su página
personal.
Un mismo trabajo puede estar depositado en multitud de plataformas online. Google Scholar afronta este problema mediante una funcionalidad patentada que le permite identificar y mostrar todas las posibles
versiones de un mismo documento, así como facilitar su localización y
acceso 4. Pulsando en el elemento “Versions link” se accede a un listado
de todas las versiones que Google Scholar ha sido capaz de localizar para
el documento correspondiente. En este caso podemos observar hasta 29
versiones (Figura 29).

Figura 29. Versiones para un registro bibliográfico en Google Scholar

Como se puede observar en la figura 29, las versiones aparecen ordenadas por relevancia. El sistema nos informa de que ha localizado
4 https://www.google.com/patents/US8589784

143

144

La revolución Google Scholar

aproximadamente 29 versiones (12 de ellas sin acceso al texto completo). Como su propia palabra indica, esto significa que es una aproximación. En documentos con una alta cantidad de versiones (en ocasiones
pueden superar el centenar), esta cifra podría no corresponder exactamente con la cantidad de registros mostrados.
La información de citas únicamente aparece en el registro situado en
primer lugar. A este registro se le denomina la versión principal. Según
Google Scholar, cuando hay diversas versiones para un mismo documento, se selecciona como versión principal el texto completo publicado por
la editorial, siempre que esto sea posible. Y esta versión principal es la
que aparece asimismo en la página de resultados del buscador.
Sin embargo, esta declaración de buenas intenciones no siempre se
cumple, pues podemos detectar registros correspondientes a publicaciones en revistas cuya versión principal es aquella depositada en un
repositorio u otra plataforma online, quedando la versión de la editorial relegada a una versión secundaria. Esto puede tener un importante
efecto negativo en la visibilidad de algunas editoriales en Google Scholar.
Por ejemplo, en la figura 30 podemos comprobar cómo la versión principal para una gran cantidad de artículos antiguos en la revista Nature
corresponde con la copia depositada en ResearchGate.

Figura 30. Versión principal no correspondiente a la versión editorial
<https://scholar.google.com/scholar?q=protein+site%3Aresearchgate.net>

Este efecto sucede especialmente en las revistas que, por alguna u
otra razón, no publican inmediatamente los artículos a texto completo. Los autores realizan su autoarchivo en distintas plataformas y estas

Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar

primeras versiones son las que pasan a ser las principales en Google
Scholar. La versión en abierto de la editorial podría no llegar nunca y, en
el caso de hacerlo, podría no sustituir al registro que funcionara como
versión principal hasta ese momento. Por tanto, parece que la primera
versión en abierto identificada tiene muchas probabilidades de constituirse como la versión principal estable del registro.
Aparte de las distintas copias de un mismo documento, en ocasiones nos podemos encontrar con verdaderas versiones. Por ejemplo, informes técnicos anuales en los que el título y los autores pueden ser
los mismos y el contenido tener un grado de solapamiento importante,
pero ser documentos independientes documentalmente. En esos casos, el sistema de agrupación de versiones agrupa todas las versiones
que estima son variaciones de un mismo documento. En la figura 31 se
muestra el ejemplo de “The STM Report”, elaborado por M. Ware y M.
Mabe. Podemos comprobar cómo el sistema ha agrupado las distintas
ediciones de este informe.

Figura 31. Ejemplo de distintas ediciones agrupadas en una misma versión

Aunque no faltan argumentos a favor de esta agrupación, debemos
advertir del efecto que esto puede tener en estudios cuantitativos. En

145

146

La revolución Google Scholar

algunas ediciones podrían no coincidir todos los autores y, todavía peor,
las referencias bibliográficas podrían ser bien diferentes. Por tanto, la
consideración de “The STM report” como documento citante es compleja
de resolver si las distintas ediciones aparecen agrupadas bajo una misma obra.

WoS Citations (citas en WoS)

Se muestran las citas recibidas por el documento correspondiente
según la Web of Science. Este campo solamente aparece si la consulta
se ha realizado desde una computadora conectada en un rango de IPs
autenticadas para su acceso a la plataforma Web of Science.
Aunque no se muestra en la pantalla, cuando el registro es descargado aparece un campo adicional, denominado WoS accession number (UT),
un número de identificación del documento dentro de la WoS.

WoS Link (enlace a citas en WoS)

Hipervínculo al listado de documentos citantes en la Web of Science.

Bonus track: servicios de valor añadido

Finalmente, en esta sección se incluyen diversos servicios extra disponibles desde la interfaz de Google Scholar, y que aportan un valor
añadido a los usuarios en sus procesos de búsqueda de información
científica.

Referencias bibliográficas

Entre los elementos que conforman un registro bibliográfico, descritos en la sección anterior, se encuentra el elemento “Cite”. Si se pulsa
sobre este enlace en cualquiera de los registros de una página de resultados, el sistema nos muestra un cuadro de diálogo flotante en el que
aparece la referencia bibliográfica completa del registro seleccionado en
cinco estándares diferentes (MLA, APA, Chicago, Harvard y Vancouver),
que pueden ser copiados y pegados en cualquier otro documento. En la
figura 32 se muestra un ejemplo del sistema de referencias bibliográficas de Google Scholar.
Adicionalmente, el sistema permite la generación de la referencia bibliográfica en diversos gestores bibliográficos (BibText, Endnote, RefMan
y RefWorks), para poder ser exportados de forma sencilla. En el caso de
que en la configuración de la búsqueda hubiésemos activado la opción
de gestor bibliográfico, entonces el enlace “Cite” sería sustituido por el
gestor seleccionado.

Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar

Figura 32. Sistema de referencias bibliográficas en Google Scholar

Mi biblioteca

Junto al elemento “Cite” (Citar) aparece otro útil elemento que proporciona acceso a un recurso de interés. Se trata del elemento “Save”
(Guardar). Y al pulsar sobre éste, el sistema guarda el registro seleccionado en “My Library” (Mi biblioteca), una suerte de biblioteca personal
donde el usuario registrado puede almacenar colecciones de documentos. Este servicio apareció el 19 de noviembre de 2013 5 y trata de competir con otros gestores populares como Zotero o Mendeley. Sin embargo,
sus prestaciones, aunque interesantes, son todavía limitadas como para
competir con estas aplicaciones 6.
El acceso a la biblioteca personal se encuentra tanto en la página
de inicio de Google Scholar (menú superior) como en el menú de opciones que aparece en la parte izquierda de la pantalla cuando se realiza
cualquier búsqueda en la base de datos. Y su utilización requiere de la
activación o habilitación previa del usuario.
En el momento de la activación, el sistema vuelca automáticamente
todos los artículos que el autor tuviera incluidos en su perfil académico
en Google Scholar Citations. Así mismo, se le consulta la posibilidad de
incluir adicionalmente los artículos que el autor haya podido citar, identificados en las publicaciones del perfil. La apariencia de la biblioteca es
prácticamente idéntica a la interfaz de búsqueda Google Scholar (Figura
33), y se puede distinguir por la aparición de un icono de carpeta justo
5 http://googlescholar.blogspot.com.es/2013/11/google-scholar-library.html
6 https://scholar.google.com/intl/en/scholar/help.html#library

147

indicando que el artículo se encuentra almacenado en la biblioteca. El usuario conforme navega por Google Scholar puede localizar un registro de interés. el sistema mostrará los documentos almacenados. Pulsando posteriormente el enlace “My Library”. accesible desde el menú lateral izquierdo de la biblioteca. esta colección de documentos puede habilitarse en cualquier momento (Figura 34). El funcionamiento es el que sigue: . en la que se incluyen los artículos citados por el autor en los artículos incluidos en el perfil. el producto proporciona una herramienta de etiquetas. Por defecto “Mi biblioteca” muestra dos colecciones. el funcionamiento del sistema es muy sencillo. Ejemplo de colección en “Mi biblioteca” Una vez activado. Figura 33. En todo caso. Figura 34. y simplemente pulsando en el elemento “Save” (Guardar) el registro se añadirá a la colección. en el caso de que se hubiese activado la opción en el momento de la activación.148 La revolución Google Scholar en la parte izquierda del registro bibliográfico. “Mis citas” (que corresponde a los artículos importados automáticamente del perfil académico del usuario) y “Citado por mí”. Importación de referencias citadas en “Mi biblioteca” Con el fin de facilitar la organización de contenidos.

se está en el proceso de realización de un trabajo académico de envergadura (como una tesis doctoral) o simplemente se desea estar al día.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar —— Acceder a la gestión de etiquetas: “Administrar etiquetas”. el nombre de la carpeta aparecerá en el menú lateral derecho (Figura 34). y notificarlos automáticamente al usuario mediante un correo electrónico. algún asunto muy particular o de una selecta selección de publicaciones. Todo ello exige la creación de comandos de consulta que en ocasiones pueden ser complejos y laboriosos si deben realizarse además con cierta frecuencia. Etiquetado de contenidos en “Mi biblioteca” Alertas Las tareas de seguimiento en Google Scholar pueden ser realmente tediosas. “Mis citas” y “Citado por mi”. creado anteriormente. al pulsar en el menú “Libros”. —— Pulsar en el artículo que se desee etiquetar. Conocer los últimos artículos de un autor. las últimas aportaciones en alguna determinada materia. como puede suceder cuando se están realizando tareas de vigilancia tecnológica. La solución que plantea Google Scholar es la creación de Alertas que automaticen la identificación de nuevos registros incluidos en la base de datos que cumplan unos criterios de búsqueda. —— Pulsar en “Labels” y etiquetar la referencia correctamente (Figura 35). aparecerán todos los documentos etiquetados en esta categoría. 149 . —— Acceder a cualquier colección (por defecto “Mi biblioteca”. por ejemplo “Libros”. Figura 35. —— Crear una etiqueta nueva. Al crearla. Tras esto.

cuando el usuario realiza una consulta básica. según provengan de Google Scholar (aparecen entre corchetes en el panel de alertas) o las provenientes de Google Scholar Citations (aparecen sin corchetes). Se puede destacar igualmente que las alertas no pueden editarse una vez creadas. Google Scholar registra todos los movimientos que los usuarios realizamos dentro del sistema. Si se pulsa en el enlace. Figura 36. el sistema le muestra siempre el icono de alertas en el menú lateral izquierdo (Ver Figura 24). Si el usuario hace clic en el icono una vez ha realizado una consulta. a qué documentos accedemos a texto completo. lo que puede ser útil a la hora de fijar una alerta ante una consulta que ha demostrado ser útil al usuario. En este caso. qué revistas. El perfil académico es tal vez la mayor fuente de datos pues describe completamente a un autor (afiliación institucional. el sistema copiará la consulta efectuada en el campo “Consulta de alerta”. La consulta de alerta debe corresponder con la ecuación de búsqueda que debería realizarse en el cajetín de búsqueda de Google Scholar. Adicionalmente. El usuario deberá incluir un correo electrónico para recibir las notificaciones. así como el número máximo de resultados que desea recibir en cada notificación. etc. solamente pueden ser eliminadas. el usuario puede comprobar la eficiencia de los resultados de la consulta realizada a través del botón “Actualizar resultados”.150 La revolución Google Scholar El icono de “Alertas” se encuentra situado en el menú superior de la página de inicio de Google Scholar. mientras se está buscando material académico. Actualizaciones El sistema de actualizaciones es un sistema de recomendación automático de artículos. qué autores consultamos. Las alertas pueden además crearse en vivo. Creación de alertas en Google Scholar Las alertas pueden dividirse en dos tipos. es decir. palabras clave identificando . el sistema muestra una interfaz desde la que se pueden crear las alertas de consulta (Figura 36).

situado en el menú superior de la página de inicio de Google Scholar. al igual que funcionan los sistemas de recomendación de música o de parejas sentimentales. Para acceder a esta colección de documentos recomendados basta con pulsar el botón “Actualizaciones”. a partir de un icono en forma de campana. Toda esta información es acumulada para ofrecer una recomendación basada en nuestros gustos e intereses académicos. El sistema nos avisa igualmente en el momento en que se ha incorporado una novedad. artículos publicados e información de a quién cita y por quién es citado). donde podemos consultar todo el histórico o bien las últimas incorporaciones (figura 37). Sistema de recomendación de artículos en Google Scholar I Figura 38. situado en la parte superior derecha de la interfaz de búsqueda.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar áreas de interés. Figura 37. Sistema de recomendación de artículos en Google Scholar II 151 .

Si con el ratón seleccionamos el título de la obra y a continuación pulsamos en el icono del botón. podemos llegar a localizar una referencia bibliográfica que nos interese y deseemos entonces acceder al artículo correspondiente. podemos observar cómo el sistema ha localizado el artículo seleccionado en Google Scholar (que no se encuentra en acceso abierto). En el ejemplo mostrado en la Figura 39. ofreciéndonos la posibilidad de exportar la referencia normalizada. Sin embargo. El botón de Google Scholar (lanzado en abril de 2015. bajo). . por ejemplo. pero nos interesa. estos nuevos documentos aparecen en la página de inicio listados justo debajo del cajetín de búsqueda (Figura 38. La forma es a través de una extensión del navegador web Chrome al que se puede acceder desde esta sección de la configuración y que puede ser instalada en el navegador directamente a través de la Chrome Web Store. el sistema realizará la búsqueda de esa cadena de caracteres seleccionada directamente en Google Scholar. arriba). nos aparecerá un pequeño icono en la parte derecha de la barra de navegación del buscador. para ello deberemos abrir en una pestaña nueva el buscador (si no lo teníamos ya abierto) y copiar/pegar el título u otra información de dicha referencia para realizar la consulta. en el caso de que sea necesario. lista para ser usada. y cuya última actualización es del 7 de mayo de 2015) permite realizar esa consulta de forma inmediata. Imaginemos que estamos consultando un repositorio (Figura 39). cuando navegamos por algún sistema de información o página web. el icono se ilumina en rojo y en su interior aparece un número representativo del número de documentos nuevos recomendados (Figura 38.152 La revolución Google Scholar En el momento en que existen nuevos documentos que el sistema cree poder recomendarnos. de acceder al texto completo (en este caso accesible desde la plataforma de ResearchGate) o bien abrir definitivamente Google Scholar para refinar la búsqueda. y nos encontramos con un texto que no es accesible. buscando en Google Scholar. A veces. Una vez instalada. Botón de referencias En ocasiones. Un proceso que se puede hacer engorroso si se realiza con frecuencia.

Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar Figura 39. Ejemplo del botón de referencias de Google Scholar 153 .

.

que lo invalidan como herramienta a emplear en procesos de evaluación académica. Inciden en que su uso debería generalizarse como fuente complementaria a los resultados ofrecidos por bases de datos bibliométricas como WoS o Scopus y. debilidades y peligros A lo largo de los capítulos anteriores hemos descrito el nacimiento de Google Scholar. su facilidad de uso y el gran papel que juega como puerta de entrada a la búsqueda de información científica. aun con el peligro de resultar demasiado densos. Por el contrario. aunque no niegan algunas de sus principales bazas como su amplia cobertura. sus características distintivas principales.Capítulo 7 Google Scholar en la balanza: Fortalezas. como fuente absolutamente obligatoria. en la diversidad de opiniones vertidas. tanto empíricos como descriptivos. muestran su desagrado al poco o escaso control de calidad de los datos. así como el impacto de su lanzamiento tanto en el mercado de los buscadores como posteriormente en la evaluación de la actividad académica. a la inclusión de material de dudosa calidad y a los errores en la contabilización de citas. Desde el inicio se ha hecho especial hincapié. sino que argumentan que los errores (imposibles de negar por otra parte) no influyen demasiado en las conclusiones generales a obtener en un proceso de evaluación de impacto académico. desde el Grupo EC3 (Evaluación de la Ciencia y de la Comunicación Científica) hemos realizado una gran cantidad de estudios y análisis. los entusiastas del producto no sólo inciden en las ventajas del buscador. En un plano intermedio nos atrevemos a situarnos a nosotros mismos. en los que hemos pretendido de algún modo . Los detractores. las intenciones y objetivos iniciales de sus creadores. Google Scholar no deja indiferente a nadie. tanto académicos como divulgativos. A lo largo de la última década. en algunas áreas y disciplinas. Los defensores y los detractores (recordando en ocasiones a los apocalípticos e integrados de Umberto Eco) han tenido tradicionalmente posiciones claramente diferenciadas y contrapuestas.

búsqueda y resultados. El creciente uso de Google Scholar y el movimiento de las Altmetrics 1 supondrán a buen seguro un cambio de tendencia en la utilización de este buscador en tareas y análisis tanto bibliométricos como cibermétricos. tanto las buenas como las no tan favorecedoras o incluso las directamente malas. Ruiz-Pérez y Delgado López-Cózar (2009). junto a las posibles amenazas y peligros a los que debe hacer frente en la actualidad. la tarea de analizar Google Scholar no es sencilla. 1 http://altmetrics. que se concentra en tres puntos clave: idiomas. residen en la fascinante sencillez de su uso en las búsquedas y. cobertura de revistas científicas. además contemplando prácticamente a todos los posibles usuarios.156 La revolución Google Scholar mostrar todas las caras de Google Scholar. todos los aspectos importantes de la base de datos. disciplinas y tipologías documentales. categorizar e incluso discutir las principales ventajas e inconvenientes de este buscador. En la tabla 6 se resumen los principales puntos de debate en este apartado. cobertura general y precio). ya comentados en la introducción. desde una óptica integral. sí cumplen la misión de abordar. por supuesto. Con ello crecerá la necesidad de conocer sus principales limitaciones y problemas en aras a extraer el máximo partido al enorme potencial que esta base de datos contiene. interfaz. contribuyendo de ese modo a poner un granito de arena en la mejora del conocimiento sobre Google Scholar tanto a investigadores como a profesionales. quienes estructuran la evaluación del buscador en seis apartados (control de la información.org/manifesto/ . Sin entrar en estos puntos y ya concentrándonos en sus prestaciones en tanto que herramienta para la realización de estudios bibliométricos. su más insigne virtud es indudablemente la amplia y diversa cobertura. en su gratuidad. Aunque la evolución y dinamismo del buscador hacen complicada la utilización de este tipo de modelos de análisis. extraidos de los innumerables trabajos y estudios recopilados durante la elaboración de este libro. Ventajas Los principales valores de Google Scholar. Llegados a este punto parece conveniente realizar una parada en el camino con el propósito de recopilar. Sin embargo. Uno de los paneles de evaluación más completos es quizás el elaborado por Torres-Salinas.

Esta mayor diversidad lingüística se puede observar en el estudio llevado a cabo por Orduña-Malea y Delgado López-Cózar (2014). Por ello. considerando los artículos indizados en Web of Science en el período 1900-2014. Orduña-Malea et al (2015). solamente podemos trabajar con estimaciones. dato que habla por sí mismo. Según Orduña-Malea et al (2014). En el caso de Google Scholar es complicado realizar este cálculo pues no existen comandos de búsqueda específicos para filtrar por idioma (aunque sí por dominios web geográficos) y existe además un número máximo de resultados por consulta (1. Ventajas. a partir de un análisis sobre estudios empíricos previos. estiman que el inglés puede representar aproximadamente el 65% de los registros en Google Scholar.000) que imposibilitan el cálculo manual. en el que se observa de forma comparada la cantidad de registros por idioma 157 . inconvenientes y amenazas de Google Scholar VENTAJAS INCONVENIENTES AMENAZAS Idiomas Calidad Manipulación Disciplinas Transparencia Control Tipologías Prestaciones Googlelización Amigabilidad Gratuidad Idiomas El sesgo hacia el idioma inglés por parte de las bases de datos bibliométricas es ampliamente conocido.Bloque A · Capítulo 7 · Google Scholar en la balanza Tabla 6. el inglés constituye aproximadamente el 90% de los documentos indizados.

esencialmente en las Ciencias Humanas y parte de las Ciencias Sociales. GSM cuenta con revistas publicadas en 13-15 lenguas. Este y otros productos similares serán descritos con mayor detalle en el Bloque B del libro (capítulo 10).158 La revolución Google Scholar en Web of Science. De este modo. dan sobrada muestra de la potencialidad de Google Scholar para ser utilizado en la evaluación del impacto académico en dichas disciplinas. Por otra parte. así como el trabajo seminal de Kousha. quienes abarcan las principales áreas humanas. 2013) como en las de Enfermería (Reina. Disciplinas Dado que el uso del idioma vernáculo es una de las características antropológicas clave en la comunicación científica en ciertas disciplinas. 2012). sociales y jurídicas. o en las de Library and Information Science (Delgado López-Cózar et al. 2013). Los trabajos reseñados a lo largo de este libro. eliminando el abultado sesgo anglófono que poseen Scopus y WoS. Productos derivados (como H-Index Scholar. Repiso-Caballero y Delgado López-Cózar. Scopus y Google Scholar. . con la excepción del alemán. si las revistas en inglés representan en Scopus y WoS entre el 85 o 90% de los títulos. francés. Tanto en las revistas de Comunicación (Delgado-López-Cózar y RepisoCaballero. chino y japonés) mucho más elevada en Google Scholar. A parecidas conclusiones se llega en los estudios dirigidos a analizar la lengua y procedencia geográfica de las revistas indizadas en Google Scholar Metrics comparadas con las vaciadas en Web of Science o Scopus. mientras que Scopus y WoS sólo registran revistas publicadas en 7-9 idiomas diferentes. español. con especial relevancia los llevados a cabo por Anne-Wil Harzing en las áreas de Administración y dirección de empresas y Economía. por ejemplo) han aprovechado precisamente esta potencialidad para desarrollar productos orientados a conocer el rendimiento individual de investigadores españoles en estas disciplinas. Los resultados reflejan una representación de ciertos idiomas (especialmente el italiano. sorprendentemente mejor cubierta en WoS y Scopus en el momento del estudio. GSM se ajusta mejor al uso real que tienen los distintos idiomas en las revistas científicas existentes en el mundo. Thelwall y Rezaie (2011). es lógico pensar que una mayor diversidad lingüística pueda conllevar necesariamente una mayor y mejor representación de estas disciplinas. en GSM no alcanzan el 60%.

a día de hoy. Por tanto. Google Scholar recopila documentos académicos sin importar la tipología documental (los documentos solamente deben cumplir unos requisitos técnicos y de estructura). investigadores en áreas sociales y humanas o de ingeniería. Por tanto. Inconvenientes A pesar de todas las indudables ventajas descritas anteriormente el sistema no está exento de ciertas limitaciones e inconvenientes. proporcionan a Google Scholar no sólo una base de datos única donde localizar información sino un corpus de documentos citantes de incalculable valor (imaginemos la cantidad de citas perdidas que puede suponer simplemente excluir las tesis doctorales de los análisis de citas). patentes. idioma o tipología documental (Torres-Salinas. presentaciones (tanto docentes como de conferencias o eventos) y especialmente monografías y tesis doctorales. tanto para localizar de una forma sencilla. aparte de por usar los idiomas vernáculos. que se 159 . Actas de congresos. Únicamente se requiere de acceso a Internet. completamente gratuito. Por último.2% y los capítulos de libro un exigüo 1. el artículo científico era la tipología más presente en Web of Science (57%) durante el período 1700-2014 mientras que. las actas de congreso suponían solamente el 10. Según el análisis de Orduña-Malea et al (2014). editoriales o asociaciones no gubernamentales. pueden disponer de una herramienta no sólo complementaria sino necesaria para obtener un dibujo completo de su impacto académico. por utilizar canales de comunicación diversos en los que el artículo publicado en una revista es una tipología claramente minoritaria. la presencia a texto completo de actas de congresos. fácil y directa documentos a texto completo como para identificar las citas únicas a sus trabajos independientemente de su procedencia. Estas características convierten a Google Scholar especialmente útil en estudios y análisis a nivel micro. Ruiz-Pérez y Delgado López-Cózar. Ni siquiera se precisa disponer de una cuenta de correo de Gmail para usar los servicios de Google. capítulos de libro o monografías son formatos usados con mucha frecuencia y que no están recogidos en las bases de datos bibliométricas clásicas. 2009). no hemos de olvidar que el producto es.1%. por ejemplo. informes. y no por ello menos importante. capítulos de libro. revistas secundarias no incorporadas en la corriente principal de la ciencia.Bloque A · Capítulo 7 · Google Scholar en la balanza Tipologías documentales Las disciplinas sociales y humanas se caracterizan.

Un producto sencillo de utilizar. por otra parte. Una base de datos actualizada de forma dinámica. Peter Jacsó ha sido quizás el investigador que más tiempo ha dedicado a identificar y criticar las deficiencias de Google Scholar (aspecto ya comentado ampliamente en el capítulo 2). así como para formar a sus usuarios. de cobertura mundial y que además es gratuito. los especialistas en información tienen la obligación profesional de evaluar las prestaciones de los buscadores. La calidad de la información ofrecida (entendiendo con ello los datos descriptivos de los registros indizados) no fue una prioridad por tanto en el proyecto de Google Scholar.160 La revolución Google Scholar pueden resumir en una falta de control de calidad de los datos. en ofrecerla de forma inmediata a los usuarios (cuanto más rápido. Los bibliotecarios y documentalistas deben conocer a fondo su cobertura. mejor). En 2005 (tan sólo un año después del lanzamiento del buscador). sigue la filosofía del laissez faire laissez passer. mejor) y dando preferencia a los documentos más influyentes (cuanta más relevancia. funciones de búsqueda y precisión para realizar su trabajo de forma profesional (buscar y localizar información de calidad para sus usuarios). Por otro lado. Conclusiones que. por ejemplo. de cobertura global y con poco personal no puede seguramente dedicar demasiado tiempo a controlar la precisión de los datos bibliográficos aportados. los especialistas en bibliometría y cibermetría deben contar con registros sin errores para que sus análisis tengan el suficiente rigor científico y sus conclusiones puedan tener validez. sirven y guían como apoyo para la correcta toma de decisiones tanto en instituciones académicas como en organismos de financiación. Desarrollado con la perspectiva de satisfacer las demandas de los usuarios a la hora de localizar y acceder a información científica. ya denunciaba la existencia de importantes limitaciones en los resultados proporcionados. que afectaban especialmente a la hora de localizar las contribuciones de un determi- . A pesar de ello. La prioridad por tanto radica en disponer de información (cuanta más. especialmente durante sus primeros años de vida. Control de calidad Google Scholar. más cuando esto va a tener una incidencia tal vez mínima en la satisfacción de un alto porcentaje de sus usuarios. opacidad en su funcionamiento y la poca amigabilidad para poder analizar los datos recuperados. rápido. al igual que otros productos y servicios desarrollados por Google. mejor) y de manera intuitiva (cuanto más fácil. mejor).

Como consecuencia. Jacsó (2010) describe cómo en ocasiones los años de publicación de los registros eran tomados de los datos del volumen y número de la publicación o de parte de números de teléfono o fax. debido a importantes problemas en la desambiguación de nombres (Jacsó. Sin embargo. 2005b). este procedimiento planteaba un error de base. El software empleado era. en la mala utilización de los metadatos proporcionados por las editoriales. 161 . patético. era imposible entonces distinguir dos autores con el mismo apellido y misma inicial. en la aplicación de algunos comandos de búsqueda avanzada y. En ocasiones ciertos datos eran tomados por error de las opciones de menú de las páginas web. Jacsó es especialmente crítico en este asunto. 2008a. Los errores identificados generaban millones de registros con atribuciones de autoría y de citas erróneas (que provocaban la existencia de autores y citas fantasmas). de la afiliación profesional o incluso de la dirección postal. 2007). 2010). 2008b). errores en las búsquedas filtradas por año. este procedimiento no podía funcionar igual de bien en la búsqueda de ítems conocidos a partir de la combinación de nombres de autores. los parsers eran incapaces de reconocer los metadatos bibliográficos. se detectaban errores tales como la existencia de duplicados (y triplicados). los documentos con estructuras no bien definidas podían provocar que el sistema no recuperara de forma correcta las citas de muchos documentos citantes (Meho y Yang. Pese a ofrecer un acceso sin precedentes a cientos de editores académicos (quienes ofrecen al buscador millones de registros bibliográficos a texto completo).Bloque A · Capítulo 7 · Google Scholar en la balanza nado autor. años de publicación o nombres de revistas (Jacsó. los desarrolladores de Google Scholar habían depositado toda su confianza en el desarrollo de un software propio para extraer automáticamente los metadatos de los archivos a texto completo en lugar de utilizar los metadatos creados por los bibliotecarios y las editoriales (Jacsó. La recuperación e indización de la Web por parte de Google se basaba en la identificación de URLs y títulos en el código HTML. Este método había resultado exitoso en el buscador general de Google para crear conjuntos de resultados que fueran relevantes para consultas “tipo” de los usuarios (basadas generalmente en una o dos palabras clave). según palabras de Jacsó. enlazado a textos completos que no correspondían a los registros. de los descriptores. Igualmente. Emplea asimismo términos como “under-trained and inferior web crawlers”. Igualmente. Por ejemplo. Sin embargo. muy especialmente.

Localizar . la concordancia de palabras en el título. En todo caso. porcentajes asumibles. se desaconsejaba su utilización como única fuente de información para la evaluación de la ciencia. Se evidenciaba que Google Scholar era un producto ambicioso desde el punto de vista de su cobertura. 2009). más teniendo en cuenta la escala de su cobertura y la ausencia de control de calidad en su mantenimiento. Opacidad Una de las principales críticas que suelen realizarse a Google Scholar es la falta de transparencia a la hora de detallar públicamente el funcionamiento del buscador. Este hecho puede explicar los errores en los filtros temporales del buscador. Aunque parece ser que el número de citas es uno de los indicadores clave en este proceso de posicionamiento (Beel y Gipp (2009). resumen o texto o el PageRank del dominio web donde se ha depositado el texto completo) es igualmente importante. Winter. en un producto que muestra un máximo de 1. por lo que resultaba claramente inapropiado en la realización de búsquedas bibliométricas para la evaluación del rendimiento e impacto científico de investigadores y revistas.000 resultados por consulta. los autores advierten de la falta de fechas de publicación en el 9% de los datos. el peso de otros indicadores (como podrían ser la calidad de la editorial. Ruiz-Pérez y Delgado López-Cózar. Así mismo. especialmente en trabajos a media y gran escala. Cabe admitir no obstante una importante evolución y mejora del producto. pero mal resuelto en el plano del procesamiento de la información. Conocer las razones por las que un registro aparece por delante de otro. institución o editorial el hecho de no aparecer entre los resultados a una consulta pertinente es un asunto nada trivial. Zadpoor y Dodou (2014) identifican por ejemplo un 1% de falsos positivos en citas y un 5% de duplicados para una muestra de 56 artículos en diversas disciplinas analizadas en 2013. aunque su influencia específica no se puede calcular con exactitud. especialmente en el proceso de ranking de resultados ante una consulta determinada (algoritmo de posicionamiento). es vital. así como en su presentación (TorresSalinas. y constituye por tanto una importante limitación a remarcar en este apartado. La pérdida de visibilidad que puede suponer tanto para un autor.162 La revolución Google Scholar Todos estos errores impedían un uso académico de los datos albergados en el sistema.

lo cite en futuros trabajos propios. las fuentes privadas (como editoriales) que han llegado a un acuerdo específico con Google Scholar para que éste indexe el texto completo de sus contenidos sí deberían ser notificadas. 163 . La influencia del número de citas en el ranking de resultados puede traer problemas adicionales. los artículos con más citas son por lo general artículos más antiguos (han tenido tiempo suficiente como para reunir muchas citas). lea y. localizar posibles colaboradores y generar interés por tu línea de investigación. Lógicamente.Bloque A · Capítulo 7 · Google Scholar en la balanza un texto entre los resultados de búsqueda puede suponer. Esto puede tener un efecto negativo al favorecer a los artículos más antiguos frente a los nuevos. con fortuna. Igualmente puede servir para dar a conocer tu trabajo. lo descargue. en el sentido de que favorecen la localización de artículos pioneros. que se realiza de forma irregular e inconsistente (Walters. pues son clave para mantener su posición en el mercado de los buscadores frente a las empresas de la competencia. El algoritmo del ranking es un secreto comercial. a través de un listado online actualizable anualmente. En cambio. es la total falta de transparencia acerca de la cobertura de la base de datos (más exactamente qué fuentes indiza) y su actualización. tal y como ya se ha comentado en diversas ocasiones a lo largo del libro. como la identificación automática de versiones. especialmente en aquellas búsquedas no restringidas temporalmente. por ejemplo. En ocasiones podemos olvidar que Google Scholar. 2007). aunque es gratuito. Aunque los autores atribuyen este efecto a las nuevas tecnologías y al uso de los motores de búsqueda. Este hecho puede justificar que no revelen sus algoritmos de búsqueda y posicionamiento. La tendencia a citar artículos antiguos en Google Scholar fue estudiada por Verstak et al (2014). el segundo punto importante respecto a su opacidad. Más allá de revelar los procesos de ordenación de resultados y otros procedimientos internos (algunos de ellos. que un usuario acceda al texto completo. por ejemplo. es un producto elaborado por una empresa privada. Las fuentes en abierto constituyen un número demasiado elevado (y con un dinamismo muy elevado) como para poder disponer de una master list de las mismas. se encuentran descritos en las patentes publicadas por el equipo de trabajo de Google Scholar). éstos no mencionan explícitamente la influencia directa que puede tener el uso del número de citas como elemente clave de posicionamiento web en su producto.

Respecto a las capacidades del buscador. entre muchas otras: —— Los operadores booleanos y el filtro temporal no funcionan con precisión (Jacsó. pues no se permite la selección de más de un ítem a la vez. desarrollado 2 El producto Google Scholar Citations ha elaborado un control de autoridades en agosto de 2015. —— No existe la posibilidad de restringir los resultados a enlaces que proporcionen acceso al texto completo. pero únicamente operativa en los perfiles académicos. Ni siquiera se puede realizar esta operación en la Biblioteca de Google Scholar. Respecto a la exportación y tratamiento de los resultados. . 2006). se destacan los siguientes puntos: La exportación de registros bibliográficos (a través de la opción “Citar”) es útil para copiar una referencia bibliográfica en un formato estándar en un documento de trabajo. Por otro lado. 2005) 2. típicamente incluidas en otros productos de información. el sistema muestra claramente una preferencia por la sencillez e inmediatez de las búsquedas a costa de limitar las opciones avanzadas. se destacan las siguientes limitaciones. En ese sentido. Las únicas opciones son por relevancia o fecha de indización). Esto hace que el proceso de exportación de referencias sea tedioso. tanto en la búsqueda avanzada de información como en las capacidades para exportar y tratar los resultados de las búsquedas efectuadas. —— No se permite la búsqueda por tipo de publicación o metodología de investigación (esencial por ejemplo en medicina).164 La revolución Google Scholar Prestaciones documentales El último punto importante a destacar respecto a las limitaciones de Google Scholar es el relativo a las escasas prestaciones documentales del sistema.000 resultados por búsqueda limita la realización de estudios métricos dada la imposibilidad práctica de recopilar todos los resultados existentes ante una determinada consulta. —— Carencia total de términos controlados y control de autoridades (Giustini y Barsky. Aunque existen diversos métodos como el query splitting (basado en la combinación especial de diversos términos de búsqueda). y no en la interfaz de búsqueda de Google Scholar. el límite de 1. —— No existe la posibilidad de ordenar los resultados en función de diversos parámetros. pero es insuficiente como para trabajar con ella de forma sistemática.

no trabaja sobre ninguna API. diversas variantes del h-index). Manipulación En el capítulo 6. que se concretan en su facilidad de manipulación. Entre estas aplicaciones destaca por encima de todas Publish and Perish 4. el control sobre el usuario y la excesiva dependencia en los productos de Google.com/pop.htm 165 . La falta de disponibilidad de una API (Application Programming Interface) en Google Scholar obliga a realizar descargas de datos de una forma manual desde la pantalla de resultados a una hoja de cálculo (u otra aplicación similar para el tratamiento de datos).uk 4 http://www.ac. el tiempo requerido para la recolección y procesamiento de datos en WoS (100 horas). Todas estas limitaciones llevan a que la recopilación y procesamiento de resultados de búsqueda sea un proceso costoso. ya se introdujo el término de ASEO (Academic Search Engine Optimization) al discutir acerca de la posición de los registros en la página de resultados ante una consulta concreta. Aunque su funcionamiento queda igualmente delimitado por los requisitos técnicos de Google Scholar.wlv. que les impide proporcionar contenidos estructurados a terceros. a través de una interfaz amigable. 2010). Meho y Yang (2007) incluso lo cuantifican mostrando. Amenazas Tras describir las principales ventajas e inconvenientes de Google Scholar. tedioso y definitivamente poco amigable (Bar-Ilan. La razón por la que el equipo de Google Scholar no habilita una API es debida a los contratos privados firmados con las editoriales u otras fuentes. aportando adicionalmente datos de interés para el análisis bibliométrico (por ejemplo. esta limitación invalida la realización de estudios bibliométricos con datos masivos. esta última sección del capítulo 7 se centra en las principales amenazas en torno a este buscador.harzing.Bloque A · Capítulo 7 · Google Scholar en la balanza por el equipo de Mike Thelwall en la University of Wolverhampton e incluido en la aplicación Webometric Analyst 3. Este hecho ya fue advertido por Jacsó (2008a). durante la descripción del registro bibliográfico en Google Scholar. Es decir. Scopus (200 horas) y Google Scholar (300 horas). A lo largo de los últimos años se han desarrollado aplicaciones que. Y en este mismo capítulo 3 http://lexiurl. para una misma muestra. permiten consultar y recuperar datos en Google Scholar.

Google Scholar detectó los seis artículos y atribuyó las citas falsas a los autores reales. provocando que estos documentos aparecieran en búsquedas para las que no eran relevantes. Robinson-García y Torres-Salinas (2014) realizaron un experimento para analizar la capacidad de Google Scholar para detectar la manipulación de citas. Los autores depositaron seis documentos falsos en un repositorio institucional. Sin embargo. una de las principales amenazas de las técnicas de ASEO es que puede ser tomado como una guía sobre cómo engañar y manipular a los motores de búsqueda (Beel. El investigador francés Cyril Labbé (2010) dio un paso más allá en el estudio de la manipulación de citas en Google Scholar utilizando la aplicación SCIgen para generar de forma automática una gran cantidad de artículos falsos firmados por un autor inventado (Ike Ankare). en este caso en los perfiles académicos (éstos serán descritos en el bloque B). el ASEO debería ser considerado. desde el punto de vista del investigador. Gipp y Wilde. posible. desde el punto de vista de los motores de búsqueda académicos. que aparecieron instantáneamente en sus perfiles académicos. De forma similar. Los autores indican cómo lograron incrementar la posición de documentos científicos manipulando artificialmente el número de citas. así como la posición en los resultados de búsquedas es posible en Google Scholar. Para ello. como una forma de hacer sus contenidos más amplia y fácilmente disponibles y. como una ayuda para comprender mejor el contenido de los artículos y trabajos académicos y mejorar así su precisión. los autores indizaron un conjunto de documentos en Google Scholar con cierto texto invisible. Estos experimentos demuestran que la manipulación de citas y otros indicadores bibliométricos. sin demasiado esfuerzo. Idealmente. 2010). En la sección de bibliografía se incluyeron adicionalmente de forma masiva referencias bibliográficas reales a diversos autores. sin la necesidad además de disponer de conocimientos informáticos excesivamente profundos.166 La revolución Google Scholar ha vuelto a ser comentado durante la discusión acerca de la opacidad de Google Scholar en el posicionamiento de los resultados. Beel y Gipp (2010) realizan diferentes pruebas en Google Scholar. firmados por un autor inexistente. Delgado López-Cózar. Este hecho puede tener un efecto devastador en procesos de evaluación y . mejorando de esta forma los indicadores bibliométricos asociados al impacto de sus trabajos. que al autocitarse entre ellos de forma masiva terminaron por convertir a este autor en el más citado de la historia. Los resultados muestran que esta manipulación es. Con el fin de determinar si la manipulación de los motores de búsqueda académicos podría ser efectivamente una amenaza.

va dirigida a poder ofrecer servicios completamente personalizados al usuario.Bloque A · Capítulo 7 · Google Scholar en la balanza selección de personal académico. al menos por el momento. financiación de proyectos o promoción institucional en los que se pueda utilizar Google Scholar como fuente complementaria. En todo caso. desde qué computador. Sin embargo. dejan entrever en parte la filosofía de Google en el sentido de que el propio sistema se autoregule. En palabras de Anurag Acharya (Van Noorden. aunque ciertas relativamente (el spam científico es mínimo y la comunidad científica se controla). habrá que observar cómo se desarrollan los acontecimientos a corto y medio plazo para valorar con mayor tino la magnitud de esta importante amenaza. Es posible que el poco personal dedicado a Google Scholar impida desarrollar prácticas anti-spam. 167 . para el equipo de Google Scholar. el sistema confía completamente en la honestidad del mundo académico. Google Scholar recopila una importante cantidad de información del usuario. según se mire. tanto los relacionados con sus búsquedas como con las horas a las que se conecta. que significarían tiempo y dinero. pues el número de citas es relevante .y en ocasiones definitivo . qué sistema operativo utiliza y qué es lo primero que lee cuando llega a la oficina. el sistema puede recopilar y combinar las actividades del usuario en todas las interfaces. Y el porcentaje de spam es todavía lo suficientemente reducido como para tener que tomar acciones concretas. Si el usuario además inicia la sesión en Google Chrome y tiene Google GMail abierto.en principio . Acharya no cree necesario realizar ningún tipo de acción específica.en la toma de decisiones. entonces su credibilidad profesional desaparecerá y la comunidad científica lo expulsará del sistema. 2014). Un investigador que manipule sus datos de citas será tarde o temprano descubierto. Y la imposibilidad de realizar un control humano de los contenidos albergados en Google Scholar dificulta enormemente la tarea de control. La recopilación de toda esta información . Control personal Si recordamos algunas de las funcionalidades descritas en el capítulo 6 (como las alertas o las recomendaciones) así como algunos de los productos que describiremos en el siguiente bloque (Google Scholar Citations y Google Scholar Metrics). Estas afirmaciones. Conocer sus gustos para poder servirle mejor o para poder equivocarse menos en sus recomendaciones (especialmente en las no gratuitas). pudiendo conocer todo tipo de datos. Por ese motivo. la posible manipulación de datos es entendida simplemente como spam.

las plataformas que salvaguardan nuestros datos de navegación suelen ser utilizadas en un alto porcentaje por personas que están realizando tareas de dudosa legalidad. que se rige además por la legislación del Estado de California. por ejemplo) 7 no permite ser muy optimista al respecto. la recopilación incluso por parte de Google Scholar de tanta información sobre los usuarios debería concienciarnos acerca del posible uso que la compañía privada pudiera hacer de ellos. Lamentablemente. existen pocos sistemas que realmente lo permitan.com 6 https://www. Además. Aunque el resto de bases de datos bibliométricas (productos pertenecientes a empresas privadas como Thomson Reuters o Elsevier) no están exentas de este mismo problema. si no tomara ciertas precauciones.semanticscholar. no podemos más que aplaudir tanto el desarrollo de nuevos motores de búsqueda (como Semantic Scholar) 8 como de otras plataformas sociales académicas. ¿Qué ocurriría si Google Scholar dejara de existir? ¿Y si pasara a ser un servicio de pago. entre otras.torproject. minúsculo dentro de un gigante como Google.org . No obstante. no debemos olvidar que Google es una compañía privada. en los Estados Unidos de América. En el caso de Google Scholar. Por ello.168 La revolución Google Scholar Aunque es cierto que existe la posibilidad de navegar de forma segura (los navegadores van incorporando esta opción). razón por la cual no desean dejar rastro alguno de su navegación por la Web. la dependencia en Google es tal vez excesiva hoy en día. que pueden aportar información complemen 5 https://duckduckgo. Nada asegura la pervivencia del buscador.com/googlegraveyard/google-graveyard 8 https://www. la gran cantidad de servicios y productos que Google ha deshabilitado a lo largo de los últimos años (baste recordar a iGoogle o Google Reader. el hecho de ser un motor de búsqueda académico sin publicidad incorporada impide de alguna forma la pérdida de excesivo control sobre la información personal que el usuario pudiera tener en el buscador general. total o parcialmente? Cuestiones que debemos tener siempre presente a la hora de depositar nuestra plena confianza en un sistema. Googlelización Aunque Google Scholar es un producto gratuito. La excesiva dependencia en un solo producto puede ser negativa.org 7 https://www.pinterest. más si tenemos en cuenta el tamaño del equipo de trabajo. como pueden ser Mendeley o ResearchGate. Hoy día destacan por ejemplo DuckDuckGo 5 o sistemas más complejos como Tor 6.

aunque existen rumores oficiales acerca de su reaparición a lo largo de 2016 9. los repositorios institucionales deberán dar un paso adelante para proporcionar igualmente datos científicos de valor añadido en abierto. de la Universitat Politècnica de Catalunya.microsoft.com) volvió a nacer en marzo de 2016. para no convertirse en auténticos cementerios de PDFs.edu 169 .Bloque A · Capítulo 7 · Google Scholar en la balanza taria y que debemos tener igualmente en cuenta como herramientas de análisis y evaluación. y Microsoft Academic Search (http://academic. 2014). El sistema FUTUR 10.upc. 10 http://futur. 9 Los rumores finalmente se confirmaron. es un fantástico modelo a seguir en el “futuro”. Finalmente. Del mismo modo se lamenta la desaparición silenciosa de Microsoft Academic Search (Orduña-Malea et al. research.

.

Bloque B La familia Google Scholar: Productos derivados oficiales e independientes .

.

arquitectura y presentación formal). 2000b. El producto se presentaba con una serie de características y funcionalidades que lo hacían único a cualquier otro ranking de revistas previamente conocido. destacando especialmente los trabajos de Cabezas-Clavijo y Delgado López-Cózar (2000a. De ese modo hemos hablado de su origen y evolución. los criterios de indización que se siguen y sus principales características y servicios. Por esta razón. accesible desde la opción “Metrics” del menú superior de la página de inicio del buscador. GSM es una herramienta distinta tanto en su concepción (producto híbrido [bibliométrico y bibliográfico] frente a JCR y SJR.Capítulo 8 Google Scholar Metrics: El impacto de las revistas científicas El bloque A de este libro ha estado dedicado a la descripción de Google Scholar. 2012a) y Jacsó (2012a. Igualmente hemos descrito su funcionamiento interno. 2000c. cobertura. Un nuevo servicio bibliométrico en acceso abierto El 1 de abril de 2012 Google Scholar sorprende a la comunidad bibliométrica con la aparición de un nuevo producto. Finalmente. 2012b). En este capítulo 8 nos centraremos en Google Scholar Metrics mientras que el Capítulo 9 estará dedicado a Google Scholar Citations. Este segundo bloque está dedicado en exclusiva a la descripción de los principales productos derivados de Google Scholar. Se trataba de un ranking de publicaciones científicas ordenado en función del h-index a partir de los datos de citaciones de Google Scholar. los análisis del producto no tardaron en aparecer. del impacto en el mercado de los buscadores académicos y en el de la evaluación de la investigación. el capítulo 10 mostrará nuevos productos independientes. y que pasó a conocerse como Google Scholar Metrics (GSM). 2000d. que son puramente bibliométricos) como en su materialización (diferente política. . indización.

Finalmente. chino. algunas de ellas heredadas de los errores de Google Scholar y otras propias del nuevo producto: —— La categorización por idiomas no tiene precedentes en la bibliometría. el sistema mostraba a su vez el conjunto de artículos que habían contribuido a ese valor. El usuario podía de este modo localizar una publicación. el sistema proporcionaba un buscador interno mediante el cual el usuario podía buscar directamente por palabra clave. español. Pulsando en el h-index correspondiente. Las revistas se encontraban categorizadas por idiomas (inglés. Esta decisión. original sin duda. Así mismo. pulsando en el título de cada artículo se podía acceder al texto completo (si estaba disponible). y se podía acceder igualmente a los artículos que contribuían al h-index Tanto Jacsó como Cabezas-Clavijo y Delgado López-Cózar detallan algunas de las importantes limitaciones del sistema. Al seleccionar un idioma cualquiera. el criterio de ordenación se basaba en el h-index (relativo a los últimos 5 años). De forma complementaria a la categorización por idiomas.174 La revolución Google Scholar La cobertura de Google Scholar Metrics se basaba en los siguientes criterios: —— Revistas con al menos 100 artículos publicados en el período 20072011. holandés e italiano). simple y robusto frente a los errores. tal y como remarcan Cabezas-Clavijo y Delgado López-Cózar en su informe de urgencia de 2012. dejaba relucir el escaso conocimiento del equipo de Google Scholar del mundo de la bibliometría y de las publicaciones académicas. incluía la posibilidad de ordenar por el h-index median (mediana del número de citas que contribuyen al h-index calculado). sencillo. de forma que Google Scholar se decantaba por el uso de este indicador. . Por otra parte.2011. ordenados por el número de citas recibidas por artículo. se mostraban un máximo de 20 resultados por consulta. coreano. aunque ésta no estuviera incluida en el Top 100 de su idioma. alemán. francés. el sistema mostraba un listado de las 100 revistas con mayor h-index. a pesar de sus conocidas limitaciones. japonés. portugués. —— Revistas con al menos 1 cita recibida para los artículos publicados en el período 2007 . Estas restricciones pretendían potenciar las publicaciones activas con una productividad media-alta (20 artículos al año) en un período reciente de 5 años. En este caso.

comparar en una misma dimensión ambos productos carece de validez científica. la adopción del h-index. 175 . las citas recibidas por dichos artículos deberían influir en el impacto de las revistas. generando errores en el h-index obtenido. Sin embargo. así como el papel que puede jugar en la evaluación de revistas en Ciencias Sociales y Humanidades y en el fomento de una sana competitividad en el mercado de los productos de evaluación de revistas. Estas importantes limitaciones llevan a Delgado López-Cózar y Cabezas-Clavijo (2012) a definir el producto como inmaduro. que aparecen mezclados junto con las revistas. y no en el de los repositorios. Este importante hecho es indicado tanto por Jacsó (2012b) como por Ortega (2014). como son los repositorios temáticos o series de monografías o informes técnicos (Delgado López-Cózar y Robinson-García. revistas y otros datos bibliográficos como la fecha de publicación). —— Cobertura: el sistema incorpora una variedad de tipologías documentales que difícilmente son comparables.Bloque B · Capítulo 8 · Google Scholar metrics —— Falta absoluta de estandarización: las publicaciones aparecen duplicadas bajo diferentes nomenclaturas y variantes e incluso en diferentes idiomas. plantea a Delgado LópezCózar y Robinson-García (2012) la realización de un análisis exploratorio a partir de una muestra formada por los 40 artículos más citados que contribuyen al h-index en cuatro repositorios incluidos en Google Scholar Metrics (RePec. reconocen la singularidad del producto. los datos mostrados no son reproducibles manualmente. Este último punto. Por tanto. con graves problemas en su configuración y funcionamiento. Google Scholar Metrics diferencia entre la versión de un artículo publicada en una editorial y la versión depositada en un repositorio. de indudable interés metodológico. Manteniendo el mismo número de citas recibidas. que lo convierten en una herramienta inadmisibile para propósitos evaluativos. el artículo se incorpora como documento citado tanto a la revista como al repositorio. por una parte. Arxiv. —— Control de calidad: los errores bibliográficos en los registros de Google Scholar no se habían corregido (identificación de autores. aunque con diferente descripción bibliográfica. Por otra parte. Los autores advierten que el 89% de los documentos de la muestra depositados en los repositorios habían sido previamente publicados en revistas. En el caso de los repositorios. 2012). Social Science Research Network y NBER). —— En algunos casos.

especialmente en el caso de repositorios que engloban a una gran cantidad de disciplinas (por ejemplo. la clasificación lingüística predomina frente a la temática. las distintas colecciones podían clasificarse en distintas categorías o subcategorías (por ejemplo. apenas siete meses y medio después de la primera versión. Chemical & Material Sciences. que ahora se incluían segmentados en distintas colecciones ofreciendo así una visión menos sesgada de su impacto. y no para el resto. Lamentablemente. y Social Sciences) y 313 disciplinas. En la figura 40 se observa la interfaz en la actualidad (septiembre 2015). Fiel a su filosofía empresarial. Health & Medical Sciences. la polijerarquía está aceptada en el sistema.176 La revolución Google Scholar Pero Google Scholar no había dicho todavía la última palabra. Arxiv). . en la que destaca la inclusión de la posición de una revista en las diferentes categorías temáticas en las que puede estar incluida (figura 40 b). arXiv Digital Libraries quedaría clasificada en Social Sciences – Library & Information Science. La respuesta de Google Scholar a las críticas siempre constructivas que se han realizado desde los numerosos informes técnicos y documentos de trabajo elaborados por el grupo de investigación EC3 ha sido siempre tan inmediata como silenciosa. Finalmente. es decir. Literature & Arts. y arXiv Cosmology and Extragalactic Astrophysics en Physics & Mathematics – Astronomy & Astrophysics). Humanities. Economics & Management. Engineering & Computer Sciences. pero actualizaba las citas recibidas hasta el 15 de noviembre). esta categorización se proporcionaba (y sigue proporcionando en la actualidad) únicamente para las revistas en inglés. el sistema visualizaba las primeras 20 publicaciones. se anunciaba una actualización de la base de datos en la que se eliminaban algunas de las deficiencias apuntadas en los estudios anteriormente citados. Es decir. Physics & Mathematics. En concreto 8 grandes áreas temáticas (Business. es que introducía una clasificación temática de las revistas. contestando de este modo a las críticas previas recibidas. aparte de la inclusión de nuevas revistas. De este modo. muy similar en prestaciones a la existente en 2012. Delgado López-Cózar y Cabezas-Clavijo (2012b) desgranan esta nueva versión identificando adicionalmente una serie de mejoras. el 15 de noviembre de 2012. Y para cada una de estas categorías y subcategorías. Life Sciences & Earth Sciences. entre las que se destaca la clasificación más granular de los repositorios. una misma revista puede estar integrada en diferentes categorías o subcategorías. La principal novedad de esta nueva versión (que mantenía el intervalo temporal.

Los autores observan cómo en apenas siete meses el h-index de las revistas incrementa un 15%. aunque con una tasa de crecimiento diferente por idioma. 2012d) donde 177 . Esta segunda versión mejorada de Google Scholar Metrics abría pues el camino a posibles estudios por disciplina y por tanto a facilitar de este modo la comparación de los indicadores proporcionados (básicamente h-index) con los correspondientes a otras bases de datos. Interfaz de Google Scholar Metrics (versión 2015). Listado de revistas por idioma (a) y de artículos por revista (b) La existencia de dos versiones en un mismo año presentaba la oportunidad a Orduña-Malea y Delgado López-Cózar (2014) de medir la estabilidad de los indicadores bibliométricos entre las fechas correspondientes (abril y noviembre de 2012). En esa línea se sitúan los trabajos de Cabezas-Clavijo y Delgado López-Cózar (2012c. de una forma mucho más sencilla y rápida que antaño.Bloque B · Capítulo 8 · Google Scholar metrics Figura 40.

en la que se volvía a ajustar el marco temporal (2009-2013). Cabezas-Clavijo y Delgado López-Cózar (2013) realizan una comparativa para las revistas en biomedicina observando cómo Google Scholar (a través de los ojos de Google Scholar Metrics) obtenía unos valores de h-index un 30% superiores a los obtenidos por WoS y Scopus. El 24 de julio de 2013 llegaría la tercera versión del producto 1. los autores observan cómo Google Scholar Metrics proporciona un h-index en promedio 47% y 40% superior que Scopus y WoS respectivamente. cuya principal novedad sería la actualización del marco temporal (2008-2012). Los autores destacan la capacidad de Google Scholar Metrics para identificar las revistas principales de la disciplina. su gratuidad y sus criterios alternativos de ranking (como la mediana del h-index en el período). llevan a Delgado López-Cózar y Cabezas-Clavijo (2013) a definir Google Scholar Metrics como una herramienta de indudable ayuda tanto para autores como editores a la hora de localizar las revistas nucleares de un área o de conocer el impacto de una publicación específica en una ventana de citación de 5 años (más adecuada para las ciencias sociales). incapaz de recuperar todas las revistas pertinentes a través de una consulta con la raíz de palabras comunes (por ejemplo “cardiol”). De forma similar.blogspot.blogspot.html . En este caso. se constataba que las actualizaciones de datos suponían un borrado de las versiones anteriores.html 2 http://googlescholar. 1 http://googlescholar. Por otra parte. aunque todavía con importantes limitaciones.com. Así mismo. Delgado López-Cózar y Repiso (2013) analizan 277 revistas en el área de Comunicación.es/2014/06/2014-scholar-metrics-released. doblar la cobertura general de la misma así como reducir el sesgo hacia el idioma inglés. Con ello Google dejaba claras sus intenciones de mostrar datos relativos a los últimos 5 años (Cabezas-Clavijo y Delgado López-Cózar. Las mejoras del producto. El 26 de junio de 2014 aparecía la cuarta versión de Google Scholar Metrics 2. podrían constituir un desafío futuro para otros productos ya establecidos en el mercado.com. con errores en el título o problemas graves en el buscador interno. aunque los distintos errores y limitaciones denunciados con anterioridad seguían vigentes.178 La revolución Google Scholar se demuestra como los criterios de indización adoptados por GSM dejan fuera a casi un 40% de las revistas indexadas en Google Scholar (635 revistas de 1038 identificadas en GS). por lo que resultaba imposible la realización de estudios evolutivos si con anterioridad no se habían almacenado los datos. 2013). Se detectaban artículos sin enlace al texto completo. duplicados.es/2013/07/2013-scholar-metrics-released. Por otra parte.

cobertura. European Studies.100 revistas). lo que fija en 5.338) están clasificadas en más de una categoría.000 publicaciones. en lo que supone el trabajo seguramente más exhaustivo realizado hasta la fecha.7% (1. el inglés domina claramente con el 89% de las publicaciones (4.418 el número de publicaciones únicas. Lipids. simplicidad) pero una serie de limitaciones importantes si se compara con las prestaciones de otros productos comerciales. Finalmente. Circadian Rhythms & Sleep. En el caso español. and Cryogenics & Refrigeration). con una serie de ventajas (como la gratuidad. lo que supone aproximadamente un 45% del número total de publicaciones en España. aunque su cálculo preciso es imposible de llevar a cabo debido tanto a las limitaciones del buscador interno como a las restricciones impuestas en la visualización de resultados. Adicionalmente.435). Martin-Martin et al (2014) no dudan en calificar Google Scholar Metrics como un producto “low cost”. de las que el 24. se estiman sobre las 1. Los autores proponen finalmente una serie de propuestas de mejora con el fin de eliminar la etiqueta “de bajo coste” (Tabla 7): 179 . Esta nueva versión es descrita y analizada de forma completa por Martin-Martin et al (2014). Los autores estiman que el número total de revistas incluidas en Google Scholar Metrics (versión 2014) es probablemente superior a 40. mostrando únicamente 983 revistas escritas en otros idiomas (lógico si tenemos en cuenta que las categorías solamente están habilitadas para las revistas escritas en inglés).2% (118) son repositorios temáticos. Dadas las características del producto.000. sin mayor novedad que la desaparición de algunas subcategorías (Microscopy. Back & Spine Health.3% (232) son conferencias y el 2. Real-time & Embedded Systems. el informe contabiliza el número de publicaciones que pueden ser visualizadas en la versión 2014 sin necesidad de utilizar el buscador interno (un total de 7. Entre este número de publicaciones.5% de los registros corresponden con revistas académicas. el 93. mientras que el 4.Bloque B · Capítulo 8 · Google Scholar metrics caracterizándose por la continuidad con la versión anterior.

Master list de publicaciones Proporcionar la lista detallada de publicaciones. enlaces incorrectos. Master list por publicación Incluir el número de documentos por publicación. en el anuncio de esta nueva . La última versión hasta la fecha de Google Scholar Metrics data del 25 de junio de 2015. etc. Ordenación de resultados Permitir ordenar los resultados por título de la publicación. Esta versión destaca fundamentalmente por la continuidad con las versiones anteriores. Recomendaciones de mejora para Google Scholar Metrics PROPUESTA DETALLE Indicadores bibliométricos Incluir otros indicadores como la tasa de autocitación de las revistas. idioma y editorial. país y editorial Ampliar límite de resultados No restringir o ampliar el límite de 100 resultados por idioma y 20 resultados por categoría/subcategoría y por búsqueda manual. por idioma. Por ejemplo. en la medida de lo posible. por país y editorial. incluyendo aquellos con 0 citas. que el equipo de Google Scholar sigue los análisis que sobre sus productos se realizan para mejorarlos y corregirlos. así como por la eliminación de muchos de los errores constatados y descritos en el informe de Martin-Martin et al (2015).180 La revolución Google Scholar Tabla 7. Opciones de búsqueda Permitir la consulta. además de por idioma. una vez más. La posibilidad de seleccionar diferentes marcos temporales según la categoría ofrecería una visión más justa del impacto de las publicaciones.). especialmente para las revistas de ciencias sociales y humanas Versiones previas Permitir el acceso y consulta de las versiones previas. Personalización del período de citación por categoría Los diferentes patrones de publicación y citación entre las diferentes categorías aconsejan a utilizar diferentes ventanas de citación por disciplina. para conocer la evolución del impacto de las publicaciones en el tiempo. valor de indicadores. Exportación de resultados Permitir la descarga y exportación de resultados. Comunicación con los usuarios Permitir a los usuarios una opción para informar acerca de errores (duplicados. fundamental para verificar los datos proporcionados por Google Transparencia en la clasificación Definir los criterios seguidos para la creación de las categorías y subcategorías. Este hecho muestra. especialmente el número de conferencias y repositorios incluidos. país. títulos erróneos. Tiempo real Actualizar a tiempo real los indicadores (tal y como sí hace Google en los perfiles académicos) Opciones de navegación Permitir la navegación. tanto por disciplina como por consulta específica. además de por título de revista. en la que el marco temporal se actualiza a 2010-2014. el índice de inmediatez o las citas normalizadas.

Este dato. constituyendo en la actualidad un servicio más completo y de mayor calidad que el ofrecido en su primera versión. viene definitivamente a demostrar la dificultad de realizar un control automático sobre un conjunto dinámico de revistas y publicaciones en un producto gratuito realizado por pocas personas. En la figura 41 se puede observar la interfaz actual de Google Scholar Metrics (versión 2015). la corrección de errores y la robustez del producto han ido mejorando paulatinamente. Por ejemplo.000 formas diferentes de referirse a la Conference on Computer Vision and Pattern Recognition. el equipo de Google Scholar advierte de los problemas existentes con el control y normalización de los títulos de revistas. aunque algunas de sus limitaciones más importantes (especialmente el número de revistas mostrado por categoría y la restricción del uso de categorías al idioma inglés) impiden la generalización de su uso. por ejemplo. en el que ya advierten de la enorme cantidad de variantes existentes para referirse a una publicación. sin duda significativo. En cualquier caso.Bloque B · Capítulo 8 · Google Scholar metrics versión. constatan la existencia de 9. advierten hasta 959 formas de referirse a la revista PNAS (Proceedings of the National Academy of Sciences). Interfaz de Google Scholar Metrics (versión 2015) 181 . en este caso para la subcategoría de Library & Information Science: Figura 41. El problema de la normalización ha estado no obstante presente desde el lanzamiento del producto.

En torno a 1. a modo de ilustración. Ayllón. portugués y español. constituyendo un esfuerzo de gran utilidad para conocer la presencia e impacto de las revistas españolas en este buscador. H-index por idioma en Google Scholar Metrics IDIOMA H-index H-index Median Inglés 377 130 Chino 57 27 Portugués 45 15 Alemán 24 10 Español 34 13 Francés 22 9 Italiano 11 4 Japonés 12 6 7 2 Holandés Pese al enorme sesgo mostrado hacia el inglés (no en el sentido de impacto sino en el de la aplicación de subcategorías). Ayllón. así como la mediana de las 100 primeras publicaciones mostradas por idioma. ocultas en primera instancia. el buscador interno ha permitido la localización de revistas. Ruiz-Pérez. Delgado López-Cózar. No obstante. 2015) en el que las publicaciones se clasifican por áreas temáticas y se ordenan en función del h-index. Nature ocupa la primera posición con un impresionante valor de h-index igual a 377 en los últimos 5 años. la combinación de distintas disciplinas en este ranking invalida cualquier tipo de comparación seria. desde el Grupo EC3 se viene realizando un informe anual de las revistas científicas españolas según Google Scholar Metrics (Delgado López-Cózar. Tabla 8. 2013. Ayllón et al 2014. . el h-index más elevado para cada idioma. seguido por el chino. En este sentido. Los datos reflejan claramente el predominio del inglés.000 revistas son listadas cada año (Figura 42). En la Tabla 8 se muestra. Le sigue en segundo lugar The New England Journal of Medicine (328) y Science (316) en tercer lugar. siendo la revista con mayor puntuación en Google Scholar Metrics. Ruiz-Pérez 2013.182 La revolución Google Scholar En lo que respecta al ranking general de revistas para el idioma inglés.

Bloque B · Capítulo 8 · Google Scholar metrics Figura 42. de más países y en más lenguas que los productos tradicionales de revistas patrocinados por Thomson Reuters y Elsevier. 2014). 183 . Repiso-Caballero. Número de revistas científicas españolas indizadas en Google Scholar Metrics En la misma línea. Delgado López-Cózar. Y en ambos casos se obtienen las mismas conclusiones: GSM identifica más revistas. en más idiomas. 2014) o la enfermería (Reina. Delgado López-Cózar. 2013. se ha explorado la capacidad de GSM para cubrir revistas en disciplinas como la comunicación (Repiso-Caballero. 2013.

.

hasta pequeños widgets que permiten la incorporación en una página de un listado de publicaciones generado en otras aplicaciones externas. que sirven al fin y al cabo de reclamo para facilitar la interacción entre usuarios. pues éstos tenderán a establecer algún tipo de interacción con otros usuarios con interereses comunes. Estas plataformas permiten la creación online del perfil de cada usuario en el que éstos pueden depositar sus trabajos científicos así como remarcar sus habilidades. Academia. discutir de forma privada o pública y seguir las publicaciones de algún autor determinado). que se fundamentan en las interacciones entre académicos (el sistema les permite compartir material.Capítulo 9 Google Scholar Citations Los perfiles académicos en la Web Completamente sumergidos en la segunda década del Siglo XXI. la Web se ha integrado en nuestras actividades. Se pueden encontrar desde plugins específicos para gestores de contenidos web como Wordpress que permiten la construcción de una página personal académica.edu o Mendeley). transformando la forma y modo en que nos comunicamos los unos con los otros. Así mismo han proliferado las llamadas redes sociales académicas (como ResearchGate. Instrumentos tan aparentemente sencillos y perennes como un currículum académico han sufrido igualmente una transformación justo delante de nuestros ojos. experiencia y actividades. Y no hablamos de la simple utilización de un procesador de textos para crear un CV (esto supondría volver a la época en la que los ordenadores se utilizaban como sustitutos de la máquina de escribir). tanto cotidianas y personales como profesionales. sino de los perfiles académicos en la Web. En la actualidad existe una amplia variedad de aplicaciones que permiten a un académico la construcción de su currículum investigador en la Web. algunos repositorios (tanto temáticos como institucionales) han comenzado a generar perfiles académicos a par- . Aunque menos usuales.

el servicio de perfiles académicos que pre- . Introducción a los perfiles académicos de Google Scholar El 20 de julio de 2011 Google Scholar anuncia la creación de este nuevo servicio de perfiles académicos a través de su blog oficial. Sin embargo.186 La revolución Google Scholar tir de los datos disponibles en sus plataformas. o el servicio Author Citation Profiles. así como de las potencialidades del motor de búsqueda que los sustentan para ofrecer servicios de valor añadido. aunque el servicio estaba limitado a un pequeño número de usuarios con el fin de testar sus funcionalidades. dentro del conglomerado de servicios del repositorio RepEC. podemos distinguir una última categoría de perfiles académicos que son creados de forma automática (o asistida) por un motor de búsqueda académico. etc. y c) otros servicios adicionales. ya abierto para todos los usuarios. Tras unos meses de prueba. b) la posibilidad de interaccionar con los “currículums” de otros investigadores. Tal y como indica Ortega (2014) en su obra dedicada a los motores de búsqueda académicos. Tanto las redes sociales académicas como los perfiles académicos de los repositorios se nutren de los documentos que los propios investigadores (o en quien éstos deleguen) han depositado en la plataforma o repositorio. Por tanto. creación de alertas. Estos perfiles se caracterizan por hacer uso de la amplia cobertura mundial de la que disponen (los repositorios están limitados a una institución o temática). ya mencionado con anterioridad. se puede observar la existencia de una tendencia clara hacia la creación de un currículum académico online y multiplataforma en el que no sólo aparecen listadas las publicaciones de un autor como en un CV clásico o una página web personal simple. sino que el sistema proporciona a) métricas de producción e impacto. En este caso podemos destacar el proyecto FUTUR. ventajas y limitaciones. de la Universitat Politècnica de Catalunya. el servicio de perfiles académicos creado por Google Scholar. Entre éstos destacan los perfiles personales de Microsoft Academic Search (desactualizado) y Google Scholar Citations. con el fin de generar estadísticas de índole bibliométrica a nivel de autor. incluido en el producto CitEc (Citations in Economics). describiendo sus principales características. el producto fue lanzado definitivamente el 16 de noviembre de ese mismo año. funcionamiento. En este capítulo abordaremos el servicio de Google Scholar Citations. como por ejemplo la búsqueda asistida de material académico relevante.

los objetivos de Google Scholar se dirijen hacia la localización de material académico y no al posible uso posterior de los datos albergados. Además. El sistema detecta automáticamente que existe un perfil público (este concepto será explicado más adelante) cuyo nombre coincide con la cadena de caracteres buscado.Bloque B · Capítulo 9 · Google Scholar Citations sentaba Google Scholar difería sustancialmente de los existentes hasta la fecha. Este sistema de recomendación de resultado permite que los usuarios interesados en localizar una o varias obras de este autor (pero tal vez sin una idea exacta de qué obras desea localizar. cuándo y a qué documentos de un perfil. el sistema lo incorpora en la página de resultados. Una vez activado. Al igual que se ha señalado en capítulos anteriores. El usuario debía activar personalmente el servicio. De este modo. Aunque la utilización de los perfiles personales (y la ulterior explotación de sus datos) ha servido posteriormente a los investigadores para conocer innumerables aspectos acerca de la producción e impacto de los autores. Conocer y dar a conocer algunos indicadores bibliométricos. el servicio era lo suficientemente abierto y permisivo como para permitir al usuario la creación de cualquier perfil. Saber quién cita. Estas tres características juntas dotaban a Google Scholar Citations (GSC) de unas propiedades únicas en el mercado de los perfiles académicos online. La integración de los perfiles académicos en las páginas de resultados ante determinadas búsquedas (Figura 43) proporciona suficientes pistas acerca de la utilidad de estos perfiles en los procesos de búsqueda de información. el perfil se encontraba completamente vacío a la espera de que el usuario fuera rellenándolo con sus publicaciones (en principio solamente aquellas indizadas en Google Scholar). la idea original de Google Scholar distaba de esa finalidad métrica. no necesariamente el propio. Todo ello sin contar la plena disponibilidad de la base de datos de Google Scholar como telón de fondo para alimentar los perfiles. puede que algunas que traten un determinado tema) puedan filtrar su búsqueda al entrar 187 . Las principales ventajas que el uso de GSC puede aportar son las siguientes: —— —— —— —— —— Mejorar la visibilidad e impacto de un autor. resaltándolo de éstos y mostrando los datos más importantes (adscripción y citas recibidas). Difundir las publicaciones científicas y otros trabajos académicos. En la figura 43 se ha realizado una búsqueda libre por nombre de autor (baeza-yates) en el cajetín general de Google Scholar. Estar al día mediante la configuración de alertas personalizadas.

El mantenimiento y la calidad de los datos contenidos en el perfil ya será harina de otro costal. Seguidamente. ya habremos iniciado sesión).com/scholar?hl=en&q=baeza-yates> Creación de un perfil académico en Google Scholar La creación de un perfil académico es sencilla y consiste en tres pasos (creación de la cuenta. El principio bastará con tener una cuenta de Gmail creada. como Gmail o Chrome.com>. En este punto. Este paso es absolutamente obligatorio. Acceso al perfil Una vez disponemos de una cuenta de correo electrónico. se describen estos pasos de forma más detallada: Creación de la cuenta La creación de un perfil académico exige una cuenta de correo electrónico.google.188 La revolución Google Scholar en el perfil académico correspondiente. deberemos pulsar en la opción de menú denominada “My citations”. Integración de perfiles académicos en Google Scholar <https://scholar. Se aconseja por otra parte que sea una cuenta personal y no institucional. . accederemos a la siguiente dirección: <scholar.google. A continuación. debemos iniciar sesión registrada en Google (si hubiéramos iniciado sesión previamente en algún producto o servicio de Google. si es posible. pues sí exigirá un mayor trabajo y cuidado por parte de los usuarios. En la figura 44 se muestra este paso de forma gráfica. en el que les será más cómodo. acceder al documento deseado. acceso al perfil y creación del perfil). rápido y seguro localizar y. Figura 43.

afiliación institucional. Registro de un perfil en Google Scholar Citations Veamos estos campos más detenidamente: En cuanto al campo “Name”. y estemos por tanto en el proceso de creación del mismo. email de verificación. Perfil Los campos que debemos cumplimentar en este primer paso son los siguientes: nombre. Se aconseja siempre utilizar el estilo de firma normalizado (independientemente de todas aquellas variantes de firma que el autor o 189 . Acceso a Google Scholar Citations Creación del perfil En el caso de que sea la primera vez que accedemos al perfil. Figura 45. artículos y actualización. el usuario deberá incluir su nombre completo. al pulsar en “My Citations” accederemos al formulario de registro del perfil formado por tres pasos: perfil. áreas de interés y página personal (Figura 45).Bloque B · Capítulo 9 · Google Scholar Citations Figura 44.

) y finalmente. pues Google Scholar detecta que el perfil no es de usuario y limita su visibilidad. su institución (universidad. Si el perfil es privado. éste podrá 1 Cuidado en todo caso con esta práctica. no mostrándolo en ocasiones en la página principal de resultados tal y como veíamos en la Figura 42. el país. . empresa. organización. la validación solamente será necesaria para convertir el perfil en público. etc. El campo “Affiliation” debe servir para que los autores incluyan su institución. Así mismo. El sistema enviará automáticamente un correo a la dirección indicada con el fin de validar la creación de la cuenta (pues cualquier usuario podría incluir una dirección de correo falsa o simplemente de otra persona sin su consentimiento). como por ejemplo el nombre de una revista. su unidad (grupo de investigación.190 La revolución Google Scholar autora hayan podido utilizar a lo largo de su carrera) para evitar variantes que puedan impedir una localización completa de contribuciones y citas a éstos. Es decir. El campo del correo electrónico es obligatorio. Este correo no tiene por qué ser necesariamente el mismo con el que el autor se ha registrado en el sistema. de una editorial o de algún grupo de investigación. podría incluirse el nombre de una persona (que será lo más usual) pero también el de otros agentes de investigación. El nombre incluido en este campo será tanto el nombre que aparecerá posteriormente en el perfil como la cadena de caracteres que se utilizará como búsqueda por defecto para localizar trabajos a incluir en el perfil. por ejemplo 1. Con el fin de que este sistema de control de autoridades funcione con mayor precisión. con el fin de que todos los autores de una misma institución puedan ser localizados y recuperados bajo este campo de forma normalizada. Nótese que no existe restricción alguna para introducir el campo nombre. Así mismo se recomienda a las instituciones que desarrollen políticas específicas para estimular el uso de formas estandarizadas. facultad o departamento). por lo que se aconseja no extenderse demasiado. centro de investigación. lo que permite que un usuario pueda utilizar otro correo distinto o incluso cumplimentar el perfil de otra persona. se recomienda incluir la posición o cargo ocupado por el investigador. El sistema tiene una longitud limitada de caracteres. Durante julio de 2015. instituto de investigación. el equipo de Google Scholar Citations incorporó un servicio de afiliación institucional controlada (que será comentado en secciones posteriores). Sin embargo. si todavía tenemos espacio. se aconseja a los autores que incluyan en este campo siempre la forma estandarizada de su institución (o al menos la variante adoptada por Google Scholar) en su lengua original (sin traducir).

lo más importante. Pese a los distintos controles de seguridad indicados en este apartado (como el del correo electrónico). en la actualidad existen perfiles públicos que los incumplen 2. se recomienda incorporarla.Bloque B · Capítulo 9 · Google Scholar Citations existir. Todos estos campos podrán ser posteriormente editados. lo usuarios podrán acceder a la página personal. Finalmente. Por tanto. una vez el perfil esté creado. En este caso se aconseja igualmente la utilización de términos estandarizados y en la forma y género adoptados por la mayoría de los usuarios. organización. centro de investigación. recomendamos encarecidamente cumplir con las normas indicadas por el equipo de Google Scholar. 191 . El campo “Areas of interest” sirve a los autores para incluir palabras clave que describan sus intereses académicos o sus principales líneas de trabajo e investigación. los posibles contenidos académicos incorporados a este sitio web podrán ser incluidos en el perfil. institución. 2 Por ejemplo. como por ejemplo el Derecho. keywords o email verificado. Si se desea una mayor proyección o visibilidad internacional. sí se recomienda en este caso la adopción del término en inglés. empresa u organismo en el que trabajen. El sistema permite la incorporación de hasta 5 keywords. se separa el correo electrónico personal de control del perfil. aunque nunca se valide el correo enviado a la dirección de correo electrónica incluida en este campo. De este modo. mejorando su visibilidad) y. el campo “Homepage” está destinado a que los autores incorporen el URL de su página personal académica. en caso de que dispongan de ella. Pese a ello. En este caso. cualquier otro sitio web creado de forma independiente será de gran utilidad. excepto en temas muy locales y específicos. empresa. pues aparecerá en el perfil público (por tanto. Así mismo. En todo caso. etc. En este caso el sistema recomienda que se utilice una cuenta de correo electrónico institucional (universidad.es/citations?user=fd_7rQ4AAAAJ> no posee datos de afiliación. esta página será indizada por los robots de Google Scholar e incorporada dentro del espacio académico web.google. pues de ello dependerá en una parte importante el buen comportamiento del sistema a la hora de localizar la producción y citas correspondientes con las que se alimente el perfil académico. si los autores disponen de una página oficial creada dentro del dominio académico de la universidad. siempre se recomienda tomarse el tiempo necesario para cumplimentarlos con el mayor rigor.). el perfil público <https://scholar. y el correo institucional que sirve para validar la cuenta.

192

La revolución Google Scholar

Artículos
Una vez tengamos cumplimentados todos los datos descriptivos podremos seguir al siguiente paso del proceso de creación del perfil, los
artículos. Esta segunda pantalla está dividida en cuatro zonas: el tipo
de búsqueda (por artículos o por grupos de artículos), el buscador, los
resultados y las métricas asociadas a los resultados (Figura 46).

Figura 46. Búsqueda de artículos en un perfil en Google Scholar Citations

El sistema permite la búsqueda tanto de artículos individuales como
de grupos de artículos (agrupados por autor). Por defecto, en el cajetín
de búsqueda aparecerá la cadena de caracteres que hayamos introducido en el campo “Name” del paso anterior. Por ejemplo, si seleccionamos
la opción de añadir artículos, el sistema devolverá todos aquellos artículos relevantes ante esta búsqueda. Al lado de cada resultado tendremos
disponible una casilla para seleccionar un artículo e incluirlo en el perfil.
Una vez se añada un artículo, los datos correspondientes se actualizarán en la parte izquierda de la pantalla, mostrando tanto el número
de artículos incorporados al perfil hasta ese momento como el número
total de citas recibidas por dichos artículos.
El cajetín de búsqueda está totalmente habilitado para que podamos
realizar distintas búsquedas, y no sólo la correspondiente al nombre del
autor. Aunque las opciones no son tan extensas como las disponibles en
Google ni en Google Scholar, puede servir para filtrar más adecuadamente las búsquedas. En este momento de la creación del perfil se recomienda realizar una búsqueda muy general e incluir algunos pocos registros
al perfil, con el fin de finalizar el proceso de creación del mismo.
Más adelante ya tendremos tiempo para volver a esta pantalla de
edición y dedicar una buena parte de nuestro tiempo a ir probando con

Bloque B · Capítulo 9 · Google Scholar Citations

paciencia nuevas consultas, identificando artículos y mejorando la cobertura y precisión de los datos de nuestro perfil. En la sección dedicada
a la gestión del perfil volveremos por tanto a este importante punto.
Actualizaciones
Finalmente llegamos al último paso para la creación del perfil. En este
caso el sistema nos solicita que decidamos el proceso de actualización
del perfil. Se puede optar por una actualización automática o manual
(Figura 47).

Figura 47. Modos de actualización de un perfil en Google Scholar Citations

La actualización automática supone que el sistema se autoregula.
Dados los artículos incluidos en el sistema, los intereses incorporados
como keywords y el nombre del perfil, el sistema es capaz automáticamente de identificar nuevas aportaciones e incorporarlas automáticamente al sistema, actualizando con ello los datos bibliométricos pertinentes.
Por el contrario, la opción manual implica que el sistema no introduce ningún registro sin el consentimiento previo del autor. Para ello se
envía un correo electrónico a la dirección marcada por el usuario cada
vez que un nuevo recurso tiene altas probabilidades de corresponder
con una contribución a ser incluida en el perfil. De este modo el usuario
puede validar o no dicha inclusión.

193

194

La revolución Google Scholar

En términos generales, el sistema automático se recomienda a usuarios que tengan el perfil muy cuidado y pulido (las incorporaciones serán
más fiables y acertadas) y que lo revisen con cierta periodicidad. De esta
forma, ante la incorporación de un registro equivocado, podrían darse
cuenta y eliminarlo manualmente a la mayor brevedad. Por el contrario,
para aquellas personas que no actualicen demasiado el perfil, se recomienda una actualización manual, pues la incorporación de muchos registros equivocados y la no edición o eliminación de éstos por el usuario
podría dar lugar a una mala imagen pública del perfil.
Una vez elegida la modalidad de actualización del perfil, el usuario
ya podrá finalizar el proceso y acceder al perfil académico creado. En la
figura 48 (arriba) se muestra la pantalla de un perfil ficticio creado para
un investigador. Como podemos observar, el perfil está completamente
vacío (no se ha incorporado ningún artículo en la fase de creación) y
es privado. En la figura 48 (abajo), se muestra el perfil completamente
creado y público.

Figura 48. Perfil privado (arriba) y público (abajo) en Google Scholar Citations

Bloque B · Capítulo 9 · Google Scholar Citations

Un perfil privado significa que solamente podrá ser visible por el
usuario que lo haya creado, a partir de su pantalla de inicio en Google
Scholar una vez ha iniciado sesión en el navegador. Nadie más podrá acceder a este perfil ni a la información que contiene. Del mismo modo, no
aparecerá en los resultados de ninguna búsqueda. Por el contrario, un
perfil público podrá ser accedido libremente por cualquier usuario sin
necesidad alguna de haber iniciado sesión. Este perfil aparecerá igualmente en los resultados de búsqueda. Además, Google Scholar nos marcará la existencia de un perfil público subrayando el nombre del autor
correspondiente en el registro bibliográfico de un resultado.
Los perfiles permanecen privados por diversas razones. Por ejemplo,
puede que estén en plena construcción y sus responsables no deseen
hacerlos públicos hasta que estén completamente construidos. Es asimismo posible que se estén realizando pruebas o ejercicios con fines de
formación (como el ejemplo de la figura 48). En otros casos, algunos investigadores desean mantenerlo únicamente para un uso personal (conocer su impacto), pero no desean que otras personas puedan acceder a
él, bien porque no deseen entrar en un juego de comparaciones o competencia con colegas o simplemente porque los datos tal vez son peores
de los esperados y no se desea dar una mala imagen académica pública.
En cualquiera de los casos, creemos con sinceridad que los profesores de universidades e instituciones públicas deberían mantener estos
perfiles públicos en aras a ofrecer una mayor transparencia hacia los
ciudadanos acerca de su quehacer como investigadores, y que estas instituciones deberían establecer las actividades necesarias tanto de formación como de difusión para que sus investigadores mantuvieran un
perfil actualizado, con el fin de aumentar la visibilidad académica de la
institución.

Gestión de un perfil académico en Google Scholar

Una vez el perfil está creado correctamente, el siguiente paso consiste en su edición, gestión y mantenimiento. Con el propósito de ilustrar
este proceso, utilizaremos un perfil académico real, en este caso perteneciente a uno de los autores (Figura 49). De este modo podremos
ilustrar todo el proceso de edición personal sin necesidad de recurrir a
perfiles de otras personas o perfiles no existentes.
En la figura 49 se puede observar la composición de un perfil público
cuando se accede a éste como usuario registrado. Se pueden distinguir
las siguientes cinco áreas:

195

196

La revolución Google Scholar

—— Área personal: información descriptiva del perfil, correspondiente
principalmente a un/a autor/a, aunque podría pertenecer, tal y como
se comentó anteriormente, a otras entidades como revistas, editoriales o grupos de investigación.
—— Buscador interno: este buscador permite localizar perfiles académicos a partir de la búsqueda directa por palabras clave. Es por tanto
diferente al buscador de Google Scholar.
—— Información bibliométrica: se proporcionan diversas métricas de impacto académico.
—— Área de información: contiene los registros incluidos en el perfil.
—— Área de co-autores: muestra los autores que han colaborado con el
autor en las publicaciones incluidas en el área de información.
A continuación desgranaremos cada una de estas áreas con el fin de
conocer al detalle los distintos servicios y opciones de los perfiles académicos de Google.

Figura 49. Perfil público en Google Scholar Citations

es). existen tres campos que aparecen como hiperenlaces en el perfil público: la web personal.Bloque B · Capítulo 9 · Google Scholar Citations Información personal Si pulsamos en el botón de editar situado en el área de información personal. arriba). 197 . podemos acceder a la edición manual de esta información (Figura 50). sino únicamente el dominio (en este caso upv. Por otra parte. Información personal en Google Scholar Citations Por defecto. siendo este proceso siempre reversible. la información que aparece es la que el autor introdujo en el proceso de creación del perfil (concretamente en el primer paso). la afiliación institucional y las etiquetas correspondientes a las palabras clave. Figura 50. Igualmente tenemos la opción de convertir el perfil en privado o público de forma sencilla. con el propósito de no ofrecer información personal y de validar la afiliación institucional. Podemos observar cómo el email de verificación no aparece en su forma completa en la versión pública (figura 50.

Esta práctica sin duda penaliza el posicionamiento web de estas páginas. por el momento. Al pulsar sobre éste. ordenados por . diversos problemas en la desambiguación de instituciones y acrónimos o la incapacidad. El análisis pormenorizado del mismo se puede localizar en un informe realizado por OrdunaMalea et al (2015). Por último. de gran importancia especialmente en el mundo anglosajón). Respecto a la afiliación personal. y no el nombre del sitio web o el URL. incluyendo diversas variantes recogidas por el sistema. Este servicio fue incluido por el equipo de Google Scholar Citations durante el verano de 2015. Es importante mencionar que la etiqueta del hiperenlace es siempre “homepage”. de identificar más de una afiliación por perfil o las unidades internas de una institución (facultades o escuelas. no reconocimiento de instituciones con pequeños errores de escritura. en el momento de redactar estas líneas este sistema adolece de una serie de limitaciones. podemos observar cómo en la parte inferior de la figura 50 se ha introducido el término “Universitat Politècnica de València”. En la parte superior de la figura se muestra como esta afiliación (y sólo esta parte de toda la información contenida en este campo de afiliación) se ha transformado en un hiperenlace. títulos uniformes erróneos.198 La revolución Google Scholar En cuanto a la web personal. Cualquier otro sitio web similar (como el perfil público de Mendeley) o página web personal podrán ser incluidos. el autor debe incluir un único URL válido (no se pueden incluir dos sitios web). En la figura 50 se ha optado por incluir la dirección correspondiente a otro perfil académico (en este caso ResearchGate) con el propósito de que Google Scholar índice bien esta plataforma. las cinco keywords que el sistema permite como máximo incluir en el campo de áreas de interés se transforman automáticamente en hiperenlaces que permiten reunir en una nueva página de resultados a todos los perfiles que compartan una misma etiqueta. Estas limitaciones se deben fundamentalmente a que el control institucional se realiza a partir del cumplimiento de dos criterios: introducción de una variante aceptada de la institución en el campo de afiliación y la inclusión de un correo electrónico institucional que concuerde con esta afiliación. Aparte de las innumerables ventajas que supone disponer de un control de autoridades para las instituciones. pues es un lugar donde el autor puede controlar la información que deposita en la web académica. tales como errores metodológicos. el sistema redirije a una pantalla de resultados en la que se recopilan todos los perfiles en los que Google Scholar ha sido capaz de identificar esta misma afiliación (Figura 51).

682 perfiles observan que la etiqueta más frecuentemente utilizada en la muestra era “Machine learning” (1. a partir de un total de 521. quienes a partir de un total de 6. seguida de “Artificial Intelligence” (998) y “Computer vision” (989).google.397 etiquetas.Bloque B · Capítulo 9 · Google Scholar Citations número de citas totales recibidas. Adicionalmente.es/citations?view_op=search_authors&hl=es&mauthors=label:altm etrics> El análisis del uso de las etiquetas puede dar lugar a interesantes análisis temáticos en Google Scholar. Este estudio es posteriormente ampliado por Ortega (2014) quien. Figura 51. Esta opción es muy útil para navegar por intereses temáticos y localizar a los expertos en diversas disciplinas.243 usuarios). En este sentido cabe destacar los trabajos de Ortega y Aguillo (2012). confirma las etiquetas 199 . el sistema permite la búsqueda directa por etiqueta a través del comando especial “label” (figura 51). Búsqueda y navegación por etiquetas en Google Scholar Citations <https://scholar.660 etiquetas extraidas de un total de 26.

Se deben utilizar preferentemente las etiquetas ampliamente aceptadas por la comunidad correspondiente. Esto puede provocar inevitablemente una indeseada dispersión de la comunidad científica presente en Google Scholar Citations. la libertad a la hora de elegir términos provoca que los usuarios utilicen términos no adecuados (enseñanza-aprendizaje). seguida de “Artificial Intelligence” (4. y al igual que ocurre con las afiliaciones temáticas. no funcione adecuadamente.176) y “Computer vision” (3. en solitario. permitiendo la generación de listados temáticos y propiciando la fácil localización de perfiles a los que tal vez deseemos realizar un seguimiento especial. En otros casos. en algunos casos. pues las etiquetas cumplen la función de agrupar perfiles bajo intereses comunes. la falta de control terminológico produce la existencia de variantes indeseadas. no la de generar rankings competitivos. pequeños errores tipográficos (por ejemplo.200 La revolución Google Scholar más usadas: “Machine learning” (4. no sólo por la utilización de sinónimos o expresiones similares sino por variantes de género (data analytic vs data analytics) o de idioma (bibliometria vs bibliometrics). . En ocasiones esto se debe a que los usuarios buscan cierta exclusividad. incorporan asimismo una serie de limitaciones. o bien precisan de otro término más ajustado (tal vez en este caso “international economic law”). incluir “almetrics”) puede significar que el sistema no detecte el error y que la etiqueta. Se aconseja el término en plural e inglés para la mayoría de las disciplinas. De la misma forma. especialmente en las humanidades y ciertas ciencias sociales como las jurídicas. Por todo ello.219). a excepción de aquellas con importante carga local. Valga como ejemplo la utilización de los términos “derecho internacional privado” y “private international law” para observar cómo en ciertas áreas los términos en inglés no resultan los más adecuados. por tanto. empleados por tanto por menos usuarios y donde puedan por tanto aparecer en mejor posición o. Es decir. siempre se recomienda tomarse un tiempo prudencial para elegir los mejores términos y asegurarse de su corrección y funcionamiento.661 usuarios). utilizar términos poco comunes. Esta opción debe evitarse en la medida de lo posible. al dividirse en función del término por el que hayan optado a la hora de configurar el perfil. Por un lado. Si bien el uso de etiquetas proporciona un valor añadido de indudable interés práctico. en cierto desuso (análisis documental) o simplemente inventados (curriculum en ciencias de la información).

Este problema puede observarse en la figura 52. —— Combinar: permite fusionar dos o más referencias. Nada impide que en el perfil de la figura 50 se puedan introducir por ejemplo las áreas temáticas que se deseen (siempre que no se superen los cinco términos). El sistema además incluiría al autor en dichos rankings temáticos con el número total de citas del autor. donde dos de ellos han publicado en esta área de forma esporádica. correspondiente al área de información. y son las siguientes: —— Añadir: permite incluir nuevas publicaciones (en Google Scholar o bien manualmente) —— Exportar: permite exportar resultados seleccionados. el tercer gran problema es la falta de verificación. habiendo obtenido el grueso de sus citas en otras disciplinas. Figura 52. acústica o derecho internacional público. en la que se muestran los tres primeros autores para la etiqueta “scientometrics”. 201 . como zoología.Bloque B · Capítulo 9 · Google Scholar Citations Finalmente. Limitaciones funcionales de las etiquetas en Google Scholar Citations Herramientas de gestión Las principales herramientas de gestión de los perfiles se encuentran localizadas en la zona cuatro.

Por tanto. por fecha de publicación o por el número de citas totales recibidas. que pueden ser recuperados posteriormente. Por otro lado. borrar la cuenta o ver la papelera de artículos. —— Actualización: permite actualizar el perfil. En la cabecera del listado podemos localizar los dos principales botones de edición. —— Papelera: lugar donde se depositan los artículos eliminados. En la figura 53 observamos la pantalla de ingesta de documentos en Google Scholar Citations. la cantidad de publicaciones puede ser enorme. El botón “More” es un desplegable que muestra las opciones de actualizar el perfil. Google Scholar ofrece la posibilidad de añadir grupos de artículos de una sola vez. Veamos con mayor detenimiento cada una de estas opciones. En el área de información encontramos el listado de contribuciones añadidas al perfil durante el proceso de creación del mismo. Añadir grupos de artículos en Google Scholar Citations El producto ofrece tres posibilidades para añadir nuevos recursos al perfil: grupos de artículos. Este listado puede ser ordenado por título.202 La revolución Google Scholar —— Eliminar: elimina los artículos seleccionados. Figura 53. Para solventar este problema. la adición individual puede resultar muy laboriosa. pero con la novedad de que las opciones de ingreso de nuevos documentos se han ampliado. Grupos de artículos Para ciertos investigadores senior. En la figura 53 se observa . Al pulsar en el botón de añadir registros. el botón “Add” nos abre la posibilidad de incluir nuevos registros al sistema. el sistema nos dirige a una pantalla prácticamente idéntica a la obtenida en el paso dos de la creación del perfil (Ver figura 46). artículos individuales y entrada manual.

ofreciendo por tanto un máximo de 1. que coincide aproximadamente con los términos usados para la búsqueda. De esta forma.000 resultados por consulta. El usuario puede realizar una búsqueda en el cajetín general situado en la parte superior de la pantalla. y posteriormente incluir un comando OR para realizar combinatorias para distintas variantes de nombre. el usuario puede elegir incorporar todos estos artículos de golpe a su propio perfil.Bloque B · Capítulo 9 · Google Scholar Citations la interfaz correspondiente. Un mismo autor podría aparecer en distintos resultados si el sistema lo hubiera detectado con diversas variantes de nombre. El número máximo de páginas de resultados son 100. Por tanto. se le da la oportunidad de revisar cada uno de los artículosque conforman el conjunto. El sistema devuelve un conjunto de autores. incluir el comando “author” para delimitar que deseamos buscar a un autor. otros comandos como “filetype” o la combinación de varios de éstos no proporcionarán resultados precisos. En el momento en que se localiza un artículo pertinente. los términos de la búsqueda han sido “Emilio Delgado”. Cada resultado corresponde con una forma normalizada de un autor dentro de Google Scholar. no modificables. En el ejemplo de la figura 53. para poder seleccionar solamente aquellos pertinentes y rechazar el resto. Por ejemplo. Artículos individuales La opción de artículos individuales implica la búsqueda directa de contribuciones y no de autores. y el sistema devuelve conjuntos de artículos agrupados bajo un nombre de persona. como sucede en el caso de los grupos. cada una de ellas con su correspondiente conjunto de documentos. El cajetín de búsqueda permite la utilización de diversos comandos para filtrar mejor la consulta. Es decir. se podría realizar la siguiente búsqueda: <author:”a Alonso arroyo” OR “Adolfo Alonso”>. al que el sistema le ha asignado automáticamente una serie de artículos como autor. La página de resultados está delimitada a 10 resultados por página. el proceso de localización y navegación resulta tedioso y poco amigable. Adicionalmente. Igualmente se podrán realizar consultas por términos específicos (keywords) o utilizando comandos especiales como “site” (para delimitar el espacio web en el que deseamos realizar la búsqueda) o “allintitle” (para delimitar la búsqueda en el título del documento). el usuario debe marcarlo y a continuación pulsar en el botón de añadir al perfil 203 .

Figura 54. Para cada tipo se ofrecen los campos de descripción oportunos de forma que el usuario mismo los cumplimente (figura 55). no localizable en el buscador interno). conferencia. el servicio ofrece la posibilidad de elegir la tipología documental correspondiente (artículo de revista. casos judiciales. . El sistema devuelve una serie de contribuciones. algunas de las cuales ya están añadidas en el perfil. tesis doctoral. que por diversas razones no haya sido indizado en el sistema. Adición de nuevos registros en Google Scholar Citations En la figura 54 se puede observar un ejemplo para la búsqueda “Delgado López-Cózar”. tesis que no han sido incorporadas a Google Scholar o cualquier tipo de informe técnico. Entrada manual La última opción para incluir nuevos registros es la entrada manual. capítulo de libro.204 La revolución Google Scholar (figura 54). Esta opción se ofrece para aquellos casos en los que el usuario desee incorporar un registro que no esté indizado en Google Scholar (y. mientras que otras no. otras). En estas últimas se ofrece la posibilidad de seleccionarlas e incluirlas en el perfil. El usuario puede asimismo seleccionar más de un documento a la vez. Automáticamente el registro se incorporará a la zona de información del perfil. por tanto. patente. Podría tratarse de artículos publicados en revistas en papel no digitalizadas. y los datos bibliométricos se actualizarán automáticamente. libro. En este caso.

pero en ningún caso significará que el documento esté indizado en Google Scholar. los botones de edición situados en la cabecera de la tabla se modifican para proporcionarnos opciones complementarias (figura 56). Edición del listado de registros en Google Scholar Citations 205 . A pesar de esta limitación.Bloque B · Capítulo 9 · Google Scholar Citations Figura 55. Entrada manual de registros en Google Scholar Citations En este punto es importante remarcar que el hecho de describir un nuevo documento en esta interfaz implica que su referencia bibliográfica aparecerá en el perfil del autor. Si volvemos al listado de documentos en el área de información del perfil. simplemente aparecerá su descripción bibliográfica. esta opción puede ser útil a los usuarios que deseen dar a conocer la existencia de una obra realizada a los seguidores de su perfil o comunidad. Es decir. Figura 56. no existirá ningún hipervínculo al documento a texto completo. Cuando éste se activa. podremos observar que en la parte izquierda de cada registro aparece un casillero.

el usuario accederá a la zona de edición de registros bibliográficos. Endnote. sí permiten la mejora del sistema a largo plazo. fecha de publicación. El área de edición nos muestra una ficha descriptiva de la publicación. Al registro resultante se le computan todas las posibles citas recibidas por cada una de las versiones. Así mismo. . Edición de registros Una vez un registro ha sido incluido en el perfil mediante la opción de añadirlo a la colección. éste aparecerá en la zona de información del perfil.206 La revolución Google Scholar En el caso de seleccionar uno o varios registros. En primer lugar. permitiendo eliminar el registro del perfil o exportar la descripción bibliográfica del mismo a diferentes formatos (BibTex. resumen y citas recibidas). RefMan y CSV). al pulsar sobre éste. En la figura 57 se muestra a modo de ejemplo un registro tal y como aparece al pulsar su título en el listado del área de información bibliográfica. el título nos dirige directamente hacia la fuente original del documento. si siquiera a los perfiles de los posibles co-autores). junto con las citas totales recibidas. es el método que está utilizando Google Scholar para poder detectar versiones no agrupadas. Ciertamente. ¿quién mejor que el propio autor para indicar cuándo dos registros son realmente distintas versiones o copias del mismo? Aunque estos cambios no se aplican automáticamente a los datos de versiones de los registros en los resultados de búsqueda en Google Scholar (sólo se aplican al perfil donde se aplican. el sistema permite fusionar distintos registros duplicados. El usuario decide cuál de los documentos fusionados es el principal (cuya descripción bibliográfica se mantiene). de forma que. A continuación. se nos muestra la información bibliográfica (autores. Adicionalmente podemos ver un gráfico evolutivo del número de citas recibidas por año. y el resto se eliminan. respectivamente. El proceso de comprobación de duplicados y la correcta fusión es un paso necesario para la creación de un perfil sin errores. en aquellos casos en los que el sistema haya sido incapaz de agrupar correctamente las distintas versiones. editorial. La opción de combinación de registros (Merge) solamente aparece cuando se activan como mínimo dos casillas. volumen. las opciones de borrado (Delete) y exportación (Export) se activan. El título de cada registro constituirá un hiperenlace. así como las versiones que el sistema tiene agregadas para ese registro. En este caso.

Bloque B · Capítulo 9 · Google Scholar Citations Figura 57. eliminar el registro o editarlo. En este caso. accederemos a una interfaz similar a la obtenida en la figura 55. Edición de registros en Google Scholar Citations 207 . Si pulsamos sobre esta última opción. corregir algún dato descriptivo que el sistema hubiera capturado de forma errónea o gestionar las versiones del registro. Figura 58. el sistema nos ofrece tres posibilidades: exportar los datos descriptivos. desde la cual podremos editar el contenido de los campos. podremos reasignar la tipología documental. Edición de registros en Google Scholar Citations En la parte superior de la pantalla. pudiendo eliminar o desunir versiones específicas (Figura 58).

Google Scholar Citations muestra tres: número de citas recibidas. h-index y el i10-index (métrica propuesta por Google Scholar mediante la que se cuantifica el número total de artículos que han recibido al menos 10 citas). en el que se muestra el número de citas por año al pasar el ratón por la barra correspondiente a cada año. Google Scholar adopta en primer lugar el número de citas totales y el h-index como indicadores clave en el rendimiento investigador y hace hincapié en el rendimiento reciente. En el caso de los indicadores. La información métrica aparece igualmente en el área de información bibliográfica. extensible al pulsar sobre éste. Esta funcionalidad sirve de gran ayuda para ver la proyección e impacto en el tiempo de un/a autor/a. las métricas y el gráfico de evolución de citas por año (Figura 59). De esta forma. Indicadores bibliométricos en Google Scholar Citations Debajo de la información métrica se muestra un gráfico de barras. útil para observar el impacto de los autores emergentes. donde se muestra el número de citas totales recibidas por registro. que pueden ser infravalorados en los indicadores totales. Este valor de citas es un hipervínculo .208 La revolución Google Scholar Indicadores bibliométricos El área de indicadores bibliométricos está compuesta por dos elementos. Estos datos se muestran tanto a nivel total como para los cinco años anteriores al año actual. Figura 59.

Co-autores La última zona identificable en la página principal del perfil académico de Google Scholar Citations es la información de co-autores. En algunos registros podemos observar un asterisco justo al lado de la indicación del número total de citas recibidas. el sistema nos dirije a una pantalla de resultados en la que se listan todos los documentos citantes. versiones. Esta información de sugerencias sólo se visualiza cuando un autor accede a su perfil iniciando sesión. Aunque el filtrado temporal permitiría conocer el número de resultados (y por tanto de citas) por año. para el perfil de autor determinado. Este símbolo aparece cuando el sistema tiene dudas acerca de la contabilización realizada. así como el número de citas de cada una de ellas. Aunque por defecto únicamente aparece un número limitado de coautores en la pantalla (por razones de espacio). De éstos.). pero dentro de un conjunto limitado de registros que constituyen los documentos citantes del registro seleccionado previamente en el perfil. Exactamente lo mismo que ofrece la pantalla general de resultados de Google Scholar. etc. Una vez el autor ha aceptado la inclusión de aquellos autores con los que efectivamente ha publicado conjuntamente. pulsando en “View all”. el sistema identifica automáticamente los autores que han publicado conjuntamente con este autor. mientras que para cada documento citante se ofrece el registro bibliográfico completo (citas recibidas. aquellos que tienen un perfil creado y público se muestran como sugerencias para añadir como co-autores. exportación de información bibliográfica). el sistema muestra una ventana emergente en la que se puede visualizar un listado con todas las versiones unidas para ese registro. Si se pulsa en el asterisco. esta información se encuentra de forma más amigable en la interfaz de información bibliográfica del registro. el sistema permite acceder a una página de resultados en la que se reco- 209 . al pulsar en cada nombre el usuario puede acceder al perfil público correspondiente. En este caso. de esta forma. esta información aparece en la parte pública del perfil (Figura 60). al pulsar sobre él. El nombre de estos co-autores aparecen como hipervínculos. especialmente si el autor ha realizado cualquier modificación fusionando registros o deshaciendo versiones. filtrado temporal. como ya hemos visto con anterioridad (ver Figura 57).Bloque B · Capítulo 9 · Google Scholar Citations tal que. Esta pantalla ofrece las prestaciones de búsqueda de Google Scholar (búsqueda por palabra clave.

que está sincronizado internamente con el servicio de alertas de Google Scholar visto en el capítulo 6. número de citas totales recibidas y palabras clave). queda comentar el servicio de alertas personalizadas de Google Scholar Métrics.210 La revolución Google Scholar pilan todos los co-autores aceptados por el autor en su perfil. por ejemplo). el sistema permite la posibilidad de eliminar a algún co-autor (en el caso de que no deseemos que figure en el listado por cualquier motivo). nombre. En este caso. adscripción institucional. Figura 60. . que no parece seguir ningún patrón lógico (citas totales recibidas o apellidos. el sistema sugiere nuevos co-autores para añadir al perfil. Alertas Por último. Para cada uno de ellos aparece la información básica (fotografía. Inclusión de co-autores en Google Scholar Citations Si a esta pantalla de co-autores se accede como usuario registrado. en la parte inferior de la página. Adicionalmente. La única pega de esta página de co-autores es el orden en el que aparecen.

el propio usuario debe pulsar sobre el icono “Follow” que aparece en la parte superior de la zona del área personal. En el primero de los casos. Alertas personalizadas en Google Scholar Citations (I) Figura 62. seleccionar la alerta deseada y notificar el correo electrónico donde se desea recibirla (Figura 62). En el segundo caso. efectuar un autoseguimiento. Y por otro lado se puede realizar el seguimiento de autores de interés.Bloque B · Capítulo 9 · Google Scholar Citations el sistema de alertas puede realizarse de dos formas complementarias. La alerta puede cubrir tanto la notificación de nuevos artículos como de nuevas citas recibidas. Por un lado. Sin embargo. pulsar en el botón “Follow”. existe la condición de que el perfil deba ser público para poder habilitar esta alerta (Figura 61). Figura 61. Alertas personalizadas en Google Scholar Citations (II) 211 . basta con acceder al perfil público que deseemos seguir. es decir. recibir notificaciones en el momento en el que se produzca alguna modificación en el perfil personal.

comentado en la sección anterior. Aunque el cambio fue fundamentalmente estético (mejorando el diseño y disposición de los elementos en la pantalla).212 La revolución Google Scholar En las primeras versiones de Google Scholar Citations se contabilizaba el número de seguidores que tenía un autor a partir de este botón de “Follow”. el cambio más importante hecho público se produjo el 21 de agosto de 2014. editar. se introdujeron algunos cambios. en algunos casos. Probablemente. aunque de una manera irregular y. Se deja total libertad a los autores para que puedan configurar el perfil a su entero gusto y beneficio desde su identificación personal. 2014). cuando el producto dio un lavado de cara a los perfiles. Google Scholar se despreocupa de la posible veracidad y precisión de los datos y deja en manos del autor toda la responsabilidad sobre lo mostrado. Pequeñas mejoras en la edición de los registros o en las opciones de visualización han ido apareciendo paulatinamente. pues en la versión anterior solamente se mostraban datos aproximados) y otros menos (la creación de una versión imprimible amigable). pasando por el modo de actualización del perfil (automático o no). otros investigadores con carreras científicas más cortas. pues ilustraba cómo investigadores con largas trayectorias científicas y amplio impacto podían ser seguidos por un número escaso de seguidores (o ninguno en la mayoría de los casos) y por el contrario. como la del número de seguidores de un perfil (Delgado López-Cózar. los cambios siempre han ido orientados a la creación de un producto que como ya comentamos responde a la filosofía del “laissez faire. incluso invisible. algunos más importantes (mostrar el número exacto de citas totales recibidas por año. Explotación de los perfiles académicos en Google Scholar Google Scholar Citations ha ido mejorando el producto desde su lanzamiento hasta nuestros días. mostrando de ese modo un interés en el seguimiento de perfiles que no correlaciona necesariamente con el impacto científico. . profesional y temática hasta la vinculación de la producción bibliográfica que estimen pertinente. En cualquier caso. laissez passer”. menos importantes o con una mayor carga profesional (por ejemplo Comunicación) recibían mucha más visibilidad. Igualmente desaparecieron algunas funcionalidades. aparecido en agosto de 2015 sin notificación alguna. El autor puede añadir. aunque esta funcionalidad fue eliminada en 2014. y eliminar los registros bibliográficos tal como le venga en gana. En cualquier caso proporcionaba información interesante. Un claro ejemplo de ello es el control de las afiliaciones institucionales.

esto ocurre para uno de los mayores investigadores sobre Google Scholar amplia e intensamente citado en este libro. Duplicación de registros en Google Scholar Citations —— Que escojan palabras clave inadecuadas para describir su orientación temática.Bloque B · Capítulo 9 · Google Scholar Citations Esta completa libertad a los usuarios puede generar situaciones tan extravagantes como las siguientes: —— Que puedan existir autores con varios perfiles creados. etc. Esto se debe a que el sistema no controla la duplicidad de nombres en los perfiles. Figura 63. pues la ambigüedad de ciertos nombres y la no depuración del perfil puede hacer que se incluyan contribuciones de otras personas con el mismo nombre y apellidos. quien a fecha de septiembre de 2015 dispone de dos perfiles públicos creados (Figura 63). un mismo autor puede crearse varios perfiles (cada uno de ellos con una cuenta de correo electrónico diferente) o varias personas diferentes podrían haber creado un mismo perfil.com/torressalinas/status/701683372935008258/ photo/1> 213 . cada uno de ellos con un número distinto – aunque similar – de citas y de palabras clave 3. o tan peculiares y singulares que sólo les representan a ellos mismos (por ejempo “tetons”. Esto puede suceder por descuido. que 3 La duplicación de perfiles públicos está comenzando a ser controlada por Google Scholar desde marzo de 2016. —— Que vinculen a sus perfiles publicaciones que no les pertenecen. como es Peter Jacsó. Por tanto. Por ejemplo. “vocabularios controlados”. como ya discutimos en el apartado de información personal de este capítulo. <https://twitter. “gendermetrics gender studies scientometrics”.).

Este punto ya fue comentado en el capítulo dedicado a las amenazas de Google Scholar. Asignación errónea de registros en Google Scholar Citations <http://scholar. Robinson-García y Torres-Salinas. 2014).com/2014/11/17/fake-citations-plague-some-google-scholarprofiles . en cuyo caso estaríamos ante un claro caso de fraude.214 La revolución Google Scholar Google Scholar no desambigüa correctamente (Figura 64). Perfil falso Google Scholar Citations <http://scholar.google.com/citations?user=D1EHFZQAAAAJ> —— Que se manipulen las citas e indicadores bibliométricos (Delgado López-Cózar. Figura 64.google. o bien puede suceder a propósito. Durante el proceso de construcción de perfiles académicos seguido en este capítulo. Figura 65. Esto ha permitido la generación tanto de citas falsas 4 como de perfiles falsos (Figura 65).com/citations?user=D1EHFZQAAAAJ> 4 http://retractionwatch. ya hemos podido advertir de la facilidad con la que se puede engañar al sistema ante la carencia total de control y libertad total del usuario para introducir la información que estime oportuna.

Este hecho ha permitido que estos perfiles. fundamentalmente. Ortega (2015) muestra que la mayoría de usuarios son jóvenes investigadores. lo que genera un importante sesgo en la distribución de la población de investigadores con perfil creado.764 perfiles) y Universidade Estadual Paulista 215 . por lo que era más adecuado para estudios a nivel individual e institucional. y cuya distribución por países e instituciones es muy desigual. en disciplinas relacionadas con las ciencias de la información y tecnología. infiere a partir de una muestra que Brasil posee aproximadamente el 5. temas e instituciones. en su análisis comparativo de los perfiles de Google y Microsoft. cooperación de los autores para detectar y corregir errores bibliográficos) y para los propios autores (ayuda en la visibililidad y difusión de su trabajo).Bloque B · Capítulo 9 · Google Scholar Citations En cualquier caso. Una inteligente manera no sólo de reducir costes de tratamiento y gestión de la información sino de hacer que el usuario trabaje para el sistema. Por ejemplo. con el 24. necesarias para calibrar el impacto total de autores. con datos de diciembre de 2013. así como ciertas características de los autores que disponen de perfil público creado. concluyen que aunque los perfiles producidos por Microsoft Academic Search eran más óptimos para ser analizados desde un punto de vista bibliométrico al disponer de un servicio más balanceado temáticamente. Ortega (2014). como Universidade de Sao Paulo (3.8% y el 6. estén comenzando a ser objeto de análisis métricos para caracterizar la ingente cantidad de información contenida.4% respectivamente). Esta amplia autonomía que Google concede al autor trasluce la filosofía desde la que se ha diseñado este producto: un sistema de información orientado al usuario. creado por y para él. Hemos de pensar que Google Scholar Citations supone pasar la descontrolada base de datos de Google Scholar bajo un prisma que permite distinguir las contribuciones de autores. En ese sentido. Ortega y Aguillo (2014). principalmente debido a la enorme cantidad de perfiles creados para algunas instituciones brasileñas. lo que impide que pueda ser representativa de la población científica real. Este modo de funcionamiento ha permitido a Google Scholar Citations distanciarse del resto de servicios de perfiles académicos. Google Scholar Citations contenía más materiales académicos que generaban una mayor cantidad de citas.2% de todos los perfiles existentes (tras Estados Unidos y Reino Unido. queda claro que la responsabilidad última es del autor y no alcanza a Google: el perfil retrata a quien lo elabora. más allá de la utilidad que tienen para Google Scholar (ayuda en el filtrado de información en las búsquedas.

En esta línea destacan los trabajos de Ortega y Aguillo (2013).216 La revolución Google Scholar (1. ocupa la cuarta posición global). quienes identifican propiedades de fractalidad y redes de escala libre en las relaciones institucionales por país (donde Estados Unidos domina el mapa científico mundial). los estudios sobre la base de datos de Google Scholar Citations pueden proporcionar información de indudable interés si son convenientemente filtrados y contextualizados. ciertas políticas de evangelización hacia el producto pueden provocar la excesiva visibilidad de ciertas instituciones y la infravisibilidad de otras. Es decir.912 perfiles de Google Scholar Citations. A pesar de estos sesgos de población y de cobertura temática.320 perfiles. con el fin de descubrir y caracterizar las colaboraciones científicas a nivel de país e institución. Los autores.636). que son de hecho las dos instituciones con más perfiles asociados en todo GSC (la Universidade Estadual de Campinas. 1. entre países e instituciones. . quienes analizan los datos proporcionados por el servicio de co-autores en un total de 19. concluyen que Google Scholar Citations es una herramienta apropiada para los estudios de colaboración científica a nivel macro.

estudiar y analizar Google Scholar como un objeto de estudio en sí mismo. Los productos desarrollados (H-Index Scholar. propiedades. En este último capítulo deseamos introducir una serie de productos independientes que han sido diseñados y elaborados por el Grupo de investigación EC3 a partir de la información contenida en Google Scholar. El objetivo de estos productos ha sido doble. Fruto de estos propósitos. Proceedings Scholar Metrics. un propósito fundamentalmente investigador: conocer. errores y limitaciones. Por otro lado. congresos y editoriales) para comprobar si Google Scholar era o no era capaz de proporcionar resultados coherentes (y por tanto útiles) que cubrieran con dignidad una importante laguna en el panorama de la evaluación del impacto académico en las ciencias sociales y humanas. Analizar por tanto sus características. Finalmente. Publishers Scholar Metrics. Diseñar productos que pudieran ser de utilidad a la comunidad investigadora en general. y bajo el firme convencimiento de la importancia y valor de la empresa emprendida. libros. y a las ciencias sociales y humanas en España en particular. que denominamos bajo la etiqueta de oficiales al haber sido desarrollados directamente por el equipo de Google Scholar e integrados en su interfaz de búsqueda. un propósito empírico y práctico.Capítulo 10 Productos derivados independientes A lo largo de los capítulos anteriores (8 y 9) hemos descrito los dos principales productos derivados de Google Scholar. Journal Scholar Metrics) pretenden aportar una respuesta empírica (y no teórica u opinática) a todas nuestras dudas iniciales. ventajas. la propuesta y aplicación de toda una nueva metodología de análisis basada en Google Scholar a nuestra propia disciplina (tanto a la Biblioteconomía y Documentación como a la Bibliometría) sirve de excelente colofón no sólo para mostrar las enormes posibilidades y potencial de Google Scholar sino para aflorar la eviden- . revistas. Por un lado. el equipo de trabajo ha dedicado gran parte de sus esfuerzos en los últimos años a cuantificar diversos agentes y canales de investigación (autores.

218 La revolución Google Scholar te necesidad de un cambio de paradigma en la evaluación del impacto académico en las ciencias sociales y humanas. deseamos en primer lugar rendir un merecido tributo a un par de productos pioneros en la extracción y tratamiento de datos procedentes de Google Scholar: Publish or Perish (elaborado por Anne-Wil Harzing) y Scholarometer (elaborado por el equipo liderado por Fil Menczer). a pesar de que Google Scholar ofrecía datos de citas recibidas para cada registro indizado. realizar análisis bibliométricos y estadísticos sobre los datos obtenidos (tanto a nivel de autor como de revista).25. exportarlos en un fichero estructurado. Sin embargo. permitía la realización de búsquedas directamente sobre la base de datos de Google Scholar y. y visualizarlos en una interfaz sencilla. el software permitía editar los resultados obtenidos. antes de pasar a describir los productos elaborados por los autores (productos bibliométricos derivados). una democratización . junto a Google Scholar. lanzada oficialmente en octubre de 2006. ofrecía una serie de indicadores bibliométricos. la información comenzaba y terminaba en este punto. la gran ventaja de Google Scholar es su impresionante cobertura aunque una de sus principales limitaciones es la total ausencia de mecanismos profesionales para gestionar la información que proporciona. Esta sencilla pero potente aplicación (disponible tanto para entorno Windows como OS X o GNU/Linux). Por si no fuera poco. entre otras muchas funcionalidades. Tal y como ya se ha comentado de forma extensa a lo largo de esta obra. A ello se unían las inexistentes prestaciones para exportar los datos para ser tratados estadísticamente fuera del entorno de Google Scholar. Publish or Perish servía de interfaz entre el usuario y Google Scholar. la aplicación era capaz de obtener los datos correspondientes directamente de Google Scholar (a través de sus prestaciones de búsqueda avanzada. Así pues. y de la que ya circula actualmente la versión 4. No es de extrañar que este software permitiera. ya bien adentrados en el hiperconectado Siglo XXI. fusionar duplicados e incluso exportar los datos finales a una hoja de cálculo.1 (a fecha de 17 enero de 2016). Efectivamente. conviene recordar que Google Scholar no proporciona ningún tipo de API). de forma que ante una determinada consulta. a partir de los resultados obtenidos. Publish or Perish Tan solo dos años después de la creación de Google Scholar (noviembre de 2004) nacía la primera versión de Publish or Perish (PoP).

Interfaz de búsqueda de Publish or Perish Observamos cómo la aplicación permite tres tipos de consultas (general. se recomienda introducir entre comillas el nombre de la persona buscada (en el ejemplo mostrado “Corma A”). Aunque no se recomienda su utilización (al menos entre 2010 y 2016). En la figura 66 se puede observar un ejemplo de búsqueda de autor y los resultados obtenidos a través de la aplicación. zona 1) el usuario puede configurar los campos de consulta correspondientes (Figura 66. por tanto. debido a la ya comentada desactualización de esta base de datos. tal y como expresa Harzing en el prólogo de esta obra. En el ejemplo de la figura 66. zona 2). Publish or Perish permite seleccionar Microsoft Academic Search (desde la versión 4.Bloque B · Capítulo 10 · Productos derivados independientes del análisis de citas. el sistema lanza la consulta directamente a Google Scholar.1). Una pantalla flotante nos informa del estado de la evolución de nuestras consultas. Adicionalmente se puede seleccionar la base de datos. Adicionalmente se pueden excluir determinados coautores o delimitar el año de publicación. Figura 66. el sistema se encuentra analizando el resultado número 920 de los 1000 obtenidos. Una vez se ha perfilado la búsqueda. ese será el número máximo de resultados que obtendremos ante cualquier búsqueda. En el caso de la búsqueda por autor. por autor y por revista). y en uno de sus principales y más citados trabajos (Harzing y Van der Wal. Se debe recordar que Google Scholar devuelve un máximo de 1000 resultados por query. Aparte de Google Scholar. 2007). En función de la búsqueda seleccionada (Figura 66. Se debe re- 219 .

Año. Por último. La consulta general por su parte simplemente incorporar todos los campos (tanto de la búsqueda por autor como por revista) en una consulta. En ese caso se recomienda restringir la consulta a partir de los límites temporales. Editorial y Tipo. De forma que podemos utilizar las funcionalidades del análisis bibliométrico de los datos a partir de registros obtenidos en estas dos bases de datos. como indica su propio nombre. La limitación de los 1000 resultados es. Multi-query center es el espacio destinado a almacenar las consultas efectuadas en la aplicación. Los resultados localizados se muestran ordenados por defecto según el número de citas totales recibidas. general. artículos por autor. se van calculando de forma automática una serie de indicadores tanto simples (número de documentos.220 La revolución Google Scholar cordar igualmente que cada resultado es tratado por el programa como un documento. AR-index. Adicionalmente se ofrecen los siguientes datos para cada resultado: Citas por año. se ofrece el valor tanto del h-index obtenido como de una amplia cantidad de variantes del h-index (g-index. En el caso de la figura 66. generalized h-index. e-index. Esto se puede observar en la zona de resultados (Figura 66. número de citas recibidos. crítica especialmente en el caso de búsquedas masivas o susceptibles de generar una gran cantidad de resultados. . citas por autor. autores por artículo). al igual que en la interfaz de Google Scholar. que conforman el núcleo de Hirsch para el autor. donde conforme se van procesando los hits de respuesta en Google Scholar ante la consulta efectuada. Rank (posición en la página de resultados). este símbolo aparece para los 131 artículos con mayor número de citas. La consulta por revista simplemente ofrece la posibilidad de localizar artículos publicados por una determinada revista. Publicación. Los ficheros de exportación de estas bases de datos pueden se importados a PoP desde la opción (File/ Import external data). hlnorm. zona 3). Autores. como el h-index obtenido es de 131. de tal forma que podamos repetirlas en el futuro sin tener que volver a elaborarlas. para ello permite la búsqueda por título e ISSN. se destacaría la opción de importar resultados tanto desde Web of Science como desde Scopus. intervalo de publicación) como promedios (citas por artículo. El símbolo “h” en azul y delante del número de citas recibidas por cada resultado aparece para todos aquellos artículos que contribuyen al núcleo del h-index. hl annual y multiauthored h-index). Por último. Título.

com/pop. es diametralmente opuesta a la propuesta por Publish or Perish. 2012). La base de datos sobre la que funciona Scholarometer es.edu 221 . A fecha de marzo de 2014.000 autores y 2. El usuario puede confeccionar una ecuación de búsqueda que el sistema lanza a Google Scholar. plataforma creada en la School of Informatics and Computing de Indiana University–Bloomington en noviembre de 2009 (Kaur et al. Scholarometer (actualmente en su versión 4. y las tareas de social tagging por otra. pues Scholarometer se instala simplemente como extensión del navegador. como no podía ser de otra forma.4 millones de artículos.8 millones de artículos. que pueden ser posteriormente computadas para permitir la comparación de métricas de impacto a nivel de autor entre disciplinas. Aunque la aplicación podría haber funcionado con cualquier otra base de datos. En la actualidad. el programa había recopilado cerca de 1.Bloque B · Capítulo 10 · Productos derivados independientes Los aspectos concretos del funcionamiento del programa pueden ser consultados directamente tanto en la página web personal de Anne-Wil Harzing 1 como en el manual oficial del software (Harzing. existen versiones compatibles tanto con Google Chrome como con Firefox.harzing.000 anotaciones en cerca de 900 disciplinas (datos depurados tras aplicar procesos de filtrado).htm 2 http://scholarometer.400 disciplinas (Kaur et al. 2013b). 2014). Scholarometer La filosofía de Scholarometer 2.000 autores. los datos habían aumentando considerablemente: 2.0) pretende reunir en una sola herramienta dos funcionalidades que generalmente se encuentran separadas: el análisis estadístico de la información bibliográfica de la literatura científica por una parte. 39. con 34. Bajo esta premisa. firmados por 21.indiana. Esta característica le permite convertirse en una interfaz que carece de las limitaciones de acceso al servidor de Google Scholar (la plataforma es independiente y se ejecuta en el navegador del usuario). Scholarometer se presenta como una herramienta social que pretende facilitar el análisis de citas así como favorecer que los usuarios puedan expresar relaciones entre elementos a partir de la inclusión de anotaciones.1. la cobertura especial de este buscador hizo que la balanza se inclinara finalmente hacia Mountain View. El desarrollo de la aplicación presenta igualmente particularidades. obteniendo los datos solicitados 1 http://www. Google Scholar. A fecha de 2009.

Interfaz de búsqueda de Scholarometer El usuario puede. Name. se ofrecen facilidades para exportar los datos en diferentes formatos: BibTex (BIB). fusionar distintas versiones de un mismo documento. El etiquetado de los autores en determinadas disciplinas permite a Scholarometer el cálculo del hs-index (normalización del h-index a partir . CSV. tal y como funciona cualquier navegador. entre otras operaciones.222 La revolución Google Scholar a través de un scraping de los resultados de Google Scholar. La primera de estas opciones permite la búsqueda directa en Google Scholar Citations a partir del código identificador de cada perfil (código de 12 cifras incluido en el URL público de cada perfil). Esta funcionalidad requiere de manera obligatoria que el usuario introduzca una etiqueta temática en la búsqueda (opción tag this query). En la figura 67 se puede observar el modo de funcionamiento de Scholarometer. XLS y BibJSON. Del mismo modo. El sistema ofrece cuatro pestañas de consulta (Google Scholar ID. Group y Advanced). EndNote (ENW). la posibilidad de analizarlas estadísticamente. Finalmente. la opción Advanced incorpora diversas funcionalidades de búsqueda avanzadas Figura 67. disciplina. RefMan (RIS). El resto de opciones permiten la búsqueda de un autor (Name) o un grupo de autores (Group) en Google Scholar. variantes aceptadas de nombres. El sistema permite de este modo la descarga de todas las publicaciones contenidas en el perfil y ofrece. desagregar artículos escritos por autores diferentes pero que comparten el mismo nombre o filtrar los datos por año de publicación. útil esto último por ejemplo para el análisis de grupos de investigación. de manera adicional.

Figura 68. invisibles a las tradicionales bases de datos por sus peculiares hábitos de publicación. 3 http://scholarometer.edu/data. Página de inicio de H-Index Scholar Los objetivos que pretende cubrir son los siguientes: —— Comprobar la capacidad de Google Scholar para recuperar la producción científica y académica de científicos adscritos a los ámbitos de Humanidades y Ciencias sociales. así como de funcionalidades de visualización de redes tanto de autores como de disciplinas 4. Por último.edu/explore.html 4 http://scholarometer.indiana. 2014) 5 es un índice bibliométrico que pretende medir el rendimiento de la producción académica de los profesores e investigadores de universidades públicas españolas de Humanidades y Ciencias sociales a partir del recuento de sus publicaciones y de las citas bibliográficas que éstas han recibido a través de Google Scholar (Figura 68).Bloque B · Capítulo 10 · Productos derivados independientes del promedio del h-index de los autores en una misma disciplina).indiana. H-index Scholar El H-Index Scholar (Delgado López-Cózar et al.com 223 . se destaca la disponibilidad de una API. que permite la consulta a la base de datos de Scholarometer 3. propuesto por Kaur. Radicchi y Menczer (2013).html 5 http://hindexscholar. que facilita la comparación de autores pertenecientes a disciplinas diferentes.

y que usan lenguas de expresión distintas al inglés —— Determinar la fiabilidad y validez de los índices h y g.224 La revolución Google Scholar —— Examinar su idoneidad para identificar la producción de entornos geográficos nacionales distintos al mundo anglosajón. se calculó el índice h y g de cada autor. las ciencias jurídicas en 14 áreas. se llegó igualmente a rastrear los sitios web de Facultades. En la figura 69 se muestra a modo de ejemplo el ranking experimental obtenido para el área de Documentación (top 5). Datos que hablan por sí mismos de la magnitud del trabajo realizado. Los índices se presentan por áreas de conocimiento agrupados en disciplinas. de los que se visualizaban cerca de 14. tomando como umbral de corte el primer tercio de los profesores con mayor índice h de un área de conocimiento. basados en información suministrada por Google Scholar. dadas las carencias de información en algunas de estas fuentes universitarias (especialmente departamentos). . no siempre se pudo realizar esta tarea de forma exitosa. aunque en cada área la fecha de toma de datos puede variar sensiblemente (según el mes en el que se hicieran las búsquedas). En algunos casos. Por tanto. Sin embargo. Los datos de rendimiento son relativos a 2012. De este modo. y finalmente las bellas artes en 4 áreas.000 en el sitio web público. no se contemplan ni las contribuciones realizadas ni citas recibidas con posterioridad. para detectar el núcleo de académicos de mayor influencia en las distintas disciplinas humanísticas y sociales. las ciencias humanas en 10 disciplinas y 35 áreas. En los distintos listados por áreas figuran sólo aquellos profesores que se encuentran en el núcleo de mayor rendimiento.500. Escuelas e Institutos Universitarios. Tras un proceso manual de depuración de resultados (eliminación de duplicados y unión de citaciones). El cálculo de los índices h y g se realizó a partir de la producción científica y las citas asociadas a la misma localizadas en Google Scholar. Para adscribir a los profesores a sus áreas de conocimiento respectivas se consultaron los sitios web de todos los departamentos de las universidades públicas españolas de Humanidades y Ciencias Sociales. las ciencias sociales se estructuraban en 9 disciplinas y 35 áreas de conocimiento. El número de profesores con el que se trabajó en la master list del proyecto superaba los 41. Para ello se ejecutó una búsqueda para cada profesor que contemplaba las principales variantes de su nombre a fin de identificar todas sus posibles publicaciones y las citas enlazadas a las mismas.

aunque tienen una especial predilección por las monografías publicadas en su lengua vernácula y en editoriales nacionales. no es de extrañar que este tipo de publicaciones ocupen una parte importante en el curriculum de los investigadores y que cuando se les pregunte cuáles son los medios de publicación que deben ser utilizados preferentemente en la evaluación de su actividad científica.Bloque B · Capítulo 10 · Productos derivados independientes Figura 69. así como una inclinación a citar fundamentalmente este tipo de documentos. Por consiguiente. De entre los distintos criterios que pueden emplearse para evaluar el rendimiento de las editoriales (pervivencia y antigüedad.info/ 225 . calidad editorial. por encima del resto. reputación e impacto 6 http://www. visibilidad. sean las monografías las destacadas en primer lugar. Todos los estudios bibliométricos que han analizado los hábitos de publicación y citación en las distintas disciplinas que conforman las Ciencias Humanas y Sociales destacan cómo los investigadores de estos campos publican en una amplia variedad de medios.publishers-scholarmetrics. producción/especialización. en el ámbito de las Humanidades y Ciencias Sociales. Los libros constituyen uno de los principales medios de comunicación científica en Humanidades y en buena parte de las Ciencias Sociales. Ranking de profesores del área de Documentación según H-Index Scholar Publishers Scholar Metrics Publishers Scholar Metrics 6 es un índice bibliométrico que pretende medir el impacto de las editoriales de monografías científicas a partir del recuento de citas de los libros publicados por los profesores e investigadores de universidades públicas españolas indizados en Google Scholar hasta 2012.

con su Book Citation Index. Constatadas la falta de adecuación de las bases de datos actuales para la evaluación de monografías a partir de las citas recibidas. pero especialmente afectó 7 Véase : http://hdl. como Elsevier con su programa “Titles Expansion Program”. las bases de datos tradicionales. Desde el punto de vista bibliométrico. por lo que no resultaban adecuadas dados los hábitos de publicación y citación de los investigadores en ciencias humanas y sociales. las traducciones o su inclusión en bibliografías. Este proyecto nace directamente con la vocación de satisfacer dicha demanda. los editores.mecd. han quedado relegadas las más importantes editoriales científicas de carácter nacional de países de honda tradición investigadora en estas áreas como Francia. así como otras de carácter internacional (Torres-Salinas. Agencia Nacional de Evaluación de la Calidad y Acreditación . Italia.aneca. han intentado ampliar la cobertura de libros. 2013). 2012). Scopus). Agencia Nacional de Evaluación y Prospectica ANEP.net/10481/32117 8 http://www. se orientan fundamentalmente a las disciplinas científico-técnicas y poseen un marcado sesgo anglosajón en cuanto a la procedencia e idioma de los documentos que indizan.CNEAI 8.handle. la colección en la que se publica la obra.html 9 http://www. que son usadas con efectos evaluativos para contabilizar publicaciones y citas (Web of Science. en España las agencias de evaluación de la actividad científica (Comisión Nacional Evaluadora de la Actividad Científica . tratando de ofrecer respuesta a la primera variable contemplada anteriormente: el número y la calidad de las citas. En el caso del Book Citation Index. España o Alemana. la aparición de Google Scholar significó una auténtica revolución en los sistemas de búsqueda de información científica.ANECA 9) han contemplado como criterios preferentes: el número y la calidad de las citas recibidas. Para paliar estos problemas tanto Thomson Reuters.es/ministerio-mecd/organizacion/organismos/cneai. Robinson-García y Delgado López-Cózar. son totalmente inadecuadas pues cubren casi exclusivamente artículos de revistas. las reseñas en las revistas científicas especializadas. Pero los resultados han sido desalentadores: el sesgo idiomático hacia los documentos en inglés (98% de los libros indizados) y los países anglosajones (más del 50%) es aplastante. Lamentablemente no existen herramientas que puedan medir de manera más o menos objetiva estos criterios. tanto en Web of Science como en Scopus (Torres-Salinas y Delgado López-Cózar.226 La revolución Google Scholar científico) y de los libros que éstas publican 7. el prestigio de la editorial.gob. que es el proyecto más ambicioso.es/ .

clasificados según el área de conocimiento al que figuraran adscritos.249 citas. —— Comprobar la capacidad de Google Scholar para recuperar la producción científica y académica de científicos adscritos a los ámbitos de Humanidades y Ciencias Sociales. comunicaciones a congresos…).020. tesis. que recibieron un total de 2. La primera tarea se dirigió a elaborar un censo de los profesores que trabajaban en 2012 en las universidades públicas españolas. Se recuperaron un total de 1. pues controla como nadie lo ha hecho hasta ahora la literatura no anglosajona y aquella transmitida por medios distintos a las revistas científicas (especialmente los libros). 227 . Para calcular el impacto de las editoriales científicas donde publican los profesores e investigadores de universidades públicas españolas a través de Google Scholar se siguió el siguiente procedimiento: Identificación de los libros publicados por los profesores e investigadores de universidades públicas españolas. libros. que fueron ya detallados en el capítulo 3 del libro al tratar la diversidad de documentos citantes en Google Scholar. Pero es especialmente de utilidad para los científicos de Humanidades y Ciencias sociales.378. informes.985 documentos. que es la peor controlada por los sistemas de información dominantes en el mundo académico. invisibles a las tradicionales bases de datos por sus peculiares hábitos de publicación. Todos los estudios realizados hasta la fecha. documentos en todos los idiomas sin restricción y recupera un porcentaje muy elevado de citas. Para ello se partió de los resultados obtenidos en el producto H Index Scholar. comentado previamente.Bloque B · Capítulo 10 · Productos derivados independientes muy positivamente a aquellas disciplinas cuyos hábitos de publicación no se constreñían únicamente a las revistas científicas. han puesto de relieve que este buscador cubre muchísimos más documentos que cualquiera de los sistemas de información científica tradicionales. Es por lo que los objetivos de este producto son fundamentalmente dos: —— Determinar la fiabilidad y validez de la información suministrada por Google Scholar para detectar el núcleo de editoriales científicas de mayor influencia en las distintas disciplinas humanísticas y sociales en España. indiza mayor variedad de géneros documentales (artículos de revistas.

228 La revolución Google Scholar Selección de documentos fuente: identificación de los libros altamente citados. En primer lugar. Los rankings de editoriales se elaboraron a partir de una muestra de libros.218 citas). Por consiguiente. nuestro objetivo ha sido identificar el núcleo de monografías científicas más influyentes publicadas por los profesores españoles de universidades públicas. si se mide la repercusión en términos de citas. libros que recibieron 625.203 libros más citados. documentos erróneos (documentos producidos por profesores ajenos a nuestra unidad de análisis) y documentos ajenos a la temática del área de conocimiento).462 (27.203 libros fueron repasados individualmente a fin de identificar de forma fiable y unívoca la editorial que los había producido.123 documentos que serían examinados a fin de averiguar qué porcentaje de ellos eran monografías (esta muestra concentraba el 74. Dado que Google Scholar no proporciona de manera exhaustiva ni la tipología del documento (libro.7% de las citas (1. Estos 7. fue de 26. Sobre este conjunto de libros se seleccionó una muestra que contenía los 7.628 (43. tras el análisis de los 61. Esta es una práctica ya extendida en diversos productos bibliométricos como los Essential Science Indicators de Thomson Reuters.6% de los documentos recuperados.3% .978 citas.678 documentos por diversas razones: duplicados (dado que las búsquedas se hicieron por profesor. se eliminaron los documentos no citados (740.776. que recibieron un total de 417.153 citas. es preciso verificar manualmente la editorial referenciada por Google Scholar o insertarla directamente en caso de que no figure. congreso) ni una descripción bibliográfica completa y fiable. era lógico que documentos escritos en coautoría estuviesen duplicados).5%). artículo.523). En definitiva. En términos de citación representa el 17. el 11. El total de libros identificados. la muestra de libros altamente citados sobre los que se construyen estos rankings representa el 2. y no de toda la población de monografías publicadas por los profesores universitarios españoles.3% del total de libros identificados. lo que restringió el número de documentos a analizar a 280.454 documentos válidos analizados. y que se basa en las leyes bibliométricas que determinan que un número relativamente pequeño de documentos son los que concentran la mayor atención de los científicos. Para conseguirlo se diseñaron varios filtros que fueron decantando las monografías que conformaron la muestra definitiva. Sobre el total de documentos analizados se eligió una muestra de 78. Se excluyeron 16.3%).7% de los documentos válidos de la muestra y el 43.

4% del total de libros identificados. así como el número de documentos trabajados en cada fase. Visualización de resultados Los rankings de editoriales se presentan por disciplinas y especialidades científicas.Bloque B · Capítulo 10 · Productos derivados independientes del total de citas de los documentos recuperados.8% de los documentos válidos de la muestra y el 66. —— Número total de citas de los libros de una editorial que figuran entre los libros altamente citados de la muestra. El proceso aquí descrito de forma general se ha realizado por área de conocimiento. Figura 70. el 30. tal y como 229 . En la figura 70 se muestra un resumen del mismo. Los datos brutos se normalizaron tanto para los libros como las citas en una escala que fluctúa entre 0 y 100 tomando como referencia la editorial que ha alcanzado el valor más elevado. Finalmente. citas e índice global) se han basado en los siguientes datos: —— Número de libros de una editorial que figuran entre los libros altamente citados de la muestra. se calculó un índice global que no es más que la multiplicación de las dos dimensiones contempladas. Proceso de identificación muestra de libros altamente citados Cálculo de indicadores Los tres indicadores empleados (libros. entendiendo por tales las áreas de conocimiento a las que están adscritos los profesores universitarios españoles.

en el período 2009-2013 (actualizado posteriormente a 2010-2014) 11. etc. En la figura 71 se muestra como ejemplo el ranking obtenido para Psicobiología.230 La revolución Google Scholar se mostraban en el H Index Scholar. medida ésta a través del recuento de citas en Google Scholar. Por tanto. en las áreas de Informática. encuentros. Ranking de editoriales en Psicobiología según Publishers Scholar Index Conviene subrayar que en los listados sólo figuran aquellas editoriales que han conseguido publicar libros altamente citados en cada una de las especialidades.4504. Proceedings Scholar Metrics 10 es un ranking que muestra reuniones científicas (conferencias. talleres.org/abs/1412.9681 . sino de aquellas que han conseguido con alguna de sus obras una cierta influencia.7633 11 http://doi.2. Figura 71. Proceedings Scholar Metrics En este caso. 10 http://arxiv.1.org/10. simposios.13140/RG. Este hecho constituye un valor en sí mismo. Ingeniería eléctrica y electrónica y Comunicaciones.) indizadas en Google Scholar Metrics. no deben interpretarse estos rankings como unos listados de todas las editoriales científicas que pueden publicar libros sobre una especialidad.

La creación de Google Scholar. informática. las conferencias y congresos han cumplido históricamente este rol. Las diversas bases de datos que han sido tradicionalmente utilizadas con propósitos evaluativos (Web of Science y Scopus) cubren este tipo de publicaciones con diferentes grados de exhaustividad. toma Google Scholar Metrics como fuente de datos. La elevada velocidad con la que el conocimiento es generado en estas áreas requiere de la creación de un sistema más dinámico para comunicar y publicar resultados de investigación que los sistemas tradicionales de revistas. cubre tanto revistas como repositorios y actas de congresos. Eléctrica y Electrónica y Telecomunicaciones. Este producto derivado. espléndidamente representadas en la Web. esta ha sido una de las razones por las que han existido distintos intentos de crear clasificaciones que identificaran y/o clasificaran esta tipología documental. Por tanto. De hecho. ha revolucionado no sólo al mundo de las ciencias sociales y humanas. con la única condición de haber publicado al menos 100 documentos y recibido al menos una cita en los últimos 5 años. descrito en profundidad en el capítulo 8. De hecho. como hemos visto a lo largo de los capítulos previos. Dadas las limitaciones en la visualización de los datos que Google Scholar Metrics posee (categorías únicamente aplicables al idioma inglés. pero en ninguno de los casos de forma óptima. y especialmente las de Informática. sino que tuvo adicionalmente un efecto positivo en todas las disciplinas en las que los hábitos de publicación no estaban ceñidos a la publicación de artículos en revistas. electrónica y telecomunicaciones. de ahí que Google Scholar sea especialmente útil en estos campos. 231 . la interfaz definitivamente no permite determinar la cantidad de actas de congresos indizadas en el sistema. Internet constituye un entorno casi natural para estas disciplinas.Bloque B · Capítulo 10 · Productos derivados independientes Es un hecho ampliamente conocido que las conferencias y congresos juegan un papel importante como medios de comunicación científicos en todas las áreas técnicas relacionadas con la computación. Proceedings Scholar Metrics. Además. no sorprende que las actas de los congresos ocupen un lugar prominente en el currículum de los investigadores en estas áreas y que sean consecuentemente objeto de una consideración especial en los programas de evaluación del rendimiento académico de los investigadores. como son las ingenierías en general. en lugar de basarse directamente en Google Scholar (tal y como hacen H Index Scholar o Publishers Scholar Metrics). 100 registros por categoría y 20 registros por búsqueda directa).

journal-scholar-metrics. El proceso de trabajo se describe a continuación: —— Se recopilaron todas las actas de conferencias mostradas en las subcategorias pertenecientes a las siguientes categorías (obviamente en inglés. seguida de “Proceedings of the IEEE” con h-index igual a 85 y las “International World Wide Web Conferences (WWW)” con h-index igual a 83. Electrical & Electronic Engineering. repositorios o congresos que estuviesen fuera de los temas objeto de análisis). el objetivo de Proceedings Scholar Metrics es compilar un inventario de todas las conferencias incluidas en Google Scholar Metrics en los campos de conocimiento indicados anteriormente (Computer Science. —— Los resultados de cada búsqueda fueron descargados (incluyendo el nombre de la conferencia. Finalmente. el indicador bibliométrico disponible en Google Scholar Metrics. Los resultados dieron como conferencia con mayor impacto a la “IEEE Conference on Computer Vision and Pattern Recognition.232 La revolución Google Scholar Precisamente. con este producto llega el turno al análisis de las revistas. —— Se realizaron búsquedas directas utilizando keywords específicas descriptivas para localizar conferencias adicionales. 2015). que se muestran completos en el informe final de esta investigación (MartinMartin et al. Journal Scholar Metrics Tras el análisis de autores y editoriales. se obtuvieron un total de 1. en este caso a partir del h-index. —— Se realizó un proceso manual de limpieza de datos para filtrar entradas irrelevantes (revistas. El proceso de recolección de datos tuvo lugar a finales de diciembre de 2014. y posteriormente ordenarlas en función de su impacto científico. En caso de igualdad. se ha utilizado el h5-median para desempatar la posición. Journal Scholar Metrics 12 es una herramienta bibliométrica que pretende medir el rendimiento de las revistas en las 12 http://www. and Communications.es . se incluye para cada conferencia el cuartil y la subcategoría temática en la que la conferencia había sido asignada en Google Scholar Metrics. el h5-index y h5-median.infoec3. con un h-index de 118. Así mismo. y los duplicados fueron eliminados. único idioma en el que se aplican las categorías): Computer Science.208 actas de congresos. and Communications) en el período 2009-2013. Electrical & Electronic Engineering. Las actas están ordenadas por su h-index. CVPR”.

Es evidente que esta cantidad de revistas representa a una porción muy reducida del número total de revistas existentes en esas áreas.Bloque B · Capítulo 10 · Productos derivados independientes áreas de Arte. fuimos capaces de localizar hasta 1069 revistas que cumplían con dichos criterios. Con el fin de solventar estas limitaciones (similares a las encontradas durante la confección del Proceedings Scholar Metrics). Buscando de manera manual en el resto de idiomas se pudieron localizar unas 300 publicaciones más. dadas las limitaciones en la información aportada por este producto. Literature & Arts”. el número de revistas localizadas bajo las categorías ofrecidas por Google Scholar Metrics (“Humanities. las categorías temáticas únicamente aparecen para las revistas en inglés (independientemente del país). Por una parte. Economics & Management”) ascendía aproximadamente a unas escasas 1. se describen las principales características del producto (cobertura y funcionalidades de búsqueda) así como el proceso de realización del trabajo (identificación de revistas. Como botón de muestra. clasificación y visualización). Humanidades y Ciencias Sociales. Humanidades y Ciencias Sociales. En el caso de las Artes. en los informes anuales de revistas científicas españolas en Google Scholar (reseñados anteriormente). A continuación. La realización de un producto de estas características a través de Google Scholar Metrics se antojaba complicada. Por tanto. Por otro lado. 233 . indizadas en Google Scholar y que cumplan los criterios de Google Scholar Metrics. El objetivo de este producto es identificar al subconjunto de revistas indizadas en Google Scholar Metrics relativas a las áreas de estudio anteriormente mencionadas y ofrecer posteriormente una batería de indicadores basados en citas para cada publicación. Humanidades y Ciencias Sociales a través de la contabilización del número de citas bibliográficas que sus artículos han recibido a través de Google Scholar. procesado. las revistas no aparecen ordenadas ni agrupadas por país. es justo indicar que el objetivo último del producto es asimismo calibrar el grado en que Google Scholar Metrics cubre las revistas en Arte. “Social Sciences”.800. se utilizó el buscador directo de Google Scholar Metrics para realizar diversas búsquedas a partir de términos relacionados con las áreas de interés. y “Business.

Identificación y búsqueda de las revistas en Google Scholar Metrics Con el fin de identificar todas las revistas potencialmente susceptibles de ser incluidas en el producto. dado que esas son las áreas que han presentado tradicionalmente más dificultades en la evaluación bibliométrica. En estas disciplinas. Por este motivo.234 La revolución Google Scholar Cobertura: tipologías documentales. Se recopilaron las publicaciones indizadas en las 84 categorías incluidas en Arts & Humanities Citation Index y the Social Science Citation Index. por una parte. donde las investigaciones se orientan con frecuencia a intereses locales y donde las distintas peculiaridades culturales son determinantes. Se recopiló el listado de revistas científicas (academic/scholarly) indizadas en las 162 categorías (subjects) relativas a las áreas de Arte. Humanidades y Ciencias Sociales. Por ello. cirílicos. Respecto a la cobertura geográfica. las revistas escritas en caracteres árabes. chinos. Google Scholar (cuyos robots indizan la web académica aparentemente sin sesgos geográficos o lingüísticos). y Scopus y Journal Metrics 13 por otra). no sesgadas geográfica o lingüísticamente.journalmetrics. —— Web of Science Master Lists. Las Ciencias naturales y experimentales quedan por tanto fuera de este producto pues éstas ya disponen de productos adecuados que cubren sus necesidades evaluativas (Web of Science y Journal Citation Reports. para comunicar sus resultados. 13 http://www. idiomas y países Journal Scholar Metrics se centra exclusivamente en las revistas pertenecientes a las Artes. coreanos o japoneses han sido excluidas. se consultaron previamente las siguientes bases de datos de revistas: —— Ulrichsweb: Global Serials Directory. los investigadores generalmente utilizan canales de comunicación científicos locales (y en sus idionas nativos). y para las que existe una mayor falta de herramientas de cobertura internacional.com . siempre y cuando el nombre de la revista aparezca en caracteres latinos en Google Scholar Metrics. Es considerado el más extenso y actualizado directorio de publicaciones periódicas del mundo. Humanidades y Ciencias Sociales. Journal Scholar Metrics muestra las revistas de todo el mundo y en todos los idiomas. es el motor de búsqueda más apropiado para localizar evidencias de impacto para estas revistas.

Cada revista localizada en Google Scholar Metrics fue asignada posteriormente al menos a una categoría temática (Tabla 9). Historical Abstracts. Social Work Abstracts. Es importante indicar que la información bibliográfica proporcionada por Ulrichs fue considerada como prioritaria en el caso de cualquier discrepancia con la información contenida en el resto de bases de datos. —— Información bibliográfica de los documentos citantes a los artículos que contribuyen al h5-index de cada una de las publicaciones. A partir de la información recopilada de las bases de datos mostradas anteriormente. indicando en 235 . En segundo lugar (y con el propósito de localizar revistas no incluidas en la master list). MLA. “Social Sciences” y “Business. se desarrolló una Master list de revistas.Bloque B · Capítulo 10 · Productos derivados independientes —— SCImago Journal Rank. Sociological Abstracts. Psychinfo. se desarrollaron dos estrategias de búsqueda para localizar las revistas en Google Scholar Metrics. Econlit. Literature & Arts”. Economics & Management”. italiano. —— International disciplinary-based databases. se buscaron las publicaciones a partir de una búsqueda por nombre. se aplicaron búsquedas temáticas a partir de keywords pertinentes en cada uno de los siguientes idiomas: inglés. español. —— Información bibliográfica de los artículos publicados por las revistas anteriores que contribuyen al h5-index. En primer lugar.454 revistas. francés. alemán. se procedió a descargar los siguientes datos para cada una de ellas: —— Nombre de la revista e indicadores bibliométricos asociados (h5-index y h5-median). Se recogieron las publicaciones incluidas en las 64 categorías relacionadas con las áreas de Humanidades y Ciencias Sociales. A partir de la master list obtenida. dando como resultado una base de datos exhaustiva de 66. —— Google Scholar Metrics: toda las revistas incluidas en las categorías “Humanities. portugués. donde los títulos fueron normalizados y unificados y los duplicados eliminados. Procesamiento de datos y clasificación de revistas Una vez se identificaron las revistas en Google Scholar Metrics. polaco y checo. Communication & Mass Media Complete y Anthropological Online. Se consultaron las siguientes bases de datos: Library and Information Science Abstracts.

Clasificación temática en Journal Scholar Metrics Social Sciences Arts & Humanities: Anthropology Archaeology & Prehistory Communication Arts Economics & Business History Education Literature Geography & Urbanism Language & Linguistics Law Philosophy Library & Information Science Religion Political Science Psychology Social Work Sociology Sports Science Las revistas nucleares (core) son aquellas publicaciones consideradas como esenciales en una categoría. Tabla 9. así como de considerarla nuclear o relacionada se realizó por tanto tras examinar a qué categorías había sido asignada por otras bases de datos. Indicadores bibliométricos Los indicadores bibliométricos que se ofrecen para cada una de las revistas incluidas en Journal Scholar Metrics se recogen en la Tabla 10. .236 La revolución Google Scholar cada caso si podía ser considerada nuclear o relacionada a dicha categoría.). etc. Con el fin de realizar estas distinciones con precisión. así como tras analizar sus patrones de citación entrantes (citas recibidas) y salientes (citas proporcionadas). se confió en las clasificaciones realizadas por las bases de datos consultadas (Ulrichs. La decisión de asignar una revista a una categoría. mientras que las relacionadas son aquellas vinculadas con una categoría debido a un conjunto específico de artículos publicados. pero no a la mayoría. el uso de determinadas palabras clave en los artículos y la afiliación de los autores de dichas publicaciones. Web of Science. Scopus.

mientras que las relativas a Artes y Humanidades aparecen simplemente pulsando en el menú correspondiente.Bloque B · Capítulo 10 · Productos derivados independientes Tabla 10. Así mismo la búsqueda por continente y la global están igualmente disponibles. se permite el filtrado por país. En la figura 73 se ilustra el ranking de las revistas nucleares pertenecientes a la categoría “Library & Information Science” en el Reino Unido. se informa del total de revistas nucleares incluidas en la categoría correspondiente. El acceso a las publicaciones puede realizarse directamente pulsando en el país correspondiente del mapa situado en la parte derecha de la pantalla. Cada listado puede ser ordenado por cualquiera de los seis indicadores bibliométricos mostrados en la Tabla 10. Por una parte. las revistas nucleares se marcan en negrita para diferenciarlas de las relacionadas). así como la búsqueda directa por palabra clave. ordenadas por defecto a partir del h5-index. el producto muestra directamente el ranking obtenido (un máximo de 20 resultados por página). Al pulsar sobre una categoría determinada. Adicionalmente se puede habilitar la visualización de revistas relacionadas en el listado final (en este caso. Indicadores bibliométricos en Journal Scholar Metrics INDICADOR ALCANCE H5-index h-index construido a partir de los artículos publicados por la revista en los últimos 5 años (período 2009-2013) H5-median Mediana del número de citas para los artículos que contribuyen al h5index H5-citations Suma del número de citas recibidas por todos los artículos que contribuyen al h5-index H5-index (sin autocitas) h5-index en el que se excluyen las citas procedentes de la misma revista H5-citations (sin autocitas) h5-citations en el que se excluyen las citas procedentes de la misma revista Journal self-citation rate Porcentaje de citas a una revista que provienen de artículos publicados en esa misma revista Visualización de datos Los rankings se presentan por categorías temáticas. Por defecto aparecen desplegadas las categorías relativas a las Ciencias Sociales. 237 . Por último. En la parte superior de cada listado se ofrece información de valor añadido. En la figura 72 se muestra la página de inicio del producto y la selección de categorías del menú principal.

Ranking de revistas inglesas en la categoría “Library & Information Science” en Journal Scholar Metrics <http://www.php?id=rank&subject=library_and_information_science> El indicador relativo a la tasa de autocitación de la revista (%) se muestra gráficamente a partir de un gráfico circular tipo tarta. que muestra un área sombreada mayor cuanto mayor es la tasa de autocita.journal-scholar-metrics. .238 La revolución Google Scholar Figura 72.infoec3.es/layout. Página de inicio de Journal Scholar Metrics Figura 73.

—— Categorías temáticas en las que la revista ha sido asignada. el usuario podrá acceder a la página correspondiente al perfil de la revista. Perfil de la revista Online Information Review en Journal Scholar Metrics <http://www. marcando en negrita las categorías que corresponden con la categoría nuclear asignada en Journal Scholar Metrics.journal-scholar-metrics. En el caso de ser listada únicamente en el ranking “all journals”. así como la categoría temática en la que ha sido clasificada en cada una de ellas. tanto si contamos únicamente las revistas nucleares (ranking “only core journals”) o todas (ranking “all journals”. automáticamente podrá obtener el porcentaje de autocita. —— Indicadores de impacto: se recopilan los mismos indicadores mostrados en la página del ranking.infoec3. —— Lista de bases de datos en las que la revista ha sido indizada. Finalmente. así como la posición y cuartil que ocupa en cada una de ellas. implica por tanto que la revista es solamente relacionada para la categoría en cuestión.Bloque B · Capítulo 10 · Productos derivados independientes Si el usuario se sitúa encima de cada gráfico. en la que se muestra la siguiente información: —— Nombre y país de la publicación.es/layout. que incluye tanto revistas nucleares como relacionadas). Figura 74.php?id=journal&j_name=Online+Infor mation+Review&subject=library_and_information_science> 239 . si pulsamos sobre cualquier título de revista listada en cualquiera de los rankings.

Dado el impacto que este listado tuvo y la discusión generada en torno al mismo y a su metodología.blogspot. de instituciones (universidades.240 La revolución Google Scholar La biblioteconomía y documentación española según Google Scholar Citations Tomando como base el listado de autores del área de Documentación obtenido durante el desarrollo del H-Index Scholar.infoec3. Respondemos con ello a las llamadas públicas realizadas tanto por especialistas en bibliometría y evaluación científica como. en general. Con ese fin diseñamos un original y novedoso procedimiento para conocer el impacto de toda una disciplina científica (la Biblioteconomía y Documentación).com.es/2014/12/los-autores-espanoles-de. que es la base de datos de información científica más exhaustiva que existe a día de hoy. Scopus). El resultado de este ejercicio fue “La Biblioteconomía y Documentación española según Google Scholar Citations” 15. que fue publicado en diciembre de 2014 en el blog Google Scholar’s Digest 14. las revistas y las editoriales en las que se publican y las instituciones donde laboran los autores).html 15 http://www. Aquí es donde precisamente radica la originalidad de esta propuesta pionera: a partir de la producción científica de la comunidad académica de la Biblioteconomía y Documentación que cuenta con un perfil público en Google Scholar Citations. los autores nos dispusimos a diseñar un nuevo producto que. a 14 http://googlescholardigest. Este listado pretendía ser un mero ejercicio dialéctico acerca del impacto científico e influencia académica de las distintas especialidades que anidan en la Biblioteconomía y Documentación española. Se trata de una aproximación bottom-up que parte del trabajo realizado por los autores vinculados a una disciplina tal como se muestran en Google Scholar.es . ampliara sus objetivos. confeccionados exclusivamente a partir de indicadores basados en el impacto de las revistas en las que publican y que figuran indizadas en determinadas bases de datos (Web of Science. fundamentalmente) y de autores. a la par de exhaustivo y metódico. de una comunidad científica-profesional concreta (la española) así como de los principales agentes que la vertebran (los científicos y profesionales. se obtiene una radiografía bastante fiel de lo que es toda una disciplina o especialidad. Con este producto iniciamos un proceso de deconstrucción de los tradicionales rankings de revistas. los documentos que producen. se procedió a realizar un listado actualizado y ampliado de “Los autores españoles de Biblioteconomía y Documentación según Google Scholar Citations”.biblioteconomia-documentacion-española.

se excluyeron a aquellos autores que habían publicado esporádicamente sobre ByD. fiabilidad y validez de la información suministrada por Google Scholar Citations para radiografiar bibliométricamente una disciplina. sustantiva y mayoritariamente sobre Biblioteconomía y Documentación. Asimismo. —— Comprobar la capacidad de Google Scholar Citations para gestar rankings que detecten el núcleo de los autores. a fecha de 27 de febrero de 2015. Para la búsqueda e identificación de los autores españoles se realizaron diversas búsquedas por palabras clave representativas de los temas cubiertos por la Biblioteconomía y Documentación (ByD). Búsqueda e identificación de autores La unidad de análisis del producto fueron los autores con perfil público en Google Scholar Citations. se realizó una revisión sistemática del listado de autores a fin de detectar falsos positivos. en este caso la Biblioteconomía y Documentación. cuya producción científica versara sobre Biblioteconomía y Documentación. El criterio de inclusión fue el siguiente: dos tercios de la producción que contribuyera al h-index debían tratar de 241 . Asímismo.Bloque B · Capítulo 10 · Productos derivados independientes una corriente de pensamiento que recorre todos los ámbitos científicoacadémicos. se empleó el listado de profesores españoles de ByD utilizado previamente para otros productos (en este caso el H Index Scholar). esto es. organización. grupo de investigación. Se excluyeron por tanto a aquellos autores que empleaban palabras clave propias del campo de la ByD para etiquetar su perfil. pero cuya producción no se correspondía a la temática de nuestra disciplina. dominio temático) en lugar de seguir evaluando a los científicos e instituciones a partir del impacto de los medios o canales de difusión en los que éstos publican sus resultados. Tras el proceso de búsqueda (realizado el 27 de febrero de 2015). documentos. revistas y editoriales más influyentes en la Biblioteconomía y Documentación española. donde se reclama medir directamente el impacto real de las diversas unidades de análisis científica (individuo. La fuente de datos utilizada fue Google Scholar Citations. —— Probar nuevas formas de construcción de clasificaciones y rankings científicos utilizando los recuentos de citas producidos por Google Scholar. Los objetivos de este producto son fundamentalmente tres: —— Testar la exhaustividad. autores cuya producción no verse sustancial.

242 La revolución Google Scholar asuntos relativos a la ByD. Se realizó un proceso de eliminación de duplicados. Procesamiento de datos Una vez descargados los perfiles de los 336 incluidos en nuestro listado. se construyeron los rankings de revistas. se podrían haber cometido algunos errores en el cálculo de estos . A partir de una muestra final de 493 documentos altamente citados. se identificaron los documentos indizados en esta base de datos para los 336 autores que figuraban en nuestro listado y las citas que estos documentos habían recibido. pero tuvimos que desistir de ello por varias razones: en primer lugar. editoriales e instituciones que se mencionan. en segundo lugar porque la mayoría de los perfiles o bien carecían de información bibliográfica o bien estaba desactualizada. como son Web of Science y ResearchGate: Para los datos de la Web of Science. el sistema ofrece datos bibliométricos de dos fuentes externas. Estos listados contienen el número de documentos altamente citados publicados en las revistas científicas. editoriales e instituciones. la filiación institucional que figura en el ranking de autores es la declarada expresamente por los autores en sus perfiles de Google Scholar Citations. tarea necesaria pues muchos documentos al ser firmados en colaboración aparecían en los perfiles de cada autor. se optó por elegir el que contaba con la cifra más alta. Por otra parte. Se realizó una última revisión de estos documentos a fin de excluir aquellos que no guardaran vinculación temática con la ByD (39). Datos adicionales a Google Scholar Aparte de Google Scholar. debido a la problemática en la búsqueda de autores en Web of Science. Inicialmente pretendimos utilizar los perfiles de ResearcherID para obtener los datos. Se ejecutaron búsquedas bibliográficas para cada autor contemplando las principales variantes de su nombre a fin de identificar todas sus posibles publicaciones y las citas enlazadas a las mismas. Advertimos que. se extrajeron los 100 documentos más citados de cada autor. En caso de discrepancia en el número de citas. asignándose el documento a todas las instituciones firmantes. porque el 32% no tenían perfil. Para la adscripción institucional de los documentos se siguió el recuento múltiple. Una vez depurado el listado de documentos se ordenaron por número de citas y se seleccionó el 10% de los documentos altamente citados (percentil 90).

se utilizó el número de citas. El segundo es el sumatorio del factor de impacto de las revistas indizadas en los Journal Citation Reports donde se han publicado los artículos. —— Revistas que contengan documentos altamente citados (percentil 90). De ResearchGate se han utilizado dos indicadores: el RG Score y el Total Impact Points. así como el número total de citas recibidas y h-index según esta base de datos. Por otra parte. editoriales e instituciones se utiliza el porcentaje de documentos altamente citados (incluidos en el percentil 90) y el de citas que acumulan dichos documentos. animamos a los investigadores a que creen su perfil en ResearcherID y a que lo mantengan actualizado para evitar posibles errores en próximas ediciones. Aquellos que no disponían de un perfil en Google Scholar Citations fueron incluidos en un listado independiente. Indicadores bibliométricos Para clasificar a los autores se ha empleado el número total de citas recibidas y el h-index (tanto total como el relativo a los últimos cinco años. Visualización de resultados El producto se presenta en los siguientes cinco rankings complementarios: —— Autores españoles que publican en Biblioteconomía y Documentación con perfil público en Google Scholar Citations. de cómo éstas son recibidas por los científicos de la red y del nivel reputacional de los científicos que interactúan con los perfiles y los documentos asociados a ellos. en el período 2010-2014). se identificaron los perfiles de los autores españoles que investigan en Biblioteconomía y Documentación en ResearchGate. —— Documentos altamente citados (percentil 90) por los autores incluidos en dichos perfiles. Para clasificar las revistas. El primero se edifica a partir de las publicaciones que figuran en los perfiles. Por ello. 243 . Para clasificar los documentos altamente citados de los autores cuyo perfil ha sido objeto de análisis. Adicionalmente se incluyeron el número de documentos publicados en Web of Science Core Collection.Bloque B · Capítulo 10 · Productos derivados independientes datos. tanto en Google Scholar como en Web of Science Core Collection (en aquellos casos en que el documento esté indizado en dicha base de datos).

. Google Scholar. y otras que puedan incorporarse en el futuro). más académico) y diferentes patrones de publicación. que permite acceder a los cinco rankings. A conocer mejor las carreras científicas y académicas de los autores incluidos y. En la figura 75 se muestra el ranking obtenido para los documentos altamente citados. a valorar de una forma quizá más justa y completa la madurez y desarrollo de la disciplina en un país. Ranking de documentos en La Biblioteconomía y Documentación española según Google Scholar Metrics El análisis complementario tanto de diversas unidades (autores. en definitiva. ResearchGate. Figura 75. revistas.244 La revolución Google Scholar —— Editoriales que contengan documentos altamente citados (percentil 90). permiten obtener una radiografía completa del entramado de una disciplina. En la parte superior se dispone del menú general. observando diferentes tipos de impacto (más profesional. editoriales e instituciones) como de fuentes de datos (WoS. documentos. en el que se muestra tanto el año de publicación como las citas obtenidas en WoS y Google Scholar. —— Instituciones que contengan documentos altamente citados (percentil 90).

se presenta en Scholar Mirrors 16 el impacto de una especialidad científica completa. Una vez se conoce la población de autores que GSC ofrece de la especialidad. Informetría. Webometría y Altmetrics). a partir de sus agentes principales: autores (tanto académicos como profesionales).es 245 . revistas y editoriales (figura 76). independientemente de la nacionalidad de sus autores: la Bibliometría y áreas afines (Cienciometría. y siguiendo el modelo desarrollado anteriormente en La biblioteconomía y documentación española según Google Scholar. Humanities and Social Sciences Finalmente.infoec3.scholar-mirrors. Figura 76. documentos. ésta se confronta a la fotografía que proporciona ResearcherID (sistema de identificación de autores científicos elaborada por Thomson Reuters) así como a las imágenes proyectadas por nuevas plataformas 16 http://www.Bloque B · Capítulo 10 · Productos derivados independientes Scholar Mirrors: Arts. Scholar Mirrors – Author general overview Deconstrucción de rankings y espejos académicos El desarrollo de este producto parte de la identificación de los miembros de la comunidad bajo estudio a partir de los autores que han creado un perfil público en Google Scholar Citations (los autores sin perfil o con perfil privado han sido excluidos).

De esta forma se desarrolla una perspectiva exhaustiva y multifacetada (tanto en agentes de investigación como en canales de comunicación) de la disciplina de la Bibliometría (y áreas métricas afines). elaborados a partir de las métricas generadas exclusivamente por el impacto de una colección de revistas elitistas en las que los autores publican (aquellas indizadas en las bases de datos tradicionales: Web of Science y Scopus). haciendo posible una comparación tanto del uso de las plataformas sociales como de la huella que éstas producen de una forma sencilla e intuitiva. en este caso de los autores que habían publicado en las áreas de Bibliometría. Webometría y Altmetrics. como son ResearchGate (red social académica) y Mendeley (gestor de referencias bibliográficas con prestaciones de red social académica). Y es en este contexto en el que aparece el concepto de Scholar Mirrors. queda en el observador individual. Este producto responde por tanto a una corriente actual de pensamiento que clama por la medición directa del impacto real de las diversas unidades de análisis científico (documentos. permitiendo la visualización de los distintos espejos en los que la actividad de los académicos se está reflejando hoy día. Scholar Mirrors permite por tanto la apertura de un proceso de deconstrucción de los rankings tradicionales de revistas y autores. Búsqueda e identificación de autores relevantes Tal y como se ha comentado. en el que los datos hablan por sí mismos y la interpretación.246 La revolución Google Scholar provenientes del mundo de la Web social que permiten actualmente a los autores la construcción de perfiles personales. Cienciometría. Para la localización de los perfiles se siguieron tres estrategias complementarias: Palabras clave . como no podía ser de otra forma. Informetría. se incorporan al producto las páginas personales de los autores (en tanto que primera ventana que los investigadores dispusieron en la Web para mostrar sus actividades académicas) y Twitter (el popular servicio de microblogging). organizaciones. Finalmente. dominios temáticos) en lugar de continuar evaluando a los autores de forma restrictiva a través del impacto del medio o canal de comunicación en el que difunden sus resultados de investigación. y que dispusiesen de un perfil público en Google Scholar Citations. a fecha del 24 de julio de 2015. el primer paso consistió en la identificación de todos los miembros de la comunidad analizada. autores.

). etc. ‘bibliometry’.000 documentos (entre ellos. Journal of informetrics. etc. se procedió asimismo a buscar términos alternativos (por ejemplo: ‘bibliometrics’. aunque éstos hayan incorporado etiquetas pertinentes en sus perfiles personales (debemos recordar que Google Scholar proporciona control absoluto a los autores para incorporar los términos que ellos deseen. con el doble propósito de: —— Detectar falsos positivos: autores cuya producción científica está completamente alejada de la disciplina evaluada.com. Este proceso permitió la recopilación de cerca de 15.Bloque B · Capítulo 10 · Productos derivados independientes Se realizó una búsqueda en un conjunto de revistas nucleares de la disciplina (Scientometrics. a partir de las cuentas de correo electrónico verificadas en los perfiles (por ejemplo cwts. ‘bibliometrics methodology’. Afiliación institucional Se buscaron manualmente los perfiles asociados a centros de investigación dedicados a la Bibliometría. —— Clasificar a los autores en dos categorías: 247 . ‘bibliometric’. todos los artículos publicados por las revistas nucleares indicadas previamente). ISSI Proceedings) con el objetivo de extraer un conjunto de términos ampliamente utilizados y representativos de la disciplina (un total de 18 keywords). Research Evaluation. Búsquedas adicionales Finalmente se llevaron a cabo búsquedas adicionales en el buscador general de Google Scholar con el fin de localizar autores con perfiles públicos creados en GSC. Filtrado y clasificación de perfiles de autor En esta fase se llevó a cabo un proceso de revisión manual sistemática. Dada la falta de normalización de los términos.leidenuniv. pero que no incluían entre sus áreas de interés los términos utilizados en la primera estrategia. science-metrix. a partir de los cuales se identificaron autores no incluidos en los pasos anteriores. sin control o filtro alguno).nl. Cybermetrics. Posteriormente se buscaron los perfiles académicos que contuvieran dichos términos entre las áreas de interés manifestadas por los autores (se recuerda que GSC permite un máximo de 5 términos por perfil.). ver figura 50).

Related (relacionados): autores que de forma esporádica han publicado estudios bibliométricos o su área de especialización está muy relacionada (estudios sociales. En el caso de que el documento no estuviera indizado en esta base de datos. de los que 397 se consideraron nucleares y.248 La revolución Google Scholar Core (nucleares): autores cuya producción científica pertenece en su mayor parte al campo de la Bibliometría. Aproximación multifacetada I: unidades de análisis científico Una vez obtenida y caracterizada la muestra. 4 en Mendeley. se utilizó el servicio WoS’s Cited Reference Search. que se ordenaron en función del número de citas recibidas. para los 813 autores seleccionados con anterioridad. se seleccionaron finalmente un total de 813 perfiles públicos en GSC. h-index i10-index. Tras aplicar los procesos anteriores. En cada una de las plataformas seleccionadas se extrajeron los principales indicadores disponibles. se trató de localizar sus perfiles en las plataformas seleccionadas: ResearcherID. un total de 24 métricas (5 en ResearcherID. Tras la eliminación de duplicados se obtuvo una muestra de 41. aparte de las 6 métricas extraídas de Google Scholar Citation (Citas recibidas. 9 en ResearchGate. y 6 en Twitter). Aproximación multifacetada II: espejos en la web social Finalmente. se procedió a extraer los 100 documentos más citados de cada autor según su perfil académico. ResearchGate.000 documentos. La página personal de los autores se extrajo de la información proporcionada por los autores en su perfil académico en GSC (Ver figura 50). se extrajo la información bibliográfica básica (especialmente las fuentes: revistas y editoriales) así como el número de citas en Web of Science.000 documenos más citados de este listado. autores relacionados. Esta búsqueda se realizó durante las dos primeras semanas de septiembre de 2015. Para los 1. tanto totales como las relativas a los últimos 5 años). Mendeley y Twitter. los 416 restantes. políticos o económicos sobre Ciencia). .

departamentos. convirtiendo al PC (Personal Computer) en un electrodoméstico de consumo. A saber: —— Espectacular crecimiento de la literatura académica en acceso abierto en Internet. las nuevas herramientas de búsqueda. La irrupción de Internet a partir de la década de los noventa del siglo XX supuso un hito extraordinario pues revolucionó las formas de comunicación humana. Word) sacaron el arte de la tipografía de las imprentas llevándola a nuestras mesas de escritorio. han penetrado en el tejido científico a toda velocidad. En segundo lugar. gracias a la . Desencadenó una serie de cambios tecnológicos y metodológicos que han derivado en la creación de una serie de herramientas que han abierto enormes posibilidades para la búsqueda de información académica y medición del rendimiento científico. institutos). si Internet. han supuesto la popularización y democratización de la búsqueda y evaluación de la información académica. En primer lugar. si los programas de tratamiento de textos (WordPerfect. a través de las cuales los científicos y las entidades en que éstos trabajan intentan difundir los productos de su actividad académica. Simples y sencillos de entender y usar . así como de acceso libre y gratuito. El número de documentos científicos circulantes en Internet y en acceso abierto crece de manera exponencial gracias a la conjunción de distintos fenómenos. acceso y evaluación de la información científica (Google Scholar y su familia así como los productos derivados de los mismos que son objeto de este libro). creó una auténtica aldea global al conectar el mundo y la sociedad derribando las fronteras espaciales e incorporó a los circuitos del saber a toda la población dando voz a los que no la tenían y altavoz a los que ya la poseían. debido a la proliferación de páginas web personales e institucionales (grupos de investigación.Conclusiones Google Scholar: la caja de pandora académica Si el ordenador lanzado al mercado por IBM a principios de los 80 del siglo pasado supuso la entrada de la informática en nuestra vida cotidiana. y si Google significó la búsqueda fácil y rápida de información (bastaba con asomarse a una simple ventana alejada de las complejas pantallas de búsqueda de las bases de datos y catálogos bibliotecarios).la divisa de estas nuevas herramientas -.

Google Scholar se ha convertido ya (y teniendo en cuenta su ritmo de crecimiento vertiginoso lo será más en el futuro inmediato) en una mina de información científica prodigiosa. el tratamiento y la medición de la información bibliográfica indizada por Google Scholar. informes…) y al hacerlo en todos los países e idiomas. deviene en una herramienta de suma utilidad para medir la producción y el impacto académico en el sentido más amplio del término. tesis. —— Creación de índices bibliométricos (h-index) simples y sencillos de construir y entender. que es la peor controlada por los sistemas de información dominantes en el mundo académico. —— Creación de nuevas herramientas para la búsqueda masiva. ponencias y comunicaciones en congresos. recoge documentos en todos los idiomas sin restricción y recupera un porcentaje muy elevado de citas. material docente. y capaces de sintetizar las dos dimensiones de la actividad científica: producción e impacto. tesis. —— Extraordinario crecimiento y mejora en la indización de la literatura científica a través de los buscadores. indiza mayor variedad de géneros documentales (artículos de revistas. muchas de las cuales proceden de las fuentes de referencia académica para el universo de las Humanidades y Ciencias Sociales. Pero es especialmente de utilidad para los científicos de Humanidades y Ciencias Sociales porque controla como nadie lo ha hecho hasta ahora la literatura no anglosajona y aquella transmitida por medios distintos a las revistas científicas. Al rastrear en la Web toda la variopinta tipología de documentos de corte académico generados por los profesores e investigadores en su actividad cotidiana (libros. de los cuales el programa “Publish or Perish” es el más representativo. informes. libros. . comunicaciones a congresos…).250 La revolución Google Scholar multiplicación de repositorios institucionales y temáticos. Y en tercer lugar. capítulos. nacidos al calor del movimiento open access. artículos de revistas científicas. Desde un primer momento Google Scholar se convirtió en un buscador de documentos académicos y de las citas que éstos reciben. recuperación y acceso universal a las publicaciones científicas. El nacimiento a finales de 2004 de Google Scholar marcó una auténtica innovación en la búsqueda. por la presencia en la Web de catálogos de editoriales. A lo largo de todos los trabajos y estudios comentados en esta obra se ha puesto de relieve que Google Scholar cubre muchísimos más documentos que cualquiera de los sistemas de información científica tradicionales. bibliotecas. repertorios bibliográficos y directorios de publicaciones científicas de todas clases.

Conviene recordar que mientras que los indicadores bibliométricos fueron adoptados inmediatamente como herramientas evaluativas en las disciplinas científico-técnicas. se orientan fundamentalmente a las disciplinas científico-técnicas y poseen un marcado sesgo anglosajón en cuanto a la procedencia e idioma de los documentos que indizan. carencia de control y normalización de sus registros). No podemos ignorar o menospreciar ni mucho menos desaprovechar esta oportunidad para indagar en el análisis métrico de la información científica y académica de campos inéditos hasta el momento. Gracias a Google Scholar se puede llegar a lugares antes insospechados para ofrecer retratos que. bien sean revistas. Google Scholar y los productos gestados en su interior abren posibilidades insospechadas y que debemos explorar. casi imposible dada la naturaleza universal de la empresa). —— Citan fundamentalmente monografías. Las peculiaridades de los investigadores de Humanidades y Ciencias Sociales en sus prácticas de comunicación científica hacen inservibles las bases de datos bibliográficas tradicionales que ofrecen tanto recuentos de publicaciones como de citas (Web of Science. son mejores que la nada. Psychinfo…). aunque a veces sean de brocha gorda. trabajos publicados en su lengua nativa y en medios nacionales. —— Publican fundamentalmente en medios nacionales. aunque tienen una especial predilección por las monografías (libros y capítulos de libros). Scopus. por otra parte. falta de transparencia en la selección de fuentes. Dichas bases de datos cubren casi exclusivamente artículos de revistas. es tan masiva y rica la información académica que procesa que no podemos mirar hacia otro lado. como son las Humanidades y Ciencias Sociales. 251 . A efectos evaluativos ofrece luz donde antes había sombras. todos ellos ampliamente discutidos en el capítulo 7.Conclusiones · Google Scholar: la caja de pandora académica A pesar de los problemas técnicos y metodológicos que pueda actualmente presentar Google Scholar como fuente de información (errores en la identificación de documentos y citas. actas de congresos o editoriales de monografías. —— Utilizan su lengua vernácula como principal medio de expresión. en las Humanidades y Ciencias Sociales quedaron relegados a un segundo plano cuando no abiertamente rechazados. y a que desconozcamos con precisión y no controlemos sus entrañas (algo. Google Scholar puede ayudar a abrir definitivamente la caja de Pandora académica. Las razones no fueron otras que la propia idiosincrasia de la investigación en estos campos: —— Publican en una amplia variedad de medios. Pues bien.

que se dirigen complementariamente a comprobar el grado de aceptación de productos de esta naturaleza en comunidades académicas. manifiestamente perjudicados (o directamente olvidados) en las bases de datos bibliométricas tradicionales. Permitirán desvelar y aflorar el rendimiento de investigadores hasta ahora infravalorados. informes y capítulos de libro) hasta ahora ocultas. deseamos que esta obra pueda servir de ayuda tanto para comprender el funcionamiento de Google Scholar como para vislumbrar las enormes posibilidades que su uso promete.252 La revolución Google Scholar La apertura definitiva de esta caja liberará a tipologías documentales (especialmente monografías. Un investigador tiene el deber de dudar. inaccesibles e inexpugnables. programas de financiación o incluso estructuras y políticas de investigación. tan alejadas de ejercicios y prácticas bibliométricas de este calibre. pero sin aplicación ni repercusión práctica. observemos y describamos esos nuevos paisajes y decidamos entonces si preferimos quedarnos solamente con la superficie. Por todo ello. Quizás todo ello permita por fin replantear ciertos sistemas de evaluación y promoción. con mayor o menor impacto. colocando el impacto de sus trabajos en órdenes de magnitud similares a los de otras disciplinas. Esperamos por tanto contribuir y ayudar de este modo a la comunidad científica a dudar acerca de la supuesta verdad de un mundo académico visto exclusivamente desde la punta de un elitista iceberg. como son las de los científicos de los campos humanísticos y sociales. . Por el contrario. El reciente informe “The Metric Tide” (Wilsdon et al. hasta ahora protegidos por la ausencia de instrumentos y prácticas de evaluación. 2015) comienza de hecho a dejar entrever esta corriente de cambio desde una posición institucional y no meramente como un ejercicio intelectual. No hay que olvidar por otra parte el carácter experimental de todos los productos mostrados en el segundo bloque del libro. confirmará el bajo cuando no nulo rendimiento de otros investigadores. cuyas características bibliográficas (en tanto documentos citantes y/o citados) están destinadas a modificar ciertos axiomas y prejuicios en la evaluación académica. evitando en la medida de lo posible las meras opiniones o prejuicios. sin olvidar por supuesto las importantes amenazas que su uso y abuso pueden implicar. tesis. aportando para ello datos empíricos (contra data non argumenta. es una de nuestras divisas). propias de otras actividades profesionales no científicas. reclamado por unos pocos y confinado en el mejor de los casos en resultados de investigación. Exploremos al menos las profundidades.

J. Delgado LópezCózar. Ayllón. R.. 17. 74(2). L. Comparison of PubMed and Google Scholar literature searches. 91(2). Usage Stalled. Counting citations in the field of business and management: why use Google Scholar rather than the Web of Science. Orduña-Malea. computation and standardization for different scientific fields. Glover.M. Scopus and Google Scholar. Cabrerizo. 578-583. Scientometrics.. Bakkalbasi.. Delgado López-Cózar. Landry. (2012). L. Williams. Citations to the ‘Introduction to informetrics’ indexed by WOS. Scopus and Google Scholar. (2010). Which h-index? — A comparison of WoS. (2013). Scientometrics. O’Brien. (2012). (2009).. Baggett. 727744. Amara. Scientometrics. Staff Stressed. K. Scopus and Web of Science. Scientometrics.E. Índice H de las revistas científicas españolas según Google Scholar Metrics (2009-2013). Bar-Ilan. 30(1). J. Invisible institutional repositories: Addressing the low indexing ratios of IRs in Google Scholar. 273-289. Biomedical digital libraries.S. Índice H de las revistas científicas españolas según Google Scholar Metrics (2008-2012). Herrera. Evans. Library Hi Tech.Bibliografía Adriaanse. Ayllón. Scopus and Google Scholar: A content comprehensiveness comparison. (2007). 13.M. Índice H de las revistas científicas españolas según Google Scholar Metrics (2010-2014). Three options for citation tracking: Google Scholar. (2011). 257-271.. J. 60-81. (2013). A. S. Anders. M. (2014). A.. Alonso. E. 3(4). (2012).. (2006). 31(6). M. 7.S. 93(3). (2015). R.. EC3 Reports. Is Google Scholar useful for bibliometrics? A webometric analysis.. Orduña-Malea. S. E. Budgets Stretched. J. Aguillo. E. 7. Web of Science.. Arlitsch. 553-581. F. J. K... (2010).. Journal of Informetrics. 82(3). EC3 Reports. Bauer. Wang. Delgado López-Cózar. Ruiz Pérez.. J. The Electronic Library.P. Ruiz-Pérez. E.. 55(5). Bar-Ilan. 3(1). EC3 Reports. Martín-Martín. E. E. R. 343-351. P..M. Herrera-Viedma... N. Isidro F. . F. Martín-Martín. C. Rensleigh. 495-506. Respiratory care.. H-Index: A review focused in its variants. J. Something’s Gotta Give! En Proceedings ofthe Charleston Library Conference.. Ayllón. N. D..

Daniel. E.J.. W. Brantley.. Comparison of the Research Effectiveness of Chemistry Nobelists and Fields Medalist Mathematicians with Google Scholar: The Yule-Simon Model Blankenship. H.F. 27-35. (2015). Academic Search Engine Optimization (ASEO): Optimizing Scholarly Literature for Google Scholar and Co. and Google Scholar (GS) citations: a test of their relationship with economics Nobelists. An examination of citation counts in a new scholarly communication environment. W. Schier.J.. L.. Who Holds the Keys to the Web for Libraries? En Willian Miller y Rita M. J. Vach.). Google Scholar’s ranking algorithm: an introductory overview. Katz.. Smolinsky.. Journal of Informetrics. (2014). (2010). N.. (2009). P. (2013). Daugherty. D. Belew... R. Rahm. Lin. J..F. H. Beel.D. B. Beel.. Systematic reviews. W. D. K. (2013). Anderson.. 1(1). Journal of Scholarly Publishing. W.. Google Scholar as replacement for systematic literature searches: good relative recall and precision are not enough. En Proceedings of the 12th International Conference on Scientometrics and Informetrics (ISSI’09). M.J. Scientific impact quality and quantity: Analysis of two sources of bibliographic data. L. 3(1). L. (2014). 26-34.254 La revolución Google Scholar Bar-Ilan. M. Convergent validity of bibliometric Google Scholar data in the field of chemistry—Citation counts for papers that were accepted by Angewandte Chemie International Edition or rejected but published elsewhere.. L. A. Science Citation Index. Levene. B. 230-241. Journal of electronic publishing. B. J.. Bornmann. 41 (2).. 11(9). D-Lib magazine. (2009). Wilde. (3 July 2007). 176-190. S.. 54-65). J.. Smolinsky..M. Pellen (Ed. Sc. E. using Google Scholar.. Motschall. H. (2010). The application of bibliometrics to research evaluation in the humanities and social sciences: an exploratory study using normalized Google Scholar data for the publications of a research institute. Academic Search Engine Spam and Google Scholar’s Resilience Against it. Gipp... A. Marx. Bornmann.S.M. Gipp. (2009). P. 13(3).J. E. BMC Medical Research Methodology. 13(131). Bensman. Sage. Thor. 2(1). D.. S. 1. Giustini. Science Direct-ly into Google. Sage. Bakkalbasi. B.S. (2005). Bauer. Thor. Bensman. Some measures for comparing citation databases. Gipp.. the h-index.. 115. The comparative recall of Google Scholar versus PubMed in identical searches for biomedical systematic reviews: a review of searches used in systematic reviews. Powerlaw distributions. Beel. Schier. Marx. Googlization of Libraries (pp. Journal of Informetrics. Kramer. London: Routledge Boeker. Bramer. A. Tools of change for publishing. E. A. (2007).R. J..K. .S. (2005).

(2012a). Researchers of Tomorrow: The research behaviour of Generation Y doctoral students.. Library Scholar: Testing the Performance of Schoogle. (2004).. Metalib. and Google: the strenghs and weaknesses of federated search engines compared with Google. N. ¿Es posible usar Google Scholar para evaluar las revistas científicas nacionales en los ámbitos de Ciencias Sociales y Jurídicas? El caso de las revistas españolas. Researchers’ use of academic libraries and their services: a report commissioned by the Research Information Network and the Consortium of Research Libraries. Science searches shift up a gear as Google starts Scholar engine. Carr. A. 1. S. (2013). 37(5). 255 . A. EC3 Working Papers. (2005). 413-427. 423. Delgado-López-Cózar. J. Brin. (2012c). Chen. Superficiales: ¿Qué está haciendo Internet con nuestras mentes? Madrid: Taurus. X.Bibliografía Breeding. Callicott. E. Las revistas españolas de Ciencias Sociales y Jurídicas en Google Scholar Metrics. Cabezas-Clavijo. D. Online Information Review 30(4). Swan. ¿están todas las que son? EC3 Working Papers. Brophy. Google Scholar vs. E. 71-88. 56(18). 498-512. 98(4). Nature. 2.. J. A. Google Scholar Metrics 2013: nada nuevo bajo el sol. NISO whitepapers. Carpenter. Webfeat. (2012). N. 32(1).. Reprint of: The anatomy of a large-scale hypertextual web search engine. (2015).. Medicina intensiva.. Bawden. Cabezas-Clavijo. EC3 Working Papers. M. Internet Reference Services Quarterly. Delgado López-Cózar. Delgado López-Cózar. (2013). Baltimore: NISO. Journal of the Medical Library Association. Cabezas-Clavijo. (2011). (2012). 432(7016). Google Scholar e índice h en biomedicina: la popularización de la evaluación bibliométrica. OCLC: Reports. E. College Students’ Perceptions: Libraries & Information Resources. RIN & CURL. Cecchino. S. Information Services and Use. E. 3-17.. A. Butler D. (2007). Scholar Metrics: the impact of journals according to Google. Computer networks. Google Scholar. B. 3. 3825-3833. 10(3). Cabezas-Clavijo. Cathy De Rosa et al. Is Google Enough? Comparison of an Internet Search Engine with Academic Library Resources. A. Aslib Proceedings. 57(6). 320-321. (2006). Page. L. (2005). (2005).. Delgado-López-Cózar. Brown. D.. 12 [English version]. 343-354. E. (2010). Cabezas-Clavijo. A. Vaughn. just an amusement or a valid scientific tool? EC3 Working Papers. Delgado López-Cózar. The future of library resource discovery. (2012).

Kyrillidou. Thomson. Cybermetrics. F.. Google Scholar acceptance and use among graduate students: A quantitative study. 2011-2013. Delgado López-Cózar.. Google Scholar’s Dramatic Coverage Improvement Five Years after Debut. X. 21(4). (2013). 39(3). (2010). Bordons. C.. E.. E. Journal of Informetrics. Learned publishing. Jiménez Contreras. Disponible en: Cooke. C. 31-42.. Oak Ridge... (2008). Issues in Science and Technology Librarianship.M. Cutler. Serials Review. J.. Ruiz Pérez.M. A. T. (2013). B. Ranking journals: could Google Scholar Metrics be an alternative to Journal Citation Reports and Scimago Journal Ranks. R. 293301. Association of Research Libraries. M. (2007). El profesional de la información. M. Ecology articles in Google Scholar: levels of access to articles in core journals. Cothran.. Donlan. Costas. G. LibQual+ 2009 Survey. 2014). R. 2ª edición. 419-427. (2009). ETDE/OA--237). E. (2013). 33(4). Heath. Elsevier Compendex and Google Scholar: A Quantitative Comparison of Two Resources for Engineering Research and an Update to Prior Comparisons.... ETDEWEB versus the World-Wide-Web: A Specific Database/Web Comparison (No. Disponible en: Cusker. JOURNAL SCHOLAR: Una alternativa inter- ... 26(2). (49). Delgado López-Cózar. E. R. 101-114.. E. EC3 Working Papers. Thinking Inside the Box: Comparing Federated Search Results from Google Scholar. Cook. Cabezas-Clavijo. limitations and its relation with other bibliometric indicators at the micro level. Journal of Library Administration. Library and Information Science Research. (2011). A. Delgado López-Cózar. (2010). USDOE/OSTI (Office of Scientific and Technical Information). Google Scholar Metrics revisado: Ahora empieza a ir en serio. J. Cabezas-Clavijo. Couto. E. 4. TN (United States). (23 agosto. Christianson. Índice H de las revistas científicas españolas según Google Scholar Metrics (2007-2011). 13(1). Delgado López-Cózar. F. D. Google da un lavado de cara a sus Google Scholar Profiles = Google Scholar Citations. 1(3). Cabezas-Clavijo. paper 2. (2012b). (2012a). Energy Technology Data Exchange (ETDE Operating Agent). Journal of Academic Librarianship. EC3 Informes. M. D. Pesquita. Live Search Academic. R. and Central Search. M. 193-203. Ruiz-Pérez. 221-226. R. Handling self-citations using Google Scholar. (2012). Google Scholar Metrics: An unreliable tool for assessing scientific journals. Marcos Cartagena. T. Roebuck.. Davis. 3. The h-index: Advantages.. Grego. 36(4). 8. Ayllón. Verissimo.. Delgado López-Cózar.. P. E. 46(3). (2007).256 La revolución Google Scholar Chen. Orduña Malea. Delgado López-Cózar. (2009). A. E.

A comparison of bibliometric indicators for computer science scholars and journals on Web of Science and Google Scholar. 46(3-4).. T. Journal of Library Administration.W. Reference Services Review. 32(3). E. 446-454. Etxebarria. Egghe. Repositories in Google Scholar Metrics or what is this document type doing in a place as such? Cybermetrics. 131-152. 45-52.. Ettinger. Delgado López-Cózar. and Google Scholar: A case study for the computation of h indices in Psychology. Accuracy and completeness of publication and citation records in the Web of Science. (2006). M. Humanidades y Ciencias Sociales. L.A. W. M. (2014). The Impact of Scientific Journals of Communication: Comparing Google Scholar Metrics. 478-484. Dubicki. Detlor. 2070-2085. E. (2009). Comunicar. Orduña-Malea.. 87-94. García-Pérez.K. D. E. Web of Science and Scopus. Kendrach. N. En Miller. 251-258. (2012). (2014). 333-349. Pellen. New York: Routledge. 23(1). Lauderdale. Delgado López-Cózar. E. gratuita y de libre acceso para medir el impacto de las revistas de Arte. M. S. (2010). (2009). M. Delgado López-Cózar. (2010). H Index Scholar: el índice h de los profesores de las universidades públicas españolas en humanidades y ciencias sociales. Use of Scopus and Google Scholar to measure social sciences production in four major Spanish universities.. Ettinger. Freeman. D. Annals of Pharmacotherapy.Bibliografía nacional. Ruiz-Pérez. (ed. R. (2008).. The Triumph of Expediency: the impact of Google Scholar on Library instruction.. Scientometrics. 38(3). R. 82(2). Google Scholar versus PubMed in locating primary literature to answer drug-related questions. G. E. 41. El profesional de la información. Academic library web sites: current practice and future directions. EC3 Working Papers. 360-384.. Scientometrics. Gomez-Uranga. Repiso-Caballero. 69(1). Woolley. 65(3). Robinson-García. (2010). 83(1).). D. Theory and practise of the g-index. 243-258.. Robinson-García. 257 . Journal of the American Society for Information Science and Technology. The triumph of expediency: The impact of Google Scholar on library instruction. N.A. Torres-Salinas. 16(1). Journal of Academic Librarianship. Google Scholar and more: new Google applications and tools for Libraries and Library users.G. B. The Google Scholar Experiment: how to index false papers and manipulate bibliometric indicators. R. (2009). V. 61(10). PsycINFO. 43(3). (2013). Lewis. E. E. 65-72. M. paper 4. Scientometrics.. Journal of the American Society for Information Science and Technology. Delgado-López-Cózar. Jiménez-Contreras.. Research behavior patterns of business students.. 5... (2006). Franceschet.

Is the coverage of Google Scholar enough to be used alone for systematic reviews. 98(1). J. 211-222. Google Scholar as a new source for citation analysis. Giles. Harzing.W. L. Wikipedia. D..W. 8(1). D. 42-45. E. S. Scientometrics. Inger. Karen A. . Online Information Review. Brophy. A. Tarma Software Research [HTML edition]. 5(2). The Impact on University Libraries of Changes in Information Behavior among Academic Researchers: A Multiple Case Study. A longitudinal study of Google Scholar coverage between 2012 and 2013. 109(5/6). 94(3). R. Boulos. 331(7531). Gehanno.. (2013). P. Abindon.258 La revolución Google Scholar Gardner.W. Griffiths. (2005). S. Harzing. 554555. 545. W. A look at Google Scholar. Gardner. (2014). Library Trends. (2007).. 85-89 Giustini. Google Scholar and academic libraries: an update. (2008). (2013a). J. Eng. A. P.. 31(3).. A. 53(4). How Google is changing medicine.. (2005). Giustini. L. (2005). G.. Henderson. (2007). 214. Metalib and Google Scholar: A user study. D. The publish or perish book. (2008). S. (2008).. (2013b). Online journal of public health informatics. PubMed. Gaga over Google? Scholar in the Social Sciences. Journal of Academic Librarianship. 22(8). (2013). Journal of the Canadian Health Librairies Association. Harzing. 8(1). Harzing..F. Google Scholar is not enough to be used alone for systematic reviews. Harzing. Rollin.N. Ethics in science and environmental politics.. (2013). Haglund.W.K. 26(3). Widmark. 61-73. Google Scholar. Google Scholar: the democratization of citation analysis. (2005). Van der Wal. Ethics in Science and Environmental Politics. Olsson. Renew Training. Nygren. New Library World. A. Giustini. 565-575. 172(12). BMC Medical Informatics and Decision Making. 34(1)... How Readers Discover Content in Scholarly Journals. Library Hi Tech News. Barsky. 61-73. E. 52. L. (2005). Comparing the Changing User Behaviour between 2005 and 2012 and its Impact on Publisher Web Site Design and Function.. (2005). Hartman. 438(7068). W.. Scientometrics. 13(7). Google Scholar: A Source for Clinicians? Canadian Medical Association Journal. A preliminary test of Google Scholar as a source for citation data: a longitudinal study of Nobel prize winners. Jillian R. and Scirus: comparisons and recommendations. M. Darmoni. BMJ. 365-375. Science in the web age: start your engines. Van der Wal. R. Bowering Mullen. S. J. 1057-1075. Student Searching Behavior and the Web: Use of Academic Resources and Google. Haya. Nature. 1487-1488. A. T. 1549-50.

Google Scholar revisited. Online information review. Google Scholar Metrics for Publications: The software and content features of a new open access bibliometric service. 437-452. Using Google Scholar for journal impact factors and the h-index in nationwide publishing assessments in academia – siren songs and airraid sirens.. Wulfson. Hughes. 259 . G. (2015). 32(3). Google Scholar: the pros and the cons... P. Issues in Science and Technology Librarianship. Google Librarian Central. 36(1). and Google Scholar. Online Information Review. Web of Science. Disponible en: Jaćimović. JISC & RLUK. (2012c). (2008c). Jacsó. T. P. 70 (3). The pros and cons of computing the h-index using Google Scholar. Hines. (2004). 175-191. J. Itaka S+R. As we may search–comparison of major features of the Web of Science. too late?. Jacsó. P. Jacsó. Online Information Review. (2009).. (2008b). C. Hsieh-Yee. Caldwell. Jacsó. Schonfeld. (2010). C. P. 29(2). Oxford: Chandos. College & Research Libraries. 604-619. (December 2006). 126-141.. Hightower. W. (2005a). Google Scholar Author Citation Tracker: is it too little. P. inflated. Housewright. with implications for library collections budgets. Scopus. Online Information Review. 56(4). (2011). Online Information Review. 72(4). Google Scholar lead engineer. R. Lancaster. Google Scholar Users and User Behaviors: An Exploratory Study. 34(1). 30(3). 784815. M. C. P. Online Information Review. and PubMed. 329. 208-214. A. P. Jacsó. Jacsó. B. (2008a). Online Information Review. 89(9). 201-211. Jacsó. Roberts. S. C. CNET News. (2013). An interview with Anurag Acharya. Roger C. Metadata mega mess in Google Scholar. 297-309. Jacsó. and phantom citation count. Online Information Review. A citation analysis of Serbian Dental Journal using Web of Science. 36(3). (2010). 227-234. Current Science. R. 63(4). and Web of Science for F. T. Wright. J. K. Deflated. R. 102-14. I. Stomatoloski glasnik Srbije. Google hit with trademark suit over ‘Scholar’.. Petrović. Google Scholar and its competitors: accessing scholarly resources on the web. UK Survey of Academics 2012. (2006). Jacsó.Bibliografía Herrera. Library Trends. (2010). L. Scopus and Google Scholar. (2005b). P. Živković. Shifting Sands: Science researchers on Google Scholar. 36(4). (2012b). P. Jacsó. 32(1). P. 462-478. (2012a). Howland. College & Research Libraries. Scopus. Testing the Calculation of a Realistic h-index in Google Scholar.. 1537-1547. How scholarly is Google Scholar? A comparison to library databases. 57(4). Boughan..

Biology Article Retrieval from Various Databases: Making Good Choices with Limited Resources. 302(10). e43235. 48-52. An Evaluation of Google Scholar and Scirus Search Engines Using Turkish Search Queries. 1635-1651. Journal of the Association for Information Science and Technology. 7(9). Scholarometer: A social framework for analyzing impact across disciplines. S.. (2015). Hoang. Scholarometer: a system for crowdsourcing scholarly impact metrics.. Universality of scholarly impact metrics.. (2015). S. (2013).. (2012). F. Issues in Science and Technology Librarianship. Library Journal. M. B.. Assessing the citation impact of books: The role of Google Books. M. (2013). 38(6). Kilgour. Aziz. 2147-2164. Nabavi. Menczer. Kaur. En: Proceedings of the 2014 ACM conference on Web Science. Scopus. 309-320.. (2009). E. 7(4). Yanar. 59-79. Journal of the American Society for Information Science. or Google Scholar. K. A. Kaluza. M. J. Radicchi. (2008). M. Information World Bilgi Dunyasi. 273-294. Scientometrics. F. Ike Antkare one of the great stars in the scientific firmament. Scientometrics... JafariAsbagh. F. Journal of Academic Librarianship. 105(3).. Google Scholar versus EBSCO Discovery Service : ein vergleichender Retrieval-Test. Kousha.W. Kousha. Menczer. PloS one..M. International Society for Scientometrics and Informetrics Newsletter. Finding Citations to Social Work Literature: The Relative Benefits of Using Web of Science. An automatic method for extracting citations from Google Books. T. Thelwall. F. F. S. 74(2). . Open access and sources of full-text articles in Google Scholar in different subject fields.und Informationswissenschaft der Fachhochschule Köln. D. F. 114(19). 1092-1096. (2010). H. Labbé. R.260 La revolución Google Scholar Jamali. Z. Scopus. 62(11). 9(1). M.. 140-157. Sources of Google Scholar citations outside the Science Citation Index: A comparison between four science disciplines. Y. J. Patil. Thelwall. Kaur.... H. Menczer. Busse.. J. JAMA. K. K. Radicchi. 44. Rezaie. (2005). Sun. MALIS Praxisprojekte 2013: Projektberichte aus dem berufsbegleitenden Masterstudiengang Bibliotheks. L. Kousha. M. Shams.. Lasda Bergman. Journal of Informetrics. (2014). Google Scholar.. C. Kaur. and Scopus. Possamai. (2011). 6(2). X. Toward 100-percent availability. Thelwall. 66(2). C.. 5053.. Kulkarni. Comparisons of citations in Web of Science. Kesen.. G.. J. 924-932. (2012). 285-286. Jones.V. 370-379. (1989). (2008).. I. JafariAsbagh. Şenol. and Google Scholar for articles published in general medical journals.

D. A Comparative Citation Analysis of Web of Science. Yang.. (2007). C. Journal of Business & Finance Librarianship. Rossi. E. Conkling.Bibliografía Lercher. E. S. (2006). Thomas W. An Exploratory Study of Google Scholar.. Google Scholar trademark case ends. Cegolon. M. (2007). 131. P. College & Research Libraries. 14(1). CNET News. K. Meho. Levine-Clark. Google Scholar as a tool for discovering journal articles in library and information science. EC3 Reports. Impact of data sources on citation counts and rankings of LIS faculty: Web of Science versus Scopus and Google Scholar. EC3 Working Papers. Mayr.. J. Ayllón. Levine-Clark. (2008). Mastrangelo. C. Literature search on risk factors for sarcoma: PubMed and Google Scholar may be complementary sources. M. Google Scholar. Mayr. 3-17. Fadda... Walter. Science. 31(6).R. Google Scholar Metrics 2014: a low cost bibliometric tool.. Information Wissenschaft und Praxis. A survey of attitudes about digital repositories among faculty at Louisiana State University at Baton Rouge. D. (2014).I. 21052125. 306(5702). 814-830. 261 . 2006).. Online Information Review. 27(4). E.K. E. Gil.. 32-46.L. and ISI Web of Knowledge with Implications for Promotion and Tenure.. (2008). 58(13).. “Back channel” on Medium. (2010). 201.. Delgado López-Cózar. Ayllón. Metha. A. 34(3).M. E. Journal of Academic Librarianship. E. (July 19. L. (2009). (2008). Coverage and up-to-dateness of the Google Scholar index.. Proceedings Scholar Metrics: H Index of proceedings on Computer Science. Orduña-Malea. Science & Technology Libraries. Meier John J. P. Zamprogno.. 34(2). Finding Chemistry Information Using Google Scholar. Google. J.K. (2010). (2004). Walter. G. 408-415. 17. 460-472. Kraus. A. Electrical & Electronic Engineering. J. A. 12. 3(1). 57(3). ACS takes legal action against Google: Google search service is said to infringe SciFinder Scholar trademark. 250-262. Google Scholar’s Coverage of the Engineering Literature: An Empirical Study. Lewandowski. A Google for academia. McCullagh. A. A. Journal of the American Society for Information Science and Technology. 34(5). Delgado López-Cózar. 1661-1663.. (2015). A Citation Analysis of College & Research Libraries Comparing Yahoo. Orduña-Malea. and Communications according to Google Scholar Metrics (2009-2013). BMC research notes. Martell. 2004). Online Information Review. A. Buja. (2007). Martín-Martín.. and Google Scholar. A. 70(5).. L. (10 Diciembre. E. Journal of Academic Librarianship. Chemical & Engineering News. (2015).M. Martín-Martín. The gentleman who made Scholar. Scopus. Levy. A. Leslie M..

A qualitative study of the impact of electronic journals on scholarly information behavior. 1.. 60(3). Oregón (Estados Unidos). Nugent. C. A. 32(3). A. OAIster and OpenDOAR. 174.. Rowland. (2009). Measuring our relevancy: comparing results in a web-scale Discovery tool.E. B. J. 29(3).. 214-222. E.. Google Scholar Goes to School: The Presence of Google Scholar on College and University Web Sites. Library & Information Science Research. 127-141. Journal of Library & Information Services in Distance Learning. Neuhaus. M. C. Journal of Academic Librarianship. Medical literature searches: a comparison of PubMed and Google Scholar. E. Delgado López-Cózar. Methods for estimating the size of Google Scholar. H.. En ACRL Conference 2015. N. Ollé. R. Google & Google Scholar. 6(2). Citations and the h index of soil researchers and journals in the Web of Science..262 La revolución Google Scholar Mikki. Borrego. Minasny. 931-949.. E. A. Asher. 82(2). Croft. (2009). 104(3).. K. Google Scholar: The New Generation of Citation Indexes. C. Journal of the American Society for Information Science and Technology. R. (2005). (2005). Scientometrics. Namei. Discovery layers and the distance student: Online search habits of students. McBratney. W. (2006).. A. (2013). G. Nourbakhsh. (2012). J. Oder. Wang. Health Information & Libraries Journal.. Portal: Libraries and the Academy. Google Scholar Links with Libs. Online. Libri: International Journal of Libraries & Information Services. Hartemink.. 709-715.) (2009). Martín-Martín.. Neuhaus. 25-28 marzo. (2013). 39-51 Neuhaus. Scientometrics. 32(6). 321-331.. Finding open access articles using Google. Orduna-Malea. Mussell.. (2008). 17-18. Mukherjee. Norris. B. Do open-access journals in library and information science have any scholarly impact? A bibliometric study of selected open-access journals using Google Scholar. 18-39. R. A. 221-228. Asher. (2008). M. S. Jang. C.. 34(1). Noruzi. E. (2005). Miller.. A. Nugent. Young. Neuhaus. Google Scholar and more: new Google applications and tools for Libraries and Library users. 55(4). C. Google Scholar.. New York: Routledge. A. E. (ed. Ayllón. (2015). . Oppenheim. E. Library Journal. 581-594. 130. 29(4) 39-41. (2010).. PeerJ. Cevik. 7(1-2). e183. C. Scopus. The depth and breadth of Google Scholar: an empirical study. Scholarly Web Searching: Google Scholar and Scirus... Online Information Review. F. (2015). Wrede. Christal A. Comparing Google Scholar and ISI Web of Science for Earth Sciences.. and Google Scholar. Notess. Pellen. H.

Priem. Science is all in the eye of the beholder: Keyword maps in Google scholar citations. Aguillo. Journal of the American Society for Information Science and Technology. Isidro F. EC3 Reports. Scientometrics. Reed Elsevier (2004). N. Reina Leal. (August 27. Equivalence of results from two citation analyses: Thomson ISI’s citation index and Google’s scholar service. First Monday. Serrano-Cobos. J. The silent fading of an academic search engine: the case of Microsoft Academic Search. Ortega. 394-403. (2012).. T. Delgado López-Cózar.M.H. Journal of the Association for Information Science and Technology. Quint. J. Ortega.L. Hemminger. Delgado López-Cózar.M.M. 65(6). 2353-2367. Isidro F. 493-500. (2014). Infotoday.L. En: STI 2014 Proceedings (pp.0: New metrics of scholarly impact on the social Web. (2014). R. EC3 Reports. 8. (2005). Delgado López-Cózar. Google Scholar Metrics evolution: an analysis according to languages.. 104(1). Repiso-Caballero.. (2013)..L. Isidro F. How is an academic social site populated? A demographic study of Google Scholar Citations population. 263 . J. 38(7). 1149-1156. B. Ortega. D. (2014).. Stergiou. (2014). Aguillo.. Martín-Martín.. 15(7).L. Pomerantz.. E. Orduna-Malea. 33-35. Online Information Review. Ethics in Science and Environmental Politics. Pauly.. 18(5). J. Repiso-Caballero. 2007). Academic search engines: A quantitative outlook. Reina Leal. E. 2370-2377. H Index of scientific Nursing journals according to Google Scholar Metrics (2008-2012). 7(2). P. Google Scholar and 100 percent availability of information. A..L. R. E.Bibliografía Orduna-Malea. Las universidades públicas españolas en Google Scholar: presencia y evolución de su publicación académica web. A. Van Leeuwen. Journal of Informetrics. Ortega. E. Scientometrics. 936-953. 5. Ayllon. Using Google Scholar in research evaluation of social science programs. J. 98(3).. Orduna-Malea. E. H Index of scientific Nursing journals according to Google Scholar Metrics (2007-2011). Wouters. R. Scopus Comes of Age.. E. 63(12). (2015). (2014). L. Changes at Google Scholar: A Conversation with Anurag Acharya. L. E.. Costas.... Lloret-Romero.. Prins. Scientometrics 2. Information Technology and Libraries.I. J. B. with a comparison with Web of Science data. El Profesional de la Informacion. 1-18. Oxford: Chandos. Delgado López-Cózar. (2010). K. Institutional and country collaboration in an online service of scientific profiles: Google Scholar Citations.. Ortega. J. J. 25(2). Microsoft academic search and Google scholar citations: Comparative analysis of author profiles. J. 52-56. (2006). Aguillo. (2014). (2009). 434-433). (2013).

D. 23-248. P. Hamid R. 41(1). Iansavichus. P. R. M. Rosenstreich. E. Pointing users toward citation searching: using Google Scholar and Web of Science. M. R.. 74(2). Fieldhouse. N. Portal: Libraries and the Academy.A. (2007). Gunter. (2013). (2013). E. Withey. The British Accounting Review. Haesbroeck... Croatian Medical Journal Citation Score in Web of Science.. Nicholas. D. 99-103. I. 10. T. R. Journal of Academic Librarianship. J. 51(2). 110-113. Huntington. Shultz.264 La revolución Google Scholar Repiso-Caballero.G. B. (2014). (2015). (2008).. Știrbu. B... and Google Scholar...X. S. 15(8). 41(3). P. R. and Societies.. Torres-Salinas.. Petrak.V. H Index Communication Journals according to Google Scholar Metrics (2009-2013). Haynes. R. J. Journal of medical internet research. (2011). Šember. (2007). (2010). (2010).Z. 227-239. Housewright. 6. 290-310. 7(2). Faculty Survey 2009: Key Strategic Insights for Libraries. Wusteman. EC3 Reports. Schroeder.. S. Wooliscroft. S.B. (2009). Putting Google Scholar to the Test: A Preliminary Study. Greco. (2007). H Index Communication Journals according to Google Scholar Metrics (2008-2012). Croatian Medical Journal. R. Measuring the impact of accounting journals using Google Scholar and the g-index. Delgado López-Cózar. JMLA. Delgado López-Cózar. Schmitz. 139-144. Schonfeld. 71-80.. Comparing test searches in PubMed and Google Scholar. M. Hamid R.. Bejaimal. Program: Electronic Library and Information Systems. Scopus. EC3 Reports. Roger C. A. 7. Aslib Proceedings. Dobrowolski.. D.A..M. Scopus or Google Scholar – Which is the best search engine for an effective literature research in laser medicine?... Medical Laser Application. 309-316. Mary L. 41(4).. E.. Rowlands. A. Journal of the Medical Library Association. J. M. 95(4). Repiso-Caballero. Ithaka S+R. Cobertura de las editoriales científicas del Book Citation Index en ciencias sociales y humanidades: ¿la historia se repite? Anuario ThinkEPI.. (2007). The Google generation: the information behaviour of the researcher of the future. Tober. M. Retrieving Clinical Evidence: A Comparison of PubMed and Google Scholar for Quick Clinical Searches..D.. Williams.... Sontrop. Tenopir. PubMed. Shariff. 60(4). G. 322-329. Garg. ... A. (2013). C. ScienceDirect. Publishers. Thirion. A. Utrobičić. 442-445. Delgado López-Cózar. Benchmarking Google Scholar with the New Zealand PBRF research assessment exercise. Scientometrics. Smith. S. The utility of Google Scholar when searching geographical literature: comparison with three commercial bibliographic databases. 26(3). Robinson. Weir.

Delgado-López-Cózar.. (2006). S. R. Using Google Scholar to Estimate the Impact of Journal Articles in Education. B.. R. Vine. (2012). Iakhiaev. (2008). (2007). M. L. A. 126-169.. Henderson. 97-99. 6(2). Allen.. Sitelines-Ideas about Web Searching. Van Eck. J.. J.H. Viney.. On the Shoulders of Giants: The Growing Impact of Older Articles. Kain. (2012). 74(2). Y. 971-1006. 7. Verstak. Suzuki. R. Journal of the American Society for Information Science and Technology. Belfiore. Waltman.. (7 noviembre. Walters. S.. D.. R. Google Scholar Pioneer on search engine’s future. 84(2). Wouters. L. S. W.. Google Scholar. Cabezas-Clavijo. Waltman.J.Bibliografía Torres-Salinas. The Metric Tide: Report of the Independent Review of the Role of Metrics in Research Assessment and Management. P. Torres-Salinas.. A new look at evidence of scholarly citation in citation indexes and from web sources.. Wang. 2014). Kerridge. Information Processing and Management. 265 . Online collaboration: Scientists and the social network. Delgado López-Cózar. 317-330. EC3 Working Papers. First approach using the ‘Book Citation Index’. Johnson. 2014)... Software survey: VOSviewer. Google Scholar Usage: An Academic Library’s Experience. E. 1121-1132. I. Comparative recall and precision of simple and expert searches in Google Scholar and eight other databases. S. (2010). Howard. 94-108. Tinkler. (13 agosto. Shaw. Robinson-García. 98(3). (2012).H. Google Scholar coverage of a multidisciplinary field. L. N. Scientometrics. Jones. Chiung. Thelwall. a computer program for bibliometric mapping. R. D. R. Campbell. Van Eck. The inconsistency of the h-index. 523-538.. book series and publisher types in the book citation index.. Journal of Web Librarianship... N. 11(4).. W. Emilio. Walters.J. 39(5). Portal: Libraries and the Academy. Van Noorden. E. Nature News.. Acharya. 63(2). El profesional de la información. 2113-2127. Journal Medical Library Association.. L. Vaughan. R. Vine. A.. 406-415. 18(5). Scientometrics. Lin. 501-510. Y. D. E. N. Nature. Curry. (2014). J. (2014)... Towards a ‘Book Publishers Citation Reports’. (2015).. Hill.. Educational Researcher.. H. 94(1).. 387-400. C. Scientometrics. M. UK: HEFCE.. A. N. Van Noorden.. N. Jiménez-Contreras. Van Aalst. Google Scholar como herramienta para la evaluación científica. P. Google Scholar is a full year late indexing PubMed content. Torres-Salinas.. Hill. (2009). (2005). (2010). Analyzing the citation characteristics of books: edited books. Shetty. J.. P. Robinson-García. D. (2011). 43. Wilsdon. 512(7513). Ruiz-Perez.

10(3/4). and Usability.C. Sadeghi. Citation Analysis: A Comparison of Google Scholar. Young. (2005). York. D. Calling the scholars home: Google Scholar as a tool for rediscovering the academic library. 20(1). 15471565. 1-15. 20(2).. 8015. Web. Zhang. Scientometrics. User-centered evaluation of a discovery layer system with google scholar. K. (2014). J. Zarifmahmoudi. (2012b). Mobile. and Google scholar h-indices of Iranian nuclear medicine scientists. . Citation analysis of Iranian journal of nuclear medicine: Comparison of SCOPUS and Google scholar. (2006). The Chronicle of Higher Education. L.. Comparison of ISI web of knowledge. More than 100 Colleges Work with Google to Speed Campus Users to Library Resources. En Design. R. SCOPUS. L. R. Maurice C. Internet reference services quarterly. Zarifmahmoudi.F. Meho. User Experience. 313-322. A30. 43(1). 50. (2005). J. Iranian Journal of Nuclear Medicine. The expansion of Google Scholar versus Web of Science: a longitudinal study. 1-4. A. Sadeghi. 118. 1-7. Yang.. T. and Product Design Lecture Notes in Computer Science.266 La revolución Google Scholar De Winter. and Web of Science. Dodou. (2013). Scopus. Iranian Journal of Nuclear Medicine. (2012a). L. 98(2). Proceedings of the American Society for Information Science and Technology..I.. Zadpoor.