Está en la página 1de 86

4

Tipos de bases de datos


científicas
Elección de la fuente de
información

• Encontrar una BBDD que responda a


nuestras necesidades en función de lo
que queremos evaluar
• BBDD Nacional o Internacional
• BBDD Temática o multidisciplinar
• BBDD de producción, actividad científica o
para el análisis
Fuentes de información científica
Control bibliográfico:
Ulrich´s, Latindex, DICE…
• Producción • Impacto • Impacto • Colaboración • Actividad
– WoS (revistas) (autores) Cualquier • Esp@cenet
– SCOPUS – WoS BD
– JCR • WIPO
– G Scholar – SJR – SCOPUS
• NTIS
• BD Bibg. – Google
Especializadas: Scholar
• UMI
– R&N
– Psycinfo,
In-Recs/j
• Teseo
Econlit..
Scielo – R&N
• Regionales y In-Recs/j
nacionales
– CINDOC • Impacto
– Dialnet (Países)
- ESI

Bases de datos de entorno


INE: Indicadores de I+D, Eurostat
Algunas consideraciones sobre las fuentes

• No son estadísticamente representativas en el


sentido tradicional
• Muestran distribuciones sumamente sesgadas
• El acceso a los datos es barato, los datos están
muy desglosados y son muy fiables
• La obtención de los mismos es casi instantánea
• Podemos crear muchos indicadores y hacer
“experimentos”
Web of Knowledge (WOS, JCR,
ESI)
Web of Science (WOS)

• http://www.accesowok.fecyt.es/wos/
• BBDD de referencia en la ciencia mundial para
estudios bibliométricos
• Cubre las mejores revistas en todas las áreas
temáticas
• Indiza más de 10.000 revistas y 100.000 actas
de congresos (40 millones de registros)
• Consta de varios índices (SCI, SSCI, AHCI y
CPCI)
• Orientación anglosajona y a ciencias básicas
• 149 revistas españolas a fecha abril 2009
(Rodríguez-Yunta, L. Revistas españolas en WoS, 2009)
Búsqueda básica (13 campos de
consulta)
Cuidado con la búsqueda por
fechas

• Year published:
año de
publicación del
artículo
• Timespan: años
en que la
referencia ha
sido procesada
por WoS
Búsqueda de autores (author
finder)
Ejemplo: Emilio Delgado López-Cózar

2
• Selecciona la
forma adecuada
• Añade otra
3 posible firma del
autor

5
Refina por áreas o
instituciones
6 7

Resultados

8
O usa directamente la
búsqueda básica, pero…

• Cuidado con la sintaxis de WoS


• Cuidado con los autores con dos apellidos
• Cuidado con los homónimos
• Cuidado con nombre regionales,
abreviaturas o “nombres artísticos”
• Cuidado con los errores de indización
• Extremo cuidado al limitar por los campos
afiliación o categoría JCR
Cuidado con la sintaxis de
WoS

• No admite tildes ni eñes


• Sólo la(s) inicial(es) del nombre de pila
• Admite operadores booleanos en el
mismo cuadro de búsqueda
• Truncamiento con * para ampliar las
búsquedas
Cuidado con los autores con
dos apellidos
• El porcentaje de investigadores españoles que
aparecen bajo dos o más nombres diferentes
oscila entre un 20% y un 40% según los estudios
(Costas et al. 2006; Ruiz-Pérez et al. 2002).
• Los propios investigadores son responsables de
esta variabilidad en su forma de firma, ya que
utilizan distintas formas a lo largo de su
producción
• Además, las bases de datos bibliográficas
cometen con errores al transcribir la información
a su registro electrónico, sobre todo derivadas de
sus prácticas de indización adaptadas a las
estructuras de nombres ingleses
Cuidado con los homónimos

• Es complejo diferenciar entre autores


homónimos, apellidos comunes, etc (López
E, Rodriguez JM, Garcia A)
• En este caso hay que usar las opciones de
WoS para refinar los resultados, a sabiendas
de que podemos perder un pequeño
porcentaje de la producción del autor
• La mejor forma de evitar este fenómeno es
asesorar a los investigadores para que usen
firmas lo más distintivas posibles.
Cuidado con nombres regionales,
abreviaturas o nombres
“artísticos”
• Ramón Æ Moncho
• José Luis Æ Koldo
• Javier Æ Xavier
• Rosario Æ Charo
• Cuando hagamos búsquedas de autores es
conveniente visitar antes su web personal,
nos puede dar pistas sobre cómo firma, en
qué revistas publica, sus colaboradores, …
Cuidado con los errores de
indización de WoS

Autores

Instituciones
Extremo cuidado al limitar
por afiliación o categoría
jcr
AFILIACIÓN
• Autores en estancias fuera de la institución a
veces no firman con su institución de origen
• Autores con doble filiación a veces no usan ambas
• La tipología Proceedings paper incluye sólo la
institución del primer firmante
CATEGORÍA JCR
• Las revistas pueden estar asignadas hasta a 5
categorías ISI
• Autores con investigación multidisciplinar
Para el caso
Paradelas
las instituciones
instituciones

• Piensa todas las posibles


variantes de una institución
• WoS usa abreviaturas estándar y
elimina las preposiciones
• universidad = univ; hospital =
hosp
• Universidad de Murcia = Univ
Murcia
• Universidad Politécnica de
Valencia = ?
• Opciones de
• Historial de ordenación
búsquedas

• Opciones de análisis
de resultados e
informes de citación

• Opciones de
exportación,
• Opciones de filtrado de los resultados por impresión y
áreas, tipos de documentos, años, guardar en listas
instituciones, países, fuentes, autores, idiomas
Cited Reference Search

• Encuentra las citas a un artículo, libro, … (incluso


si no está recogido en WoS) pero ha sido citado
desde las revistas indizadas en WoS

• Ejemplo: citas recibidas por


los artículos publicados en
2007 en la revista NO ISI
Anales de Documentación
Cómo localizar las revistas
indexadas en la WoS
• Thomson cuenta con un listado maestro (master list)
donde aparecen las revistas recogidas en sus índices
de citas http://science.thomsonreuters.com/mjl/

¡Ojo! No confundir con JCR: No todas


las revistas incluidas en WoS tienen
factor de impacto JCR
Práctica

• ¿Qué producción tiene la Universidad de


Vigo en 2008?
– ¿Cuál es su promedio de citas?
– ¿Qué país es su principal colaborador?
• ¿Cuántas citas ha recibido Pedro Cavadas
en sus trabajos publicados en la revista J
PLAST RECONSTR AES ?
• ¿Qué revista tiene como ISSN 1532-2882?
– ¿En qué productos de Thomson está
recogida?
Journal Citation Reports
(JCR)
• http://www.accesowok.fecyt.es/jcr/
• Base de datos que recoge los factores de impacto
de las revistas científicas seleccionadas por
Thomson Reuters
• Podemos delimitar la búsqueda por año, categoría
temática y países
• Recoge otros indicadores como posición de la
revista en su categoría, índice de inmediatez,
porcentaje de autocitas,
Información básica de una
revista
Factor de impacto de la revista

Categorías JCR a las que se adscribe

Posición de la revista
en dichas categorías
Descarga de JCR

• Si queremos recopilar sistemáticamente


todos los indicadores JCR; FECYT ofrece
los listados de impactos en formato excel
desde 2002
http://www.accesowok.fecyt.es/news/2007/
20070709.html
Essential Science Indicators
(ESI)
• http://www.accesowok.fecyt.es/esi/
• Indicadores a nivel macro de producción y citación
• Nos proporciona un marco comparativo; podemos
confrontar los registros de un investigador o
institución con áreas / países, etc
Evolución anual Ránking de paises para la categoría
Papers más citados
Scopus
• http://www.scopus.com/
• Base de datos multidisciplinar de Elsevier
• Competencia directa de WoS
• Casi 18.000 titulos diferentes
• 38 millones de registros
• 16500 revistas revisadas
• Fuente: Scopus in detail

Sin embargo,…

• No es tan selectiva como WoS


• Prima la cantidad de fuentes sobre la
“calidad” de las mismas
Búsqueda básica (18 campos)
Búsqueda por institución
Ejemplo 1: Universidad de Murcia
Basic Search

Affiliation Search
Búsqueda por institución

Ejemplo 2: AIDICO

Basic Search

Affiliation Search
Cuidado en las búsquedas por
autor
Ejemplo: Emilio Delgado López-Cózar

Affiliation Search
Cuidado en las búsquedas por
autor

• Problemas de normalización de autores e


instituciones solventadas en gran parte con “author
search” y “affiliation search”
• Guiones y tildes en la búsqueda afecta a los
resultados
• Autores pueden estar indizados por el segundo
apellido
• Errores ortográficos, fallos OCR,… Æ
Administradores y gestores documentales
deberían ocuparse de la correcta indización de sus
autores en las bases de datos internacionales
Resultados

• Refinar búsquedas (limitar /excluir)


• Añadir categorías de filtrado
• Ordenar resultados según criterios ascendente /
descendente
• Análisis de citas
• Exportar resultados
Tutoriales interactivos
• http://help.scopus.com/flare/Content/tutoria
ls/sc_menu.html

• Master List en
http://info.scopus.com/
detail/what/documents/
title_list.xls
Google Scholar

• Subproducto de Google especializado en


buscar e identificar material bibliográfico
publicado de carácter científico-académico

• ¿Qué encuentra?
– Referencias bibliográficas con resúmenes
– Textos completos
– Citas

http://scholar.google.es/
Diapositiva 39

em1 emilio delgado; 22/08/2008


Búsquedas simple y avanzada

Simple

Avanzada Æ muy pocas opciones de


búsqueda por campos
Tipos de resultados
1. Resultado que nos dirige al documento original a texto completo

2. Resultado que nos devuelve una cita

3. Resultado que nos dirige a una fuente secundaria donde se recoge el documento
Estructura de un registro en
GS

• Breve descripción bibliográfica del documento (título, autores,


revista/fuente, año).
• (1) Tipo de documento, formato (pdf, html) o el tipo documental (libro,
cita)
• (2) Flecha verde indica que GS da acceso al texto completo
• (3) Web fuente de la información (servidor, repositorio, etc.)
• (4) “citado por”, muestra el listado de documentos recopilados por GS
que citan el trabajo
• (5) Versiones que ha localizado de un mismo trabajo (preprints, etc).
La versión del editor, si se indexa, es la versión principal.
• Otras opciones: exportar el registro a un software de gestión
bibliográfica (6) localizar el documento en una biblioteca (7)
Versiones del mismo documento

• Identifica y muestra todas las


posibles versiones de un documento
que figuren en sus índices

• El rastreador de GS identifica todas


las localizaciones en distintas URLs
a las que puede acceder
Diapositiva 43

em2 emilio delgado; 22/08/2008


Versiones del mismo documento
Una comparativa
Lokman I Meho and Kiduk Yang
Impact of Data Sources on Citation Counts and Rankings of LIS Faculty: Web of
Science vs. Scopus and Google Scholar. JASIST 2004
• Esfuerzo en tratamiento (en horas)
– WoS 100
– SCOPUS 200
– GS 3000
• Recuperación/cobertura n=5285
– (WoS+SCOPUS) 2733
• 2023 WoS,
• 2301 SCOPUS
• 2552 GS
• Errores
– 0,5% WoS,
– 4,4% SCOPUS
– 12% GS

• Otros datos (Jacsò P, 2008)


– 42 mill WoS
– 38 mill SCOPUS
Cobertura de Google Scholar
– Libros
– Artículos de revistas científicas
– Comunicaciones y ponencias a congresos
– Informes científico-técnicos
– Tesis, tesinas o memorias de grado
– Trabajos científicos depositados en repositorios, archivos
de preprints
– Páginas web personales o institucionales etc…
– Cualquier publicación con resumen
• No cubre
– Reseñas de libros y editoriales
– Libros de texto y monografías
– Periódicos y revistas comerciales
Diapositiva 46

em3 emilio delgado; 22/08/2008


Comparativa GS vs WoS/Scopus
Índices de citas multidisciplinares
Google Scholar
(Web of Science; Scopus)

COBERTURA DE REVISTAS CIENTÍFICAS

• No existe ningún tipo de control


• Rigurosos proceso de selección de
en los procesos de selección de las
▼ ▲ las revistas científicas, especialmente
revistas que indiza por la que todo
en la Web of Science
tipo de revistas tienen cabida

• Mala cobertura de las revistas de


• Tradicional mala cobertura de
Humanidades y Ciencias Sociales
revistas de Humanidades y Ciencias
presentes en otras bases de datos
▼ ▼ Sociales. Política de expansión en la
(MLA Bibliography, Philosopher’s
actualidad en estos ámbitos del
Index, PsycInfo, Sociological
conocimiento.
Abstracts, …)
Índices de citas multidisciplinares
Google Scholar
(Web of Science; Scopus)
PRECIO
▲ • Libre Acceso ▼ • Pago de licencias

COBERTURA GENERAL

• Falta de trasparencia en la cobertura. No se • Transparencia absoluta en las fuentes que


▼ declaran acuerdos con editoriales ni de las fuentes ▲ componen las bases de datos. Disponibilidad de
que se indizan Master List actualizados
• Cobertura de una amplia tipología de fuentes de
información: repositorios, bases de datos, catálogos
on-line de bibliotecas, web personales e

institucionales (universidades, institutos de
investigación, sociedades científicas, empresas…),
productos de Google (Google Patents y Google Books)
• Posibilidad de encontrar documentos muy diversos: • Solo cubren los contenidos de revistas científicas
▲ pre-prints, artículos revistas, libros, tesis, informes, ▼ y recientemente libros de actas de congresos
comunicaciones a congresos… (WoS: Conference Proceedings Citation Index)
• Cobertura de documentos que podrían no ser de
• Contenidos exclusivamente científicos y
▼ carácter académico: programas de asignaturas, guías ▲
mayoritariamente sometidos a revisión
de biblioteca, temarios, etc...
• Dominio de la literatura de carácter anglosajón.
▲ • Mayor cobertura de literatura en lenguas nacionales ▼
Especialmente en WoS
• Acceso directo a publicaciones científicas a texto
▲ ▼ • Acceso solo a la referencia de los artículos
completo y gratuitas
• Acceso directo al documento si la biblioteca lo tiene • Acceso directo al documento si la biblioteca lo
▲ ▲
contratado tiene contratado
• Localiza citas emitidas por los documentos no
cubiertos por otras bases de datos, especialmente
desde preprints, congresos o tesis doctorales. Esta
▲ ▼ • Solo localiza citas de revistas y congresos
característica lo hace especialmente útil para las
siguientes disciplinas: Humanidades, Ciencias
Sociales e Ingenierías
INTERFAZ, BÚSQUEDAS y RESULTADOS
• Solo ofrece tres campos de búsqueda (Autor, • Posibilidad de buscar en 12 campos diferentes en
▼ ▲
Revista y Año de Publicación) WoS y 17 en Scopus
• No tiene ninguna herramienta para analizar • Herramientas de análisis bibliométricos on-line
▼ ▲
resultados como Citation Report en WoS
• Los resultados se presentan directamente • Permiten ordenar los resultados según diferentes
▼ ordenados por número de citas y no existen ▲ opciones (Título, Nº de citas, fecha de publicación,
otras opciones primer autor,…)
• Solo permite exportar los resultados, uno a • Exportación de los resultados en diferentes
▼ ▲
uno, a un software bibliográfico. formatos (RIS, txt, tabulados, etc…)
• Gran coste en el procesamiento de los datos
• Costes de procesamiento de la información con
▼ lo que hace difícil su uso en estudios de gran ▲
menores costes en horas.
escala.

• Presenta gran variedad de resultados



duplicados

• Posibilidad de exportar los resultados a software


• Posibilidad de exportar los resultados a
▲ ▲ de análisis de datos: Histcite, Refviz, NWB,
software de análisis de datos: Publish or Perish
BibExcel
• Solo se muestran los 1000 documentos en • Se puede consultar todos los resultados que una
▼ ▲
cada consulta consulta genera
• Localiza las diferentes versiones de un
▲ documento y las agrupa bajo un mismo
encabezamiento de título
• Cada registro está clasificado en una tipología
• No identifica ante que tipología documental
▼ ▲ documental (artículo, revisión, carta, nota,
nos encontramos. Tan solo los libros
recensión, etc….)
• Incluyen diversas opciones de filtrado (disciplina,
▼ • Solo incluye el filtrado por 7 disciplinas ▲ año, tipo documental) que nos permiten refinar las
búsquedas
CONTROL DE LA INFORMACIÓN
• No existe normalización pero tienen
• No existe normalización de los
▼ ▲ herramientas para identificación de
autores
autores (WoS=Author Finder)
• Ausencia de cualquier tipo
vocabulario controlado. No existe
• Control absoluto de las revistas
▼ control de las revistas científicas, ▲
científicas
éstas pueden aparecer indizadas de
diferente forma
En conclusión

•Es adecuado para localizar información


concreta (análisis a nivel micro)…
Podemos encontrar

• el texto completo de un trabajo en acceso


abierto
• las citas recibidas por un trabajo
• los trabajos producidos por un autor
• trabajos sobre un tema
Diapositiva 51

em6 emilio delgado; 22/08/2008


Pero no es adecuado para
realizar análisis
bibliométricos
• Los datos de GS no tienen ninguna normalización,
consecuencia de la amplia cobertura, la variedad de
fuentes de información y el procesamiento
automático de la información
• Para la elaboración de un mismo ranking
bibliométrico el procesamiento de los datos con
WoS lleva 10 horas, con Scopus 20 y con GS 300
• El programa Publish or Perish
http://www.harzing.com/pop.htm facilita el análisis
bibliométrico de resultados de GS, pero es costoso
en cuanto al tratamiento de los datos
Eigenfactor y SJR

• Indicadores alternativos al FI
• Productos gratuitos y de libre acceso
• Usan algoritmos que valoran la importancia
de la revista citante (al modo del PageRank
de Google)
• http://www.eigenfactor.org/
• http://www.scimagojr.com/
• Diferentes fuentes para su cálculo:
Eigenfactor usa WoS; Scimago usa Scopus
IN-RECS e IN-RECJ

http://ec3.ugr.es/in-recs/

http://ec3.ugr.es/in-recj/
¿Qué es y por qué es
necesario?
• Índice Bibliométrico de Revistas Científicas Españolas de
Ciencias Sociales (IN-RECS) y de Ciencias Jurídicas (IN-
RECJ)
• Propósito: medir impacto y proporcionar perfiles
bibliométricos de Revistas, Artículos, Autores e Instituciones
• Instrumento útil para medir impacto de la ciencia producida
y publicada en España
• Paliar lagunas de la WOS (sólo 33 revistas españolas en
CCSS y 2 en CCJJ)
• Valorar los hábitos de publicación y citación de los
científicos españoles de CCSS y CCJJ
• Proporcionar una herramienta útil a las Agencias
Evaluadoras: CNEAI, ANECA, Autonómicas
• Reconocer la idiosincrasia y el carácter regional, nacional o
local de la investigación en CCSS y CCJJ
Algunas consideraciones
• Pretende obtener el respaldo de la comunidad
científica española
• Alcanzar la máxima representatividad de las distintas
especialidades en las que se vertebran las disciplinas
científicas de las Ciencias Sociales
• Exigencia de que las revistas fuente posean una
acreditada calidad editorial
• Apliquen un sistema riguroso de selección de originales
• Cuenten con reputados comités editoriales
• Primar la selección sobre la exhaustividad
• La ciencia es selectiva por naturaleza (Ley Bradford)
• Razones económicas
Algunas cifras
Detalle Categoría y Autores
más citados
Visibilidad de la Ciencia de America
Latina

• En los años recientes, la multiplicación de


revistas científicas editadas en Iberoamérica
podría llevar a afirmar que la región destaca por
su fortalecimiento en la comunicación entre
académicos. Y si bien ello es cierto, también es
preciso reconocer que salvo algunas
excepciones, su impacto en la producción global
del conocimiento continúa siendo limitado al
ámbito local .
• Crece la producción pero disminuye el impacto.
El catálogo LATINDEX
Sistema Regional de Información
en Línea para Revistas Científicas
de América Latina, el Caribe
España y Portugal

OJO tiene dos productos


!
!
- DIRECTORIO: 16,963 revistas. Información básica
normalizada
- CATÁLOGO: 3,381 revistas. Selección de revistas
clasificadas según el cumplimiento de unos criterios de calidad
Metodología de evaluación
Metodología de Latindex basada en el cumplimiento de 33
criterios repartidos en 4 bloques
● CARACTERÍSTICAS BÁSICAS: mención de
cuerpo editorial, antigüedad, mención del director,
lugar de edición, entidad editora, etc..
● PRESENTACIÓN: páginas de presentación, tabla
de contenidos, miembros del consejo editorial,
afiliación de los autores, etc..
● GESTIÓN Y POLÍTICA EDITORIAL: sistema de
arbitraje, evaluadores externos, autores externos,
apertura editorial, cumple la periodicidad, etc..
● CARACTERÍSTICAS DE LOS CONTENIDOS:
contenido original, resumen, palabras clave,
intrucciones autores, etc…
www. redalyc.org
‰ Dar visibilidad a la producción científica de calidad
‰ Mostrar que la ciencia periférica existe y es de calidad
‰ Posicionar la producción científica iberoamericana
‰ Fortalecer los procesos editoriales
‰ Investigar las características, tendencias, etc.
‰ Fortalecer el español y portugués como vía de
comunicación
‰ Construir indicadores biliométricos regionales
Redalyc características
generales
• La Red de Revistas Científicas de América Latina y el Caribe,
España y Portugal Redalyc es un proyecto impulsado por la
Universidad Autónoma de Estado de México (UAEM), con el
objetivo de contribuir a la difusión de la actividad científica editorial
que se produce en y sobre Iberoamérica.
• Fue abierto formalmente al público en el mes de octubre del año
2002
• La visibilidad se alcanza al poner a disposición, desde Internet y de
libre acceso, los textos completos de los artículos y materiales
publicados en las revistas
• Emplea la metodología LATINDEX para la valoración y posterior
integración de las publicaciones
• Redalyc implementa el protocolo OAI-PMH, Open Archives Initiative
– Protocol for Metadata Harvesting
Evolución REDALYC
REDALYC: PARTICIPACIÓN POR PAÍSES
Búsqueda temáticas
VISIBILIDAD junio 09

Páginas vistas
11.5 millones
Usuarios únicos
1.8 millones
Artículos
descargados
3.9 millones
Redes de colaboración
entre países
Redes institucionales
Redes institucionales
Redes de colaboración entre
autores

También podría gustarte