Documentos de Académico
Documentos de Profesional
Documentos de Cultura
memria cientfica
BIBLIOMTRICOS1
A
avaliao da produo cientfica um de bases de dados e indicadores. As bases de
processo fundamental para garantir o dados tambm do suporte para a desejada
investimento financeiro em pesquisa visibilidade da produo cientfica nacional, a
e a participao da Cincia na consecuo dos partir de resultados de pesquisa, pesquisadores
objetivos econmicos, sociais e polticos do pas e instituies. Entre os exemplos de amplo
(VELHO, 1986). Quanto mais ativo e produtivo o reconhecimento est a SCIELO, a Plataforma
ambiente cientfico, mais freqentes e rigorosas so Lattes, o Diretrio dos Grupos de Pesquisa e
as rotinas de avaliao vigentes. Estes processos a Base de Patentes produzida pelo Instituto
avaliativos se fundamentam, principalmente, em Nacional de Propriedade Industrial (INPI).
duas metodologias: a avaliao qualitativa, feita Alm da criao das bases de dados para coleta
pelos pares, fortemente ancorada na reputao e organizao de dados relativos C&T, diversos
adquirida pelo avaliado; e a que se deriva de pesquisadores e instituies tm trabalhado
critrios quantitativos, baseados em mtodos na prospeco de indicadores de input e output
bibliomtricos e cientomtricos. da Cincia nacional, como a produtividade de
As tcnicas quantitativas de medio da instituies e reas do conhecimento, fator de
produo cientfica tm algumas dcadas de impacto dos peridicos, colaborao cientfica e
existncia, mas no esto, ainda, completamente investimentos em pesquisa.
consolidadas (SPINAK, 1998; SANCHO, Nas naes mais produtivas da Europa e
1990). Sua utilizao est em franca expanso nos EUA, a avaliao da produo cientfica uma
em diversos pases, e a preocupao em prtica comum adotada por agncias de fomento,
acompanhar a tendncia mundial de avaliao ministrios e organismos ligados s polticas de
C&T. Tal avaliao tem-se revelado essencial
1 Estudo desenvolvido para realizao da tese de doutorado defendida no para a construo de indicadores e posterior
PPGCOM/UFRGS com auxlio da Coordenao de Aperfeioamento de distribuio de investimentos, desenvolvimento
Pessoal de Nvel Superior (CAPES).
Inf. & Soc.:Est., Joo Pessoa, v.20, n.2, p. 67-75, maio/ago. 2010 67
Samile Andra de Souza Vanz; Ida Regina Chitt Stumpf
68 Inf. & Soc.:Est., Joo Pessoa, v.20, n.2, p. 67-75, maio/ago. 2010
Procedimentos e ferramentas aplicados aos estudos bibliomtricos
do Rio Grande do Sul est descrita no ISI por Conhecimento utilizadas pelo Conselho Nacional
inmeras formas (AUTOR, 2009), como PUCRS, de Desenvolvimento Cientfico e Tecnolgico
PUC RS, Rio Grande Sul Pontificial Catholic (CNPq) e CAPES, a saber: Cincias exatas e da
Univ, Pont Univ Cat Rio Grande do Sul, Pont terra; Cincias Biolgicas; Engenharias; Cincias
Univ Catlica Porto Alegre, Pontifical Catholic da Sade; Cincias agrrias; Cincias sociais
Univ Rio Grande Sul, Pontifical University aplicadas; Cincias humanas; Lingstica, letras e
Catholic Rio Grande do Sul, entre outras. Estas artes; Outros.
diferentes grafias alteram o resultado de rankings Quanto atribuio de valores para a
de produtividade, estudos de co-ocorrncia, como quantificao da produo cientfica, os estudos
co-autoria entre pesquisadores e instituies, e bibliomtricos vem atribuindo o valor de um
como co-citao. artigo/citao para cada autor, instituio e
A constatao destas inconsistncias torna pas envolvido no artigo. Desta maneira, os
necessria a padronizao/limpeza de nomes de totais de ocorrncia de autores, instituies,
autores, instituies de filiao, ttulos das obras, pases e citaes no refletem o total de artigos
entre outros dados, procedimento que precisa publicados, mas o somatrio de ocorrncias.
ser realizado imediatamente aps o download Esta estratgia vem sendo utilizada por diversos
dos arquivos. Apesar de geralmente demandar autores (LUUKKONEN; PERSSON; SIVERTSEN,
o maior tempo da pesquisa bibliomtrica, o 1992; PACKER; MENEGHINI, 2006; LIMA;
procedimento vem sendo aplicado por diversos VELHO; FARIA, 2007; VILAN FILHO; SOUZA;
pesquisadores para garantir maior fidedignidade MUELLER, 2008). A metodologia oposta,
dos dados (MUGNAINI; JANNUZZI; chamada de fracionamento, atribui meio artigo
QUONIAM, 2004; LETA; GLNZEL; THIJS, para cada autor no caso de um artigo publicado
2006; HOU; KRETSCHMER; LIU, 2008). Alguns por dois autores, um tero de artigo no caso de
autores, entretanto, tm dispensado o processo de trs autores, e assim sucessivamente.
limpeza/padronizao de nomes de autores por
considerar que o erro ocasionado pela homonmia
percentualmente muito baixo e no altera 3 FERRAMENTAS PARA ANLISE
significativamente o resultado final (NEWMAN, BIBLIOMTRICA: SOFTWARES E
2001a; WAGNER; LEYDESDORFF, 2005). NDICES RELATIVOS
Outro procedimento que pode ser
realizado a organizao da produo cientfica Os dados bibliogrficos importados
em grandes reas de publicao, de forma a evitar das bases de dados podem ser organizados
a sobreposio de assuntos e permitir a avaliao e analisados atravs de diferentes softwares
e comparao entre diferentes sries de dados. para anlise bibliomtrica, como o conjunto de
Uma das propostas para evitar a sobreposio aplicativos desenvolvido por Loet Leydesdorff4 e
o esquema de classificao de reas do o Bibexcel5, desenvolvido por Olle Person. Ambos
conhecimento definido por Glnzel e Schubert so livres e disponibilizam ferramentas para
(2003), que relaciona as reas de publicao do anlise descritiva de produtividade e citaes,
ISI em 15 grandes reas do conhecimento, a entre outras, alm de anlise de co-autoria6,
saber: Agricultura e meio ambiente; Biologia; co-citao7, co-words8, anlises multivariadas e
Biocincias; Pesquisa biomdica; Medicina anlises de redes.
clnica e experimental I; Medicina clnica e O Bibexcel apresenta-se como um
experimental II; Neurocincia e comportamento; software flexvel para o usurio, bastando,
Qumica; Fsica; Geocincias e cincias espaciais;
Engenharias; Matemtica; Cincias sociais I; 4 Disponvel em http://users.fmg.uva.nl/lleydesdorff/software.htm
Cincias sociais II; Artes e humanidades. O 5 Disponvel em http://www.umu.se/inforsk/Bibexcel
esquema vem sendo usado com sucesso por 6 A anlise de co-autoria baseia-se nos nomes dos autores de um artigo
cientfico. considerada uma das formas de se medir a colaborao cientfica
alguns pesquisadores em anlises bibliomtricas e pode se referir a pesquisadores, instituies e pases, estes dois ltimos
(GLNZEL; LETA; THIJS, 2006; MOURA, 2009; atravs da vinculao institucional dos autores.
7 Co-citao define-se como a anlise que estuda as relaes e freqncias de
AUTOR, 2009). Outra possibilidade adequar pares de documentos que so citados por um terceiro documento. Pode ser
as categorias de assunto do ISI presentes relativa a documentos, autores e peridicos.
8 Co-words define-se como a anlise que estuda as relaes e freqncias de
no campo SC s Tabelas das reas do pares de palavras presentes em ttulos e abstracts de documentos.
Inf. & Soc.:Est., Joo Pessoa, v.20, n.2, p. 67-75, maio/ago. 2010 69
Samile Andra de Souza Vanz; Ida Regina Chitt Stumpf
para isso, entender a estrutura bsica dos relativos e normalizados pode revelar aspectos
arquivos e os procedimentos e comandos para subjacentes at ento invisveis nos dados
as anlises. Entre as suas funcionalidades est brutos. Na anlise de co-autoria, por exemplo,
a organizao de dados em arquivos de texto os nmeros absolutos indicam o total de artigos
ou planilha, o que possibilita ao pesquisador a em co-autoria sem considerar o tamanho dos
utilizao de outros softwares para as anlises autores envolvidos na colaborao medido
e tambm a importao de diferentes tipos de pelo total de artigos publicados. Para estimar
dados, alm dos bibliogrficos importados da propenses ou intensidade de co-autoria, faz-
Web of Science ou Scopus. A familiaridade com se necessrio recorrer a indicadores relativos
registros bibliogrficos fundamental, pois que levem em considerao o tamanho da
o Bibexcel funciona com base nos registros e produo cientfica de um autor, instituio ou
delimitadores de campos. Assim, para iniciar a pas. Luukkonen e outros (1993), ao avaliarem
anlise bibliomtrica necessrio informar qual a colaborao cientfica internacional, afirmam
o campo a ser analisado e qual o delimitador que o total de artigos publicados em co-autoria
usado naquele campo. Para analisar autores, entre dois pases deve ser analisado em relao
por exemplo, necessrio informar ao Bibexcel ao total da produo cientfica de cada um dos
a sigla AU na janela Old Tag e tambm que pases. No caso de um pas ser muito produtivo
o campo de autor delimitado por ponto e e outro pouco produtivo, a colaborao entre os
vrgula, ou seja, todas as expresses presentes dois pode no ser muito significativa quando
entre ponto e vrgula representam nomes de comparada produo total do pas produtivo,
autores. Se o interesse do pesquisador recair e ao contrrio, ser bem significativa se
na anlise de citaes, o campo informado o comparada ao total publicado pelo pas menor.
CD, o qual tambm delimitado por ponto e Analogamente, a anlise de colaborao entre
vrgula. instituies deve seguir o mesmo procedimento,
Outra funcionalidade do Bibexcel a visto que elas tambm se diferenciam quanto
gerao de rankings de produtividade e citao. ao tamanho e produtividade. Nesse sentido,
As anlises descritivas podem ser realizadas Luukkonen e outros afirmam:
com o auxlio do Excel e sua ferramenta de
Tabela Dinmica. O Bibexcel oferece ainda a [...] na anlise de relaes de
possibilidade de criao das matrizes de co- colaborao, essencial usar ambas
ocorrncia que posteriormente, servem de input as medidas absolutas e relativas. A
em anlises multivariadas como o Escalonamento ltima normaliza diferenas de tamanho
dos pases. Cada uma carrega tipos
Multidimensional (EMD), Anlise Fatorial,
diferentes de informao. Medidas
Anlise de Correspondncia e Anlise de absolutas carregam respostas a questes
Agrupamentos (Clusters) (PERSSON, DANELL; como quais so os pases centrais na
SCHNEIDER, 2009). Algumas destas podem rede internacional da cincia, se relaes
ser realizadas pelo prprio software. Como de colaborao revelam um centro
relaes perifricas, e que pases so os
opo, as matrizes podem ser analisadas com
parceiros mais importantes de outros.
auxlio de outros softwares, como o Statistics Medidas relativas oferecem respostas
Packet for Social Science (SPSS) ou o Microsoft a questes de intensidade das relaes
Excel. As mesmas matrizes tambm podem ser de colaborao ( LUUKKONEN, 1993,
visualizadas a partir de softwares para Anlise p.15, traduo nossa)
de Redes Sociais, como o Pajek9 e Ucinet10.
As matrizes de co-ocorrncia geradas pelo Com o objetivo de possibilitar diferentes
Bibexcel so baseadas nos totais de ocorrncia interpretaes, Luukkonen, Persson e Sivertsen
de um indicador. O uso destes indicadores (1992) propuseram uma frmula que calcula a
absolutos (totais de ocorrncia) amplamente freqncia esperada, a partir de uma distribuio
aceito como ferramenta til na mensurao do aleatria dos valores da diagonal da matriz
desempenho cientfico. Entretanto, a anlise entre todas as clulas. A freqncia esperada
bibliomtrica baseada no uso de indicadores relacionada freqncia observada, conforme a
frmula abaixo, desenvolvida no contexto de co-
9 Disponvel em http://www.vlado.fmf.uni-lj.si/pub/networks/pajek/
10 Disponvel em http://www.analytictech.com/downloaduc6.htm autoria entre pases:
70 Inf. & Soc.:Est., Joo Pessoa, v.20, n.2, p. 67-75, maio/ago. 2010
Procedimentos e ferramentas aplicados aos estudos bibliomtricos
Inf. & Soc.:Est., Joo Pessoa, v.20, n.2, p. 67-75, maio/ago. 2010 71
Samile Andra de Souza Vanz; Ida Regina Chitt Stumpf
anlise de co-citaes, co-words, co-autoria, co- podem continuar preferindo aplicar a medida
membership, co-classification e co-participation, de similaridade matriz de co-ocorrncia, com
A metodologia desenvolvida inclui a o objetivo de comparar padres de co-autoria ao
gerao de uma matriz de similaridade a partir da invs de comparar a contagem de artigos em co-
matriz de dados brutos, com base em diferentes autoria. Schneider e Borlund (2007) consideram
medidas. A questo de qual medida usar tem sido no existir nenhum problema estatstico na
discutida h algum tempo e encontra respostas prtica de aplicar medida de similaridade s
diversificadas na literatura. Segundo Luukkonen matrizes de co-ocorrncia.
e outros (1993), a resposta depende do aspecto Posteriormente, no mesmo peridico,
que se quer avaliar. Os autores explicam que h Waltman e Eck (2007) tambm se pronunciaram,
dois tipos de medidas de associao: as medidas afirmando que as anlises multivariadas podem
de similaridade bilaterais e as multilaterais. A ser feitas em matrizes simtricas convertidas
primeira deve ser usada se o objetivo comparar por diversas medidas de proximidade, sendo
relaes entre pares de pases e instituies sugesto dos autores a Jansen-Shannon, a
separadamente, e, entre elas, esto a medida de Bhattacharyya e o Cosseno. Os autores atribuem
Salton e Jaccard. As medidas multilaterais, como ao SPSS um defeito de programao, que teria
a freqncia esperada e Correlao de Person, levado Leydesdorff e Vaughan (2006) a concluir
relaciona a co-autoria entre um par de autores que o mapa distorcido era conseqncia da
com todos os outros autores envolvidos na converso da matriz de dados brutos para uma
anlise. matriz de similaridades. Waltman e Eck (2007)
Na opinio de Ahlgren, Jarneving e avaliam que o problema pode ser contornado, e o
Rousseau (2003), a medida de similaridade mapa adequado gerado a partir de uma rotina
denominada Cosseno de Salton a mais indicada que utiliza o modelo Spline para anlise EMD (na
quando o objetivo do pesquisador concentra- verso 14.0 ou inferior do SPSS).
se na visualizao da estrutura, seja atravs Dando continuidade discusso no
de Anlise de Redes Sociais ou EMD, visto JASIST, Leydesdorff (2008, p. 79, traduo
que uma medida definida geometricamente. nossa) afirma que: Em princpio, pode-se
J White (2003) defende o uso da Correlao normalizar tanto matrizes simtricas quanto
de Pearson com o argumento de que as assimtricas atravs de vrias medidas.
diferenas entre o uso de diferentes medidas Formalmente, Person e Cosseno so
de similaridade podem ser negligenciadas na equivalentes, com exceo de que Pearson
prtica de pesquisa. O autor testa as medidas de normaliza atravs da mdia aritmtica,
Correlao de Person, Cosseno de Salton e Chi- enquanto o Cosseno utiliza como parmetro
Quadrado e afirma que as trs medidas podem a mdia geomtrica. Ou seja, o Cosseno mede
revelar uma resposta muito parecida. Bensman a similaridade entre dois vetores usando
(2004) tambm se apresenta favorvel ao uso o ngulo entre eles. Eck e Waltman (2008)
da Correlao de Person para normalizao concluem que a Correlao de Pearson no
quando o objetivo so as anlises estatsticas apresenta resultados satisfatrios quando
multivariadas. usada para medir a similaridade entre padres
Leydesdorff e Vaughan (2006) de co-citao de autores porque uma medida
argumentam que matrizes de co-autoria so apropriada para medir a correlao linear
matrizes de proximidade do tipo similaridade entre duas variveis. O Cosseno e, tambm, a
que no requerem normalizao antes de medida de divergncia Jensen-Shannon e a de
anlises EMD. Para fazer a normalizao, os Distncia de Bhattacharyya, so as medidas
autores afirmaram ser mais adequado usar mais adequadas na opinio dos autores. Alm
a matriz assimtrica (matriz de ocorrncia), disso, Eck e Waltman (2008), contrariando
subjacente a matriz de co-ocorrncia, como opinies anteriores, defendem que a escolha
base para anlise multivariada. Entretanto, de uma medida de similaridade apropriada
Leydesdorff e Vaughan (2006) divulgam a tem relevncia prtica e no s terica, visto
opinio de um dos avaliadores do peridico que os resultados encontrados divergem,
em que o artigo foi publicado, cuja sugesto especialmente quando mapeados atravs de
que, por razes tericas, os pesquisadores tcnicas EMD. Egghe e Leydesdorff (2009) do
72 Inf. & Soc.:Est., Joo Pessoa, v.20, n.2, p. 67-75, maio/ago. 2010
Procedimentos e ferramentas aplicados aos estudos bibliomtricos
Abstract Discusses the process of scientific prodution evaluation and the necessary development of
indicators for this purpose. Presents sources for data collection for development of scientific
production indicators and presents the procedures for cleaning/standardization and organization
of bibliometric data. Describes free softwares for bibliometric analysis and the importance of using
relative indicators. Discusses some procedures adopted by the international scientific community
for multivariate analysis of bibliometric data.
Inf. & Soc.:Est., Joo Pessoa, v.20, n.2, p. 67-75, maio/ago. 2010 73
Samile Andra de Souza Vanz; Ida Regina Chitt Stumpf
74 Inf. & Soc.:Est., Joo Pessoa, v.20, n.2, p. 67-75, maio/ago. 2010
Procedimentos e ferramentas aplicados aos estudos bibliomtricos
Inf. & Soc.:Est., Joo Pessoa, v.20, n.2, p. 67-75, maio/ago. 2010 75