segunda-feira, 1 de novembro de 2010

Técnica de busca rastreia ideias mais influentes

Cientistas da computação da Universidade de Princeton, nos Estados Unidos, desenvolveram uma nova maneira de rastrear as origens e a propagação de ideias.

Segundo eles, a técnica pode ajudar a avaliar a influência que será alcançada não apenas por artigos científicos, mas também por notícias que se tornam manchetes e alcançam grandes audiências, e até por comentários que "viralizam".

Metamorfose da linguagem

O método se baseia em algoritmos de computador que analisam como a linguagem se metamorfoseia ao longo do tempo dentro de um grupo de documentos - sejam eles trabalhos de pesquisa em física quântica ou posts em um blog sobre política.

O resultado dessa análise na transformação da linguagem é uma avaliação de quais textos foram os mais influentes.

"A questão é ser capaz de administrar a explosão de informações possibilitada pelos computadores e pela Internet", diz David Blei, explicando o elemento motivador da pesquisa.

"Estamos tentando entender como os conceitos são gerados e se modificam. Talvez você queira saber quem cunhou um certo termo, como 'quarks', ou pesquisar notícias antigas para descobrir onde foi o primeiro protesto contra a guerra nos anos 1960," exemplifica ele, citando "primeiros casos" que depois se espalharam pelo mundo.

Blei afirma que a técnica poderá futuramente ser utilizada por historiadores, cientistas políticos e outros estudiosos para estudar como as ideias surgem e se espalham.

Ideias influentes

Mecanismos de busca, como o Google e o Bing, são exemplos de técnicas de localizar informações de muito sucesso. Mas os critérios usados por eles não refletem a influência que um artigo inicial teve ou terá.

Os cientistas também se interessam muito pelo assunto, na tentativa de quantificar o impacto de um artigo científico. Normalmente isso é feito contando o número de vezes que outros pesquisadores citaram o artigo.

Mas o que fazer quando se quer saber a influência de um post em um blog, de uma notícia de um jornal ou mesmo de uma patente registrada por um inventor?

Blei e seu colega Sean Gerrish decidiram se voltar para o próprio documento, analisando como a linguagem muda ao longo do tempo: documentos que se tornam influentes em um campo vão estabelecer novos conceitos e novos termos que vão mudar os padrões de palavras e frases usadas nos trabalhos posteriores.

"Pode haver um artigo que introduza, por exemplo, o laser, que será mencionado em artigos subsequentes", explica Gerrish. "A premissa é que um artigo introduz a linguagem que será adotada e usada no futuro."

Encontrando documentos esquecidos

A primeira versão do programa é capaz de analisar cada artigo e sua influência ao longo de décadas em três publicações científicas: Nature, Pnas e Antologia da Associação para a Linguística Computacional.

As publicações científicas foram escolhidas porque isso permitiu comparar o resultado do novo programa com o método tradicional de medir o impacto acadêmico de um artigo, que possui técnicas reconhecidamente eficientes de avaliação.

Os pesquisadores afirmam que seus resultados coincidiram com a avaliação tradicional em cerca de 40 por cento do tempo.

Mais importante, porém, eles descobriram artigos que tiveram uma forte influência sobre a linguagem da ciência, mas que não foram muito citados. Em outros casos, eles descobriram que artigos que foram citados com frequência não tiveram muito impacto sobre a linguagem utilizada em seu campo.

Os pesquisadores afirmam que não pretendem que seu modelo seja um substituto para a contagem do número de citações, mas que ele representa um método alternativo para medir a influência de um artigo.

Com a vantagem de que a técnica pode ser estendida para encontrar notícias, sites e documentos legais e históricos influentes.

Nenhum comentário: