RSS
 

Novo método que rastreia idéias e mede impacto

23 Oct

O Departamento de Computação  de Princeton é famPesquisadores de Princetonoso por ter tido em seus quadros 3 grandes pioneiros da computação: Alan Turing, Alonzo Church e John von Neumann , agora pesquisadores do departamento desenvolveram uma nova maneira de rastrear as origens e a propagação de idéias, uma técnica que tornará mais fácil avaliar a influência de notáveis trabalhos acadêmicos, notícias que geram trabalhos e outras fontes de informação.

O trabalho tem por objetivo verificar como os conceitos “caminham” e se modificam pela Web, ou seja uma trilha de idéias na Web, tendo a frente os pesquisadores David Blei ae Sean Garrish.

O método se baseia em algoritmos de computador que analisam como a linguagem se transforma ao longo do tempo dentro de um grupo de documentos,- sejam eles trabalhos de pesquisa em física quântica ou um blog sobre política e determinam quais documentos foram os mais influentes.

Blei disse que a pesquisa nesta nova técnica poderá um dia ser utilizada por historiadores, cientistas políticos e outros estudiosos para estudar como as idéias

“A questão é ser capaz de administrar a explosão da informação possibilitada pelos computadores e pela Internet”, disse David Blei, professor assistente de Ciência da Computação em Princeton e acrescentou “Estamos tentando buscar os sentidos de como os conceitos se movem. Talvez você queira saber quem cunhou um termo certo como ‘quarks’, ou histórias antigas de pesquisa em notícias para descobrir onde foi primeiro protesto contra a guerra dos anos 1960.”, eles afirmam que o método deles fará isto.

Enquanto os motores de busca como o Google eo Bing ajudam classificar as pessoas no meio de um palheiro de informações na Web, seus resultados são baseados em uma mistura complexa de critérios, alguns dos quais – como o número de ligações e tráfego de visitantes – podem não refletir totalmente a influência de um documento.

Revistas Científicas tradicionalmente quantificam o impacto de um paper medindo quantas vezes ele é citado por outros trabalhos, mas outras coleções de documentos, tais como jornais, pedidos de patentes e posts do blog, não são contados para medir sua influência.

Em vez de focar em citações, Blei e Sean Gerrish, um estudante de Princeton doutorando em Ciência da Computação, desenvolveram um modelo estatístico que permite que computadores analisarem o próprio texto de documentos para ver como um termo muda ao longo do tempo. documentos Influentes em uma área  estabelecem novos conceitos e termos que mudam os padrões de palavras e frases que são usadas em trabalhos posteriores.

Métodos anteriores foram desenvolvidos por pesquisadores para estudar mudança de termos contabilizados em um grupo de documentos influencia um grupo posterior de documentos, mas eram incapazes de isolar a influência de documentos individuais. Os modelos podiam por exemplo, analisar todos os artigos em uma revista ciêntífica em um ano e seguir a influência que tiveram sobre os papers da revista no ano seguinte, mas não podiam dizer se um determinado paper introduzia novas idéias.

Os pesquisadores apresentaram o novo método na Conferencia Internacional de Máquinas de Apendizagem (27a. Conference on Machine Learning) que aconteceu em junho em Haifa, Israel.

 

Tags:

Deixe um comentário

Você deve estar Logado para postar um comentário.

  1. Luiz

    Monday October 25th, 2010 at 09:52 AM

    Interessante é pouco para descrever isso!!!! Vc tem o texto completo da pesquisa?

     
  2. Luiz

    Monday October 25th, 2010 at 09:52 AM

    Interessante é pouco para descrever isso!!!! Vc tem o texto completo da pesquisa?

     
  3. luiz

    Tuesday October 26th, 2010 at 10:47 PM

    Então, daqui os links dão na página de notícias do departmento de Computação de Princeton. Acho que o texto completo da pesquisa com demostração do algorítmo só deve estar disponível de um ip de dentro da USP, mas pode deixar comigo que eu consigo o artigo 🙂

     
  4. luiz

    Tuesday October 26th, 2010 at 10:47 PM

    Então, daqui os links dão na página de notícias do departmento de Computação de Princeton. Acho que o texto completo da pesquisa com demostração do algorítmo só deve estar disponível de um ip de dentro da USP, mas pode deixar comigo que eu consigo o artigo 🙂