Um buscador que entende o que lê
Os mecanismos de busca da Internet trabalham com palavras0-chave. Eles não têm a menor idéia do significado do que está escrito nas páginas. O mais popular, Google, usa um sistema de relevância baseado nos links que cada página recebe. Uma nova geração de buscadores promete sistemas que entendem, ainda de maneira básica, o que está escrito na página. A Powerset, pequena empresa americana da área de busca semântica, foi comprada no mês passado pela Microsoft. Ela é a aposta da companhia de Bill Gates para enfrentar o Google.
A tecnologia da Powerset foi licenciada do Palo Alto Research Center (PARC), centro de pesquisa da Xerox. Pell, o executivo da empresa, explicou como o sistema funciona: “Depois de 30 anos de pesquisa, chegamos a um ponto em que os computadores podem, num nível bastante básico, entender a linguagem humana. Eles não conseguem entender tudo, mas hoje podem ler e extrair as relações semânticas centrais de um documento ou da busca do usuário”. Ou seja, o sistema consegue identificar relações entre conceitos que existem no texto.
O sistema percebe, por exemplo, que a mesma palavra pode ter sentidos diferentes, e que palavras diferentes podem significar a mesma coisa. Ou que uma palavra ou expressão podem ter o sentido contrário de outra. “Nós incluímos na tecnologia o funcionamento básico de determinada língua, como o inglês, com as regras gramaticais e uma espécie de dicionário. Por causa disso, o sistema precisa ser adaptado para cada língua existente na web. O algoritmo central é independente da língua. Ele entende como a linguagem humana funciona de uma forma básica, da mesma forma que um bebê, independente de onde tenha nascido, entende como a linguagem funciona porque é humano. Mas, como o bebê, precisa aprender as regras e as palavras específicas de cada língua.” explicou Pell.
(O Estado de S.Paulo, 03.08.2008. Adaptado)
Assinale a afirmativa correta, de acordo com o texto.