Como você ensina os computadores a entender a linguagem – não apenas transcrevendo a fala humana, mas realmente compreendendo o que alguém está dizendo? É um dos grandes desafios da IA, e ainda não sabemos realmente a melhor maneira de resolver o problema. O laboratório de pesquisa de IA do Facebook, o FAIR, tem uma idéia: ensinar as IAs a entender a linguagem, fazendo com que elas guiem turistas virtuais pela cidade de Nova York.

A FAIR está lançando o que chama de Talk the Walk , um conjunto de dados projetado para ser usado por outros pesquisadores. Ele é composto de três elementos: pequenos mapas dos bairros da cidade de Nova York (cada um com dois quarteirões de largura), fotos de 360 ​​graus dos mesmos locais e exemplos de diálogos de humanos que guiam uns aos outros em torno desses bairros. Basicamente, é tudo o que você pode precisar para ensinar uma IA para lidar com essa tarefa.

Isso pode soar um pouco estranho como um método de treinamento de IA, mas o FAIR está entrando em um campo estabelecido de pesquisa conhecido como “aprendizado de linguagem fundamentada” ou “aprendizagem incorporada”. Essa teoria diz que a única maneira de ensinar AI a entender linguagem como os humanos é fazer com que eles aprendam como nós – no mundo real.

É claro que pequenas fatias da cidade de Nova York não são representativas de todo omundo. Mas a ideia é que, se conseguirmos que a IA tenha sucesso nessa tarefa em particular, as técnicas utilizadas pelos pesquisadores serão aplicáveis ​​em outros lugares. Esta é uma maneira estabelecida de impulsionar o progresso da inteligência artificial, e notáveis ​​conjuntos de dados (como o ImageNet) são frequentemente creditados por impulsionar todo o campo para frente.

Os pesquisadores do FAIR sugerem que as equipes tentem ensinar dois agentes de IA a navegar em seus mapas virtuais de Nova York. Um agente seria um “turista” que pode ver as fotos de 360 ​​graus, mas não o mapa, e o outro um “guia” que pode ver o mapa, mas não as fotos. Os agentes então têm que conversar um com o outro para estabelecer a localização do turista e ajudá-los a navegar para outro ponto no mapa. O turista procuraria marcos próximos, como restaurantes, bares e cafeterias, e o guia lhes daria instruções.

Pense em Talk to Walk como um daqueles jogos de aventura de fantasia no qual você se depara com um corredor de masmorras, e você tem que fazer uma escolha como “ir para o norte” ou “ir para o sul” ou “dar a volta”. uma masmorra para encontrar tesouros, você está preso no distrito financeiro de Nova York procurando por um cabeleireiro chamado Snip Dogg.

Os pesquisadores da FAIR dizem que ainda não foram capazes de criar agentes de IA que possam resolver esse problema ainda. (Por que? “Porque é super difícil!”, Diz Kiela.) Mas eles esperam que as equipes comecem a construir bots que possam orientar os turistas virtuais de forma competente nos próximos anos. O FAIR estabeleceu os resultados de linha de base para uma sub-tarefa conhecida como “localização”, que significa obter a AI turística para transmitir ao guia AI onde eles estão no mapa.

A tarefa geral do Talk to Walk é desafiadora porque combina muitos elementos diferentes da percepção e da linguagem da IA. Os agentes precisam ser capazes de reconhecer seus arredores, transmitir essas informações e interagir com o mundo. “O objetivo final é ter assistentes de IA que entendam melhor os humanos porque eles entendem melhor o mundo”, diz Kiela. “Isso é algo aplicável ao Facebook e a qualquer empresa no mundo”.

LEAVE A REPLY

Please enter your comment!
Please enter your name here