DeepMind: inteligência artificial “Gato” do Google está bem avançada

Você já ouviu falar da inteligência artificial mais avançada do mundo até o presente momento? O Gato é uma rede neural que está sendo produzida pela empresa DeepMind, comprada pela Google no ano de 2014.
Publicado em Tecnologia dia 25/05/2022 por Alan Corrêa

Você já ouviu falar da inteligência artificial mais avançada do mundo até o presente momento? O Gato é uma rede neural que está sendo produzida pela empresa DeepMind, comprada pela Google no ano de 2014.

Redes neurais são sistemas matemáticos e computacionais que tentam imitar o funcionamento dos nossos neurônios, e quanto mais a tecnologia e os softwares evoluem, mais eficientes as redes neurais se tornam. O projeto em questão, promete ultrapassar a inteligência humana em termos de capacidade cognitiva e raciocínio lógico.

Como funcionam as inteligências artificiais?

Inteligência artificial (por vezes mencionada pela sigla em português IA ou pela sigla em inglês AI - artificial intelligence) é a inteligência demonstrada por máquinas ao executar tarefas complexas associadas a seres inteligentes
Inteligência artificial (por vezes mencionada pela sigla em português IA ou pela sigla em inglês AI – artificial intelligence) é a inteligência demonstrada por máquinas ao executar tarefas complexas associadas a seres inteligentes

“Inteligência artificial” é um conceito da computação que consiste na capacidade das máquinas (físicas ou softwares) de interpretar dados externos e aprender a partir dessa interpretação, assim, com base nesse aprendizado, a mesma poderá inserir a lição na resolução de outras tarefas.

Em palavras mais simples, a ideia é fazer com que as máquinas pensem e ajam como seres humanos. O funcionamento de uma IA se baseia na combinação de grandes volumes de dados digitais e algoritmos inteligentes, ou seja, são dispositivos capazes de coletar, organizar e processar Big Data (conjunto de dados) em grandes velocidades a partir de programações.

O que é o “Gato”?

Gato, a inteligência artificial da Deepmind, é capaz de escrever, reconhecer imagens e até jogar Atari
Gato, a inteligência artificial da Deepmind, é capaz de escrever, reconhecer imagens e até jogar Atari

Conhecido por ser um“agente generalista”, o Gato funciona como uma política generalista, multimodal, multitarefa e multicorporativa. O mesmo é capaz de reconhecer e legendar imagens, bater papo, empilhar blocos, jogar Atari, escrever textos, etc.

Muito semelhante ao nosso cérebro, a inteligência é capaz de produzir vários resultados para diferentes tarefas. O Gato será semelhante ao projeto “Flamingo”, também da empresa DeepMind. O Flamingo é um modelo de linguagem visual capaz de resolver problemas difíceis com apenas alguns exemplos de tarefas, sem necessidade de treinamento.

Um dos diferenciais do Gato é que antes, as inteligências artificiais não eram capazes de escrever textos e reconhecer imagens ao mesmo tempo, e agora, graças à DeepMind, essas habilidades puderam ser unidas.

De acordo com Scott Reed, co-autor e pesquisador da rede neural em questão, “A maioria dos sistemas de IA atuais funciona para uma única tarefa ou domínio restrito por vez. Ter um único sistema capaz de resolver muitas atividades não é algo novo. No entanto, a novidade aqui é a diversidade de tarefas abordadas e o método de treinamento”.

Há testes sendo feitos para obter resultados quanto aos avanços tecnológicos do Gato, que até o presente momento, foram melhores do que o esperado. Por exemplo, o agente generalista já venceu vários jogadores humanos no Atari de 23 formas diferentes, além de conseguir resultados superiores em 44 jogos de vídeo-game diferentes.

Como o Gato funciona?

Ao implantar o Gato, um prompt, como uma demonstração, é tokenizado, formando a sequência inicial. Em seguida, o ambiente produz a primeira observação, que também é tokenizada e anexada à sequência. Gato amostra o vetor de ação de forma autorregressiva, um token por vez.
Ao implantar o Gato, um prompt, como uma demonstração, é tokenizado, formando a sequência inicial. Em seguida, o ambiente produz a primeira observação, que também é tokenizada e anexada à sequência. Gato amostra o vetor de ação de forma autorregressiva, um token por vez.

Na fase de treinamento do Gato, os dados de diferentes tarefas são agrupados e processados por uma rede neural. Ao implantar o Gato, um prompt (interpretador de linha de comando) é tokenizado formando a sequência inicial. Em seguida é feita a primeira observação (que também é tokenizada e anexada à sequência).

Uma vez que os tokens tenham sido amostrados, a ação é decodificada e enviada ao ambiente que produzirá uma nova observação. Dessa forma, o modelo se repete inúmeras vezes.

O que esperar do futuro da inteligência artificial (IA)?

Embora existam pessoas que estão otimistas com as evoluções tecnológicas atuais e para onde o nosso futuro está caminhando, ainda há aqueles que temem pelo desenvolvimento acelerado podendo nos levar a uma realidade onde a nossa sociedade ficará refém de um sistema computacional com uma inteligência superior à nossa.

Mesmo que pareça um pensamento adiantado e utópico, esta ideia pode se tornar real sim. Justamente por este motivo, é necessário que os programadores sempre pensem em uma maneira de “desligar” essa inteligência virtual, de forma que a raça humana não corra riscos de ser ameaçada por algo criado por nós mesmos.

Por outro lado, alguns cientistas não acreditam que essa ideia possa ser tão revolucionária quanto parece, e que ainda vai levar anos para que essas inteligências artificiais como o Gato ou o Flamingo sejam inseridas no cotidiano da nossa sociedade. Com a expansão da ideia e a popularização do Metaverso, a tendência é que o número de IA ‘s aumente, e estas serão responsáveis por auxiliar os usuários nas execuções das atividades virtuais.

*Com informações da DeepMind e Uol.