Pesquisas de IA open source com o OpenAI Gym

Como vem acontecendo com muitas empresas de Data Science, a InfoSys está passando por grandes mudanças, distanciando-se do Big Data e aumentando a ênfase em inteligência artificial e aprendizado de máquina. Mas diferentemente dos seus concorrentes, que estão investindo pesadamente em soluções proprietárias como o Azure Machine Learning Studio da Microsoft, a InfoSys decidiu que uma abordagem colaborativa pode ser mais eficiente.

O resultado dessa decisão foi o OpenAI, uma empresa sem fins lucrativos para pesquisa sobre inteligência artificial. Oficialmente lançado em dezembro de 2015, este grupo de pesquisa já recebeu bilhões de dólares em doações não só da InfoSys, mas também da Amazon Web Services e diversas pessoas.

Recentemente a OpenAI liberou uma versão beta do OpenAI Gym. Essa caixa de ferramentas permite desenvolver e comparar algoritmos de Aprendizado por Reforço (Reinforced Learning), um dos pilares das pesquisas modernas sobre aprendizado de máquina. O anúncio do lançamento citou duas razões principais que estão focadas nos algoritmos de Aprendizado por Reforço:

O reinforced learning é muito amplo, abrangendo todos os problemas que envolvem tomadas de sequências de decisões: por exemplo controle de motores de um robô para correr ou pular; tomada de decisões de negócio como precificação ou gerenciamento de inventários; e uso em games e jogos de tabuleiro. A técnica pode ser aplicada para problemas de aprendizado supervisionado com saídas sequenciais ou estruturais.

Algoritmos de aprendizado por reforço (AR) começaram a obter bons resultados em muitos ambientes difíceis. O AR tem longa história, mas antes dos recentes avanços em deep learning, era necessário resolver muitos problemas específicos. Os resultados em jogos Atari conseguidos pela DeepMind, o BRETT do grupo Pieter Abbeel, e o AlphaGo que foi o primeiro programa que joga Go capaz de vencer um jogador profissional, todos utilizam algoritmos de AR que partem de poucas premissas sobre seu ambiente. Desse modo podem ser utilizados em outros cenários.

Atualmente, as pesquisas de AR estão limitadas pela necessidade de melhores benchmarks e a falta de padronização dos ambientes usados em publicações científicas. É difícil reproduzir os resultados de outro cientista quando os artigos presumem que o leitor tenha acesso a um conjunto de ferramentas proprietárias; ou pior, ferramentas internas que não estão disponíveis por preço algum.

Um fundamento importante do aprendizado de máquina é que haja um ambiente experimental no qual trabalhar, e não é possível comparar verdadeiramente dois algoritmos a menos que ambos compartilhem o mesmo ambiente. O OpenAI Gym busca solucionar esse problema oferecendo controles clássicos, um ambiente de texto simples, algoritmico, Atari (com base no ambiente de aprendizado no estilo Arcade), jogos de tabuleiro e robôs 2D/3D (Este último precisa da licença do MuJoCo uma engine de física).

O OpenAI Gym atualmente suporta Python 2.7 no Linux e OS X. Se houver interesse, segundo a organização, o Python 3 e o Windows poderão ser considerados futuramente. O código é oferecido sob a licença MIT. Conheça mais no site oficial.

Unlock the full InfoQ experience

Não tem uma conta no InfoQ?

Tópicos

Crank, o novo framework frontend com renderização assíncrona integrada - Bate papo com Brian Kim

APIs em tempo real no contexto do Apache Kafka

COVID-19 e Mineração de Redes Sociais - Habilitando Cargas de Trabalho de Aprendizado de Máquina com Big Data

Entendendo Os Valores e Princípios Ágeis

Bate papo sobre o livro “De pé sobre os ombros: Um guia para líderes na transformação digital"

Links úteis

Escolha a região

Avalie esse artigo

Conteúdo publicado no tópico Linguagens Dinâmicas

Tópicos Relacionados:

Conteúdo editorial relacionado

Conteúdo relacionado de patrocinadores

Conteúdo educacional

Crank, o novo framework frontend com renderização assíncrona integrada - Bate papo com Brian Kim

Blockchain Empresarial: Jornada de uma rede multi-organização à produção

PHP 7 - Melhorias na biblioteca padrão

O último conteúdo do InfoQ Brasil

APIs em tempo real no contexto do Apache Kafka

Sete duras lições aprendidas na migração de um monólito para microservices

Adquira leads qualificados no mercado de desenvolvimento de software com a eMag InfoQ

Entendendo Os Valores e Princípios Ágeis

Somente empresas ágeis sobrevivem ao ambiente de negócios em constante mudança

COVID-19 e Mineração de Redes Sociais - Habilitando Cargas de Trabalho de Aprendizado de Máquina com Big Data

A inteligência artificial estaria mais próxima do bom senso?

Desafios na avaliação postural humana em aplicativos de condicionamento físico baseados em IA

Bate papo sobre o livro “De pé sobre os ombros: Um guia para líderes na transformação digital"

Arquitetura de Microservices Multi-Runtime

Armadilhas de design NoSQL com Java

QCon London

InfoQ Architect Certification

QCon AI Boston

QCon San Francisco