Google Discorre Sobre a Dívida Técnica no Aprendizado de Máquina

Pesquisadores e engenheiros do Google apresentaram sua visão sobre a dívida técnica utilizando aprendizado de máquina no workshop Engenharia de Software para Aprendizado de Máquina, que foi parte integrante da conferência anual NIPS, realizada em Montreal. Eles identificaram diferentes aspectos da dívida técnica e chegaram à conclusão que utilizar aprendizado de máquina ou análises de dados complexas em sua empresa sem o devido cuidado pode gerar novos tipos de dívidas técnicas, diferentes daquelas conhecidas na engenharia de software clássica.

No artigo, eles identificaram quatro diferentes áreas nas quais a dívida técnica ocorre: erosão de limites entre subsistemas, dependências de dados, anti-padrões em sistemas e problemas que surgem ao lidar com mudanças no mundo real.

Por exemplo, o estudo afirma que os métodos de aprendizado de máquina são definidos como sistemas que misturam insumos provenientes de diferentes partes com o objetivo de chegar a previsões de alta precisão. Entretanto, isto significa que utilizar estes métodos automaticamente nos leva a um emaranhado de módulos que antes estavam bem isolados. O resultado é que mudanças em um único módulo podem afetar significativamente o desempenho global das previsões.

Assim como a reutilização das bibliotecas leva à dependência de código, os métodos de aprendizado de máquina levam àdependência de dados. Um problema identificado pelo estudo é que as fontes de dados são frequentemente instáveis, gerando instabilidade no módulo de previsão.

Uma abordagem comum para aprendizado de máquina consiste em usar um grande conjunto de fontes de dados disponíveis e então deixar o algoritmo identificar as fontes relevantes. Consequentemente, utiliza-se mais fontes de dados que o estritamente necessário. Neste ponto, uma limpeza periódica pode ser útil.

Finalmente, o estudo diz que ferramentas para rastrear, documentar e resolver dependências de dados também são importantes, de forma similar às ferramentas para tratamento de dependência de código.

Da perspectiva de arquitetura de sistemas, utilizar métodos de aprendizado de máquina frequentemente nos leva a alguns anti-padrões de design de software conhecidos. Especialmente ao utilizar software de aprendizado de máquina de propósito geral, uma grande quantidade de código é necessária para integração de suas partes. Neste ponto, a reescrita a partir do zero pode ser útil.

Experimentar com diferentes alternativas de análise sem realizar uma limpeza periódica do código frequentemente leva a caminhos de "código morto" (i.e. código que nunca será executado).

O Google é conhecido por utilizar aprendizado de máquina e análises de dados complexas em vários de seus principais serviços. Por exemplo, eles estão usando modelos de previsão para otimizar o local de apresentação de um anúncio para o seu serviço. Serviços como a busca de imagens também são baseados em aprendizado de máquina. Recentemente, o Google investiu pesado nesta área adquirindo, por exemplo, as startups Deepmind e DNNresearch. Outras empresas estão seguindo caminhos similares. Por exemplo, o Facebook criou um laboratório de aprendizado de máquina em Nova York.

Unlock the full InfoQ experience

Não tem uma conta no InfoQ?

Tópicos

Crank, o novo framework frontend com renderização assíncrona integrada - Bate papo com Brian Kim

APIs em tempo real no contexto do Apache Kafka

COVID-19 e Mineração de Redes Sociais - Habilitando Cargas de Trabalho de Aprendizado de Máquina com Big Data

Entendendo Os Valores e Princípios Ágeis

Bate papo sobre o livro “De pé sobre os ombros: Um guia para líderes na transformação digital"

Links úteis

Escolha a região

Avalie esse artigo

Conteúdo publicado no tópico Arquitetura Corporativa

Tópicos Relacionados:

Conteúdo editorial relacionado

Conteúdo relacionado de patrocinadores

Conteúdo educacional

Crank, o novo framework frontend com renderização assíncrona integrada - Bate papo com Brian Kim

Blockchain Empresarial: Jornada de uma rede multi-organização à produção

PHP 7 - Melhorias na biblioteca padrão

O último conteúdo do InfoQ Brasil

APIs em tempo real no contexto do Apache Kafka

Sete duras lições aprendidas na migração de um monólito para microservices

Adquira leads qualificados no mercado de desenvolvimento de software com a eMag InfoQ

Entendendo Os Valores e Princípios Ágeis

Somente empresas ágeis sobrevivem ao ambiente de negócios em constante mudança

COVID-19 e Mineração de Redes Sociais - Habilitando Cargas de Trabalho de Aprendizado de Máquina com Big Data

A inteligência artificial estaria mais próxima do bom senso?

Desafios na avaliação postural humana em aplicativos de condicionamento físico baseados em IA

Bate papo sobre o livro “De pé sobre os ombros: Um guia para líderes na transformação digital"

Arquitetura de Microservices Multi-Runtime

Armadilhas de design NoSQL com Java

QCon London

QCon AI Boston

QCon San Francisco