Como a Airbnb usou machine learning para combater fraudes financeiras

O Airbnb, website que combina pessoas que alugam suas casas com pessoas que estão procurando um lugar para ficar, usa técnicas de machine learning para combater fraudes financeiras. Eles usam o "bloqueio direcionado" para combater os custos dos estornos [devido ao uso de cartões de crédito roubados, por exemplo], enquanto minimizam o impacto para os bons clientes usando o sistema de reservas online.

A detecção de fraudes é fundamental para a equipe do Airbnb porque quase dois milhões de pessoas se hospedam em propriedades listadas na Airbnb em 191 países em todo o mundo, em qualquer noite. Isso significa que o rápido crescimento de sua comunidade global é baseado na confiança. Sua abordagem ao combate à fraude consiste em medidas proativas e suporte reativo. As medidas proativas são usadas antes do tempo da transação - e geralmente em segundo plano - utilizando machine learning, a experimentação, e a análise para evitar que fraudadores usem cartões de crédito roubados no site.

David Press, cientista de dados do Airbnb, escreveu sobre como eles utilizam as técnicas de machine learning para identificar e bloquear fraudadores, enquanto minimizam o impacto para os bons usuários.

Os estornos, que são comuns em negócios on-line, são o foco principal de seu programa de detecção de fraudes. "Estornos" são transações que usuários não autorizados fazem usando os cartões de crédito roubados.

Quando o titular do cartão percebe que seu cartão foi roubado e percebe cobranças não autorizadas em sua fatura, a administradora do cartão de crédito emite o reembolso para o comerciante e o comerciante (Airbnb) devolve o dinheiro.

Ao contrário de outras empresas, o Airbnb absorve o custo total desses estornos e não repassa a responsabilidade financeira para os hosts (donos das casas). Por isso, eles trabalham ativamente para impedir que cartões de crédito roubados sejam usados a fim de proteger melhor a comunidade de usuários e reduzir sua própria exposição a custos de cobrança retroativa.

Às vezes as transações são bloqueadas imediatamente, mas na maioria das situações o Airbnb permite ao usuário a oportunidade de tentar uma verificação adicional chamada "bloqueio". O bloqueio é algo que bloqueia um usuário não autorizado, mas é fácil para um bom usuário satisfazer. Os diferentes tipos de bloqueio incluem micro-autorização (dois pequenos débitos no cartão de crédito, que o portador deve identificar registrando em seu extrato bancário on-line), 3-D Secure (que permite às empresas de cartão de crédito autenticar diretamente portadores de cartão via senha ou SMS de confirmação), e verificação de extrato de faturamento (exigindo que o titular do cartão faça o upload de uma cópia do extrato de faturamento associado ao cartão).

Press falou sobre como eles usam modelos de machine learning para acionar bloqueios direcionados aos fraudadores. Ele também descreveu como eles escolhem o modelo limiar de ML, minimizando uma função de perda para três cenários diferentes: falsos positivos, falsos negativos, e verdadeiros positivos.

Eles detectam transações de fraudes financeiras usando modelos de ML treinados em exemplos passados confirmados de comportamento fraudulento e bom comportamento. Como qualquer outro modelo de ML, eles precisam lidar com diferentes cenários, como falsos positivos, falsos negativos, e verdadeiros positivos.

Os falsos positivos são eventos "bons" que o modelo classifica como "ruins" (acima do limite).
Falsos negativos são os eventos fraudulentos que pontuaram abaixo do limite do modelo de machine learning.
Um evento positivo verdadeiro ocorre quando o modelo identifica corretamente um fraudador com uma pontuação acima do limite.

Press também escreveu sobre o custo de cada um desses cenários. Se eles aplicarem o bloqueio incorretamente a uma boa reserva (um falso positivo), eles incorrem em um custo, pois há uma chance de o bom usuário não concluir a transação a qual o bloqueio foi aplicado e ele não usará o Airbnb.

Com relação aos falsos negativos, a perda total é calculada multiplicando-se o número de falsos negativos pelo custo de cada evento de fraude. O Airbnb absorve todos os custos associados a estornos para que o custo total seja o valor total do pagamento efetuado pelo fraudador, mais um fator de custos indiretos associado às taxas do processador, mais outras taxas de recusa do cartão. Outro custo dos falsos negativos é se eles incorretamente aplicarem o bloqueio a uma boa reserva (um falso positivo), o bom usuário pode optar por não completar a transação e, desistir de usar o Airbnb.

Finalmente, para as verdadeiras transações positivas, elas aplicam o bloqueio para alcançar seu objetivo, impedindo que usuários não autorizados usem o Airbnb.

O limite do modelo de machine learning é otimizado treinando o modelo de cobrança retroativa em exemplos positivos (fraude) e negativos (não fraudulentos) de reservas passadas. Como a fraude é muito rara, esse é um problema de classificação desequilibrado com rótulos positivos escassos. Eles caracterizam o desempenho de seu modelo na identificação de reservas fraudulentas versus boas reservas em vários limites em termos da taxa de verdadeiro positivo e taxa de falso positivo e, em seguida, avaliam o custo total associado a cada limite usando uma função de perda que depende dessas taxas.

O Airbnb também executa o teste A/B usando o Framework de relatório de experimentos para medir o impacto de cada bloqueio em bons usuários. Eles atribuem usuários com pontuações de modelo baixas (que dificilmente são fraudadores) ao experimento no mesmo estágio do filtro, onde aplicarão o bloqueio contra fraudadores.

No post, Press ainda explica um exemplo numérico comparando a otimização de transações bloqueadas versos a aplicação de bloqueio .

Unlock the full InfoQ experience

Não tem uma conta no InfoQ?

Tópicos

Crank, o novo framework frontend com renderização assíncrona integrada - Bate papo com Brian Kim

APIs em tempo real no contexto do Apache Kafka

COVID-19 e Mineração de Redes Sociais - Habilitando Cargas de Trabalho de Aprendizado de Máquina com Big Data

Entendendo Os Valores e Princípios Ágeis

Bate papo sobre o livro “De pé sobre os ombros: Um guia para líderes na transformação digital"

Links úteis

Escolha a região

Avalie esse artigo

Conteúdo publicado no tópico IA, ML e Engenharia de Dados

Tópicos Relacionados:

Conteúdo editorial relacionado

Conteúdo relacionado de patrocinadores

Conteúdo educacional

Crank, o novo framework frontend com renderização assíncrona integrada - Bate papo com Brian Kim

Blockchain Empresarial: Jornada de uma rede multi-organização à produção

PHP 7 - Melhorias na biblioteca padrão

O último conteúdo do InfoQ Brasil

APIs em tempo real no contexto do Apache Kafka

Sete duras lições aprendidas na migração de um monólito para microservices

Adquira leads qualificados no mercado de desenvolvimento de software com a eMag InfoQ

Entendendo Os Valores e Princípios Ágeis

Somente empresas ágeis sobrevivem ao ambiente de negócios em constante mudança

COVID-19 e Mineração de Redes Sociais - Habilitando Cargas de Trabalho de Aprendizado de Máquina com Big Data

A inteligência artificial estaria mais próxima do bom senso?

Desafios na avaliação postural humana em aplicativos de condicionamento físico baseados em IA

Bate papo sobre o livro “De pé sobre os ombros: Um guia para líderes na transformação digital"

Arquitetura de Microservices Multi-Runtime

Armadilhas de design NoSQL com Java

QCon London

InfoQ Architect Certification

QCon AI Boston

QCon San Francisco