BT

Como a Airbnb usou machine learning para combater fraudes financeiras

| por Srini Penchikala Seguir 34 Seguidores , traduzido por Andrea Mussap Seguir 7 Seguidores em 14 mai 2018. Tempo estimado de leitura: 5 minutos |

O Airbnb, website que combina pessoas que alugam suas casas com pessoas que estão procurando um lugar para ficar, usa técnicas de machine learning para combater fraudes financeiras. Eles usam o "bloqueio direcionado" para combater os custos dos estornos [devido ao uso de cartões de crédito roubados, por exemplo], enquanto minimizam o impacto para os bons clientes usando o sistema de reservas online.

A detecção de fraudes é fundamental para a equipe do Airbnb porque quase dois milhões de pessoas se hospedam em propriedades listadas na Airbnb em 191 países em todo o mundo, em qualquer noite. Isso significa que o rápido crescimento de sua comunidade global é baseado na confiança. Sua abordagem ao combate à fraude consiste em medidas proativas e suporte reativo. As medidas proativas são usadas antes do tempo da transação - e geralmente em segundo plano - utilizando machine learning, a experimentação, e a análise para evitar que fraudadores usem cartões de crédito roubados no site.

David Press, cientista de dados do Airbnb, escreveu sobre como eles utilizam as técnicas de machine learning para identificar e bloquear fraudadores, enquanto minimizam o impacto para os bons usuários.

Os estornos, que são comuns em negócios on-line, são o foco principal de seu programa de detecção de fraudes. "Estornos" são transações que usuários não autorizados fazem usando os cartões de crédito roubados.

Quando o titular do cartão percebe que seu cartão foi roubado e percebe cobranças não autorizadas em sua fatura, a administradora do cartão de crédito emite o reembolso para o comerciante e o comerciante (Airbnb) devolve o dinheiro.

Ao contrário de outras empresas, o Airbnb absorve o custo total desses estornos e não repassa a responsabilidade financeira para os hosts (donos das casas). Por isso, eles trabalham ativamente para impedir que cartões de crédito roubados sejam usados a fim de proteger melhor a comunidade de usuários e reduzir sua própria exposição a custos de cobrança retroativa.

Às vezes as transações são bloqueadas imediatamente, mas na maioria das situações o Airbnb permite ao usuário a oportunidade de tentar uma verificação adicional chamada "bloqueio". O bloqueio é algo que bloqueia um usuário não autorizado, mas é fácil para um bom usuário satisfazer. Os diferentes tipos de bloqueio incluem micro-autorização (dois pequenos débitos no cartão de crédito, que o portador deve identificar registrando em seu extrato bancário on-line), 3-D Secure (que permite às empresas de cartão de crédito autenticar diretamente portadores de cartão via senha ou SMS de confirmação), e verificação de extrato de faturamento (exigindo que o titular do cartão faça o upload de uma cópia do extrato de faturamento associado ao cartão).

Press falou sobre como eles usam modelos de machine learning para acionar bloqueios direcionados aos fraudadores. Ele também descreveu como eles escolhem o modelo limiar de ML, minimizando uma função de perda para três cenários diferentes: falsos positivos, falsos negativos, e verdadeiros positivos.

Eles detectam transações de fraudes financeiras usando modelos de ML treinados em exemplos passados confirmados de comportamento fraudulento e bom comportamento. Como qualquer outro modelo de ML, eles precisam lidar com diferentes cenários, como falsos positivos, falsos negativos, e verdadeiros positivos.

  • Os falsos positivos são eventos "bons" que o modelo classifica como "ruins" (acima do limite).
  • Falsos negativos são os eventos fraudulentos que pontuaram abaixo do limite do modelo de machine learning.
  • Um evento positivo verdadeiro ocorre quando o modelo identifica corretamente um fraudador com uma pontuação acima do limite.

Press também escreveu sobre o custo de cada um desses cenários. Se eles aplicarem o bloqueio incorretamente a uma boa reserva (um falso positivo), eles incorrem em um custo, pois há uma chance de o bom usuário não concluir a transação a qual o bloqueio foi aplicado e ele não usará o Airbnb.

Com relação aos falsos negativos, a perda total é calculada multiplicando-se o número de falsos negativos pelo custo de cada evento de fraude. O Airbnb absorve todos os custos associados a estornos para que o custo total seja o valor total do pagamento efetuado pelo fraudador, mais um fator de custos indiretos associado às taxas do processador, mais outras taxas de recusa do cartão. Outro custo dos falsos negativos é se eles incorretamente aplicarem o bloqueio a uma boa reserva (um falso positivo), o bom usuário pode optar por não completar a transação e, desistir de usar o Airbnb.

Finalmente, para as verdadeiras transações positivas, elas aplicam o bloqueio para alcançar seu objetivo, impedindo que usuários não autorizados usem o Airbnb.

O limite do modelo de machine learning é otimizado treinando o modelo de cobrança retroativa em exemplos positivos (fraude) e negativos (não fraudulentos) de reservas passadas. Como a fraude é muito rara, esse é um problema de classificação desequilibrado com rótulos positivos escassos. Eles caracterizam o desempenho de seu modelo na identificação de reservas fraudulentas versus boas reservas em vários limites em termos da taxa de verdadeiro positivo e taxa de falso positivo e, em seguida, avaliam o custo total associado a cada limite usando uma função de perda que depende dessas taxas.

O Airbnb também executa o teste A/B usando o Framework de relatório de experimentos para medir o impacto de cada bloqueio em bons usuários. Eles atribuem usuários com pontuações de modelo baixas (que dificilmente são fraudadores) ao experimento no mesmo estágio do filtro, onde aplicarão o bloqueio contra fraudadores.

No post, Press ainda explica um exemplo numérico comparando a otimização de transações bloqueadas versos a aplicação de bloqueio .

Avalie esse artigo

Relevância
Estilo/Redação

Olá visitante

Você precisa cadastrar-se no InfoQ Brasil ou para enviar comentários. Há muitas vantagens em se cadastrar.

Obtenha o máximo da experiência do InfoQ Brasil.

Dê sua opinião

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão
Comentários da comunidade

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

Dê sua opinião

Faça seu login para melhorar sua experiência com o InfoQ e ter acesso a funcionalidades exclusivas


Esqueci minha senha

Follow

Siga seus tópicos e editores favoritos

Acompanhe e seja notificados sobre as mais importantes novidades do mundo do desenvolvimento de software.

Like

Mais interação, mais personalização

Crie seu próprio feed de novidades escolhendo os tópicos e pessoas que você gostaria de acompanhar.

Notifications

Fique por dentro das novidades!

Configure as notificações e acompanhe as novidades relacionada a tópicos, conteúdos e pessoas de seu interesse

BT