Início Notícias Avaliando modelos de Machine Learning: Um caso de estudo

Avaliando modelos de Machine Learning: Um caso de estudo

16 nov 2017 7 min(s) de Leitura

Nelson Ray, em sua palestra no QCon New York de 2017, falou sobre como estimar o impacto comercial de diversos modelos de machine learning. Nelson gerencia o grupo de Risk Science da Opendoor em São Francisco. Sua equipe é responsável pela estimativa de liquidez de casas e pelo desenvolvimento de modelos de risco responsivos.

Ray começa sua palestra falando sobre os testes A/B, em que os resultados nem sempre são os esperados e que isso pode ser devido ao tratamento dado, resultando em perda de dinheiro e/ou uma má experiência para o usuário.

Quando se tem um machine learning, que é o coração do negócio e faz previsões de resultado, recomendações, sugestão de preços e combina compradores e vendedores, busca-se a curva perfeita dos resultados.

Ray apresenta sua estratégia através de uma pirâmide invertida como mostrado na imagem abaixo:

A pirâmide é utilizada como um guia, mas quanto mais para baixo maior a confiança nos resultados, mas também maior o custo. No topo da pirâmide encontra-se a análise de observação, ou seja, algumas consultas são realizadas, médias são comparadas, mas não é possível distinguir a conexão e a causa. Em um andar para baixo na pirâmide, o tópico principal da palestra de Ray, está a inferência baseada em simulação do seu negócio, em que você pluga diferentes modelos de machine learning e tenta responder a seguinte questão: "Se eu rodar esse novo modelo, qual será o impacto em meu negócio?".

Mais um passo abaixo está o quasi-experiments, que constitui em uma ferramenta de econometria, isto é, você tem um stream de observação dos dados em que é possível observar raramente uma linha que é quase tão boa quanto o experimento, mas diferentes contas possui diferentes registros e isso pode diminuir ou aumentar taxas. E por fim existe o teste A/B.

Quando se decide vender uma casa o primeiro passo é entrar em contato com uma imobiliária para então gastar uma grande quantidade de dinheiro e deixar a casa vendável. Após essa etapa, a casa é posta no mercado e dezenas de estranhos são convidados, em um processo open house. Se você tiver sorte, haverá alguém interessado em comprar. Todo esse processo leva em média 100 dias, com uma taxa de 14% de falha.

Agora, se você decide comprar uma casa, leva em média o mesmo tempo de venda. Para a compra de uma casa, é necessário estar seguro do que será feito, pois provavelmente será a maior transação financeira de sua vida, o que pode ser muito estressante, e não há muitas garantias no processo. Uma parceria com uma imobiliária é realizada e é solicitado um financiamento em algum banco.

O The Opendoor é um sistema diferenciando, onde a empresa compra a casa de um vendedor e depois se responsabiliza por vender essa casa a compradores finais. A missão da Opendoor é capacitar todos com a liberdade de se mudar. Nos EUA existem $25 trilhões de ativos, e 63,5% dos americanos são proprietários de casas, gerando $100 bilhões em taxas.

Na Opendoor o processo para um vendedor constitui nas seguintes etapas:

Preencher um perfil da casa curto: para que possa ser feita uma avaliação da casa.
Digitar o endereço: experimentar um processo de venda automatizado e sem complicações.
Receber uma oferta em minutos: nesta oferta há um relatório sobre o valor da casa.

Já o processo do comprador, que inclui uma garantia de satisfação de 30 dias e inspeção certificada com 180 pontos junto com uma garantia de cobertura de 2 anos da Oneguard, ocorre da seguinte forma:

Há milhares de compradores.
Pesquisas e visitas são realizadas de forma automática e sob demanda.
Os compradores têm acesso exclusivo ao inventário.
Todas as casas possuem garantia de devolução do dinheiro de dois anos.

Com tudo isso Ray pergunta:

Qual é o nosso risco na venda de uma casa?

Para verificar o risco na compra e na venda de uma casa foi feita uma análise de dois modelos de casa diferentes:

Apesar da casa 2 possuir menos atrativos que a casa 1, ela é vendida mais rapidamente e com mais facilidade, e para isso temos diversos modelos de qualidade para medir essa precisão. Com o modelo, sabemos que a geografia é um dos fatores na hora da decisão, por exemplo se a casa for em uma área central ela terá uma maior demanda. O preço também é um dos fatores, por ser um valor menor e mais pessoas podem arcar com as despesas. A época do ano é outro fator, as pessoas não costumam comprar casas perto dos feriados; E um fator muito importante é o mercado. A maior parte do modelo da Opendoor está centrada na liquidez do imóvel.

A filosofia da Opendoor é ser o operador de risco de revenda da casa, os custos variam substancialmente por casa, e ser justo para cada vendedor cobrar com base em um custo esperado. Se você deseja vender uma casa altamente customizada, mas fora dos padrões da cidade, a revenda dessa casa será mais custosa, e por isso esse risco será incrementado e a cobrança será feita de acordo com esse valor.

Um dos problemas é o enquadramento, pois quanto menor a mudança e maior a taxa há menos chances de venda, já quando o lucro e a taxa forem grandes maior a chance de venda.

Essas métricas podem variar, pois se tiver a conversão de várias casas apenas o volume será acrescido, agora se tiver o lucro de algumas, será um lucro total e alguns números serão adicionados.

Colocando tudo isso de uma forma matemática, tem-se a maximização sobre o espaço amostral do valor, e com isso espera-se um grande volume e se sujeita a não perder muito dinheiro.

Existe uma infinidade de números para modelos de preço. O objetivo é como avaliar isso obtendo um modelo de qualidade e que não tenha muito custo. Uma das maneiras é através do teste A/B. No teste A/B as ofertas são randomizadas para o modelo de preço f e outras para o modelo f', e as métricas observadas são a quantidade e o lucro. Na prática isso parece simples, mas para isso é necessário observar o atraso de medidas das métricas. Para observar a quantidade apenas alguns dias são necessários, mas para se obter uma decisão correta que cobrirá os custos investidos são necessário meses.

Caso os testes iniciem hoje, daqui alguns meses será possível observar um resultado decente, e então por isso não é utilizado o teste A/B. Por esse motivo, foi necessário buscar outros métodos para obter o mesmo resultado. O novo teste escolhido foi o de simulação de ofertas, e para obter o resultado desejado foram realizadas as seguintes etapas:

O histórico de transações de dados.
A lista de casas no mercado.
Um simulador de processo de compra.
Um custo estimado.
Observar o resultado real das casas.

O sucesso é medido através do acontecimento com a casa. Se acreditava-se que iria demorar um bom tempo para vender aquela casa com base nos dados disponíveis naquele momento, mas ela foi vendida mais rapidamente, isso é um resultado.

Foram realizados dois tipos de modelos: um modelo de qualidade com uma linha de base e um outro em benefício dos custos como observado na imagem a cima. Com base nesses resultados pode-se observar nos gráficos abaixo que a venda através do teste A/B que obteria apenas um resultado após meses seria possível traçar apenas uma linha, enquanto através do teste de simulação o modelo de baseline consegue ser muito mais preciso do que com base nos custos.

Uma outra forma em que essa framework é útil é no planejamentos de metas futuras. Isso pode ser feito imaginando o modelo perfeito, onde uma máquina não comete erros, mas isso é irreal pois problemas reais tem diferentes aspectos. Sendo assim, teríamos uma curva para isso um pouco menos idealizada mas também inatingível. A partir disso é possível estimar uma melhora no seu modelo em 10 ou 20%. E este modelo pode ser utilizado para melhorar o seu teste A/B.

Por fim, este modelo pode ser aplicado a outros cenários, para isso é preciso analisar as transações de dados passadas, e então simular o processo de negócio. A receita, então, é um processo generalizado de dados com posterior verificação do modelo de usuário fazendo simulações para que possa ser feito um teste A/B responsivamente.

Para mais informações, a palestra pode ser visualizada no site do InfoQ.

Conteúdo editorial relacionado

Tópicos

Crank, o novo framework frontend com renderização assíncrona integrada - Bate papo com Brian Kim

APIs em tempo real no contexto do Apache Kafka

COVID-19 e Mineração de Redes Sociais - Habilitando Cargas de Trabalho de Aprendizado de Máquina com Big Data

Entendendo Os Valores e Princípios Ágeis

Bate papo sobre o livro “De pé sobre os ombros: Um guia para líderes na transformação digital"

Links úteis

Escolha a região

Avaliando modelos de Machine Learning: Um caso de estudo

Avalie esse artigo

Conteúdo publicado no tópico IA, ML e Engenharia de Dados

Tópicos Relacionados:

Conteúdo editorial relacionado

Conteúdo relacionado de patrocinadores

Conteúdo educacional

Crank, o novo framework frontend com renderização assíncrona integrada - Bate papo com Brian Kim

Blockchain Empresarial: Jornada de uma rede multi-organização à produção

PHP 7 - Melhorias na biblioteca padrão

O último conteúdo do InfoQ Brasil

APIs em tempo real no contexto do Apache Kafka

Sete duras lições aprendidas na migração de um monólito para microservices

Adquira leads qualificados no mercado de desenvolvimento de software com a eMag InfoQ

Entendendo Os Valores e Princípios Ágeis

Somente empresas ágeis sobrevivem ao ambiente de negócios em constante mudança

COVID-19 e Mineração de Redes Sociais - Habilitando Cargas de Trabalho de Aprendizado de Máquina com Big Data

A inteligência artificial estaria mais próxima do bom senso?

Desafios na avaliação postural humana em aplicativos de condicionamento físico baseados em IA

Bate papo sobre o livro “De pé sobre os ombros: Um guia para líderes na transformação digital"

Arquitetura de Microservices Multi-Runtime

Armadilhas de design NoSQL com Java

QCon London

InfoQ Live Roundtable

InfoQ Dev Summit Boston

InfoQ Dev Summit Munich

QCon San Francisco

Fazer login com:

Não tem uma conta no InfoQ?

Avaliando modelos de Machine Learning: Um caso de estudo

Avalie esse artigo

Conteúdo publicado no tópico IA, ML e Engenharia de Dados

Tópicos Relacionados:

Conteúdo editorial relacionado

Conteúdo relacionado de patrocinadores

Conteúdo educacional

InfoQ Brasil Newsletter