Stephanie Yee e Tony Chu são amigos que possuem habilidades diferentes em estatística e design e que se uniram para apresentar, de uma forma didática e visual, o aprendizado de máquina com um exemplo comum do dia a dia.
Os dois, por meio de seu site R2D3, apresentam um site interativo com um estudo a respeito de um conjunto de dados de imóveis situados nas cidades de Nova Iorque/EUA (NY) e São Francisco/EUA (SF). Eles buscam demonstrar como podemos utilizar técnicas de aprendizado de máquina para determinar, por exemplo, se um imóvel encontra-se em NY ou SF.
Os autores exemplificam a utilização de técnicas como:
- Classificação
- Dispersão
- Dimensões (recursos, fatores preditivos e variáveis)
- Limites
- Treinamentos
- Árvores de decisão
- Utilização de Histogramas
- Bifurcação
Os gráficos apresentados exibem de forma didática e detalhada como cada fase de um processo de identificação de padrão pode ser utilizado até que consigamos chegar a um consenso para atingir um objetivo desejado. O exemplo apresentado diz respeito a escolha de um imóvel em uma das duas cidades baseado em fatores como custo, altura e localização do imóvel.
O artigo recentemente foi traduzido para Português e está disponível no site original como uma das alternativas de leitura.
Trata-se de uma leitura recomendada para quem deseja iniciar neste ramo e deseja conhecer um pouco mais sobre este assunto tão largamente difundido no meio empresarial por meio de um exemplo real.
O conjunto de dados completo do exemplo utilizado pode ser acessado na conta do github dos pesquisadores e está disponível para download em formato CSV.