Machine learning (e antifraude) não é magia: você precisa ensinar o sistema
Um dos ramos da tecnologia que evolui a passos mais largos com o intuito de facilitar o dia a dia da sociedade é o machine learning, ou aprendizado de máquina. Há alguns meses, listamos aqui no blog 20 tarefas que já são executadas por sistemas computadorizados, e muitas delas já são praticamente indispensáveis para muitos de nós.
Recentemente, o machine learning voltou a ganhar notoriedade na imprensa depois do desafio de Go (um jogo de estratégia bastante popular na Ásia), entre o campeão mundial Lee Se-Dol e o supercomputador AlphaGo, desenvolvido pela empresa Deep Mind, filial do Google. O sistema computadorizado, que “aprendeu” o jogo e se aperfeiçoou nas estratégias graças ao aprendizado de máquina, venceu quatro das cinco partidas, de maneira surpreendente. E o caso correu o mundo.
Mas, por trás das telas dos computadores e dos smartphones, como as coisas funcionam? Magia?
Não.
Então um programador (ou uma equipe com muitos deles) escreve algumas linhas de códigos, aperta um botão e voilà, o sistema já está lendo milhões de dados, reconhecendo padrões, cruzando informações e resolvendo as nossas vidas?
Também não. Há sim a inegável contribuição dos programadores para a criação do sistema de machine learning, mas tudo irá por água abaixo sem uma peça fundamental para a manutenção do sistema:
É, você mesmo! Você, eu, todos nós que fazemos uso dos sistemas que utilizam machine learning para executar tarefas ou automatizar decisões.
O aprendizado de máquina, por mais fantástico e inteligente que seja, precisa ser ensinado. O sistema tem que receber informações para aprender com elas e, assim, tomar as decisões que esperamos que ele tome. Caso contrário, todo o propósito do machine learning se perde.
Quer um exemplo?
Assim que você termina de assistir a um filme na Netflix pode aparecer uma opção para a avaliação daquele conteúdo. A sua recomendação rapidamente é digerida pelo algoritmo deles, que indicará o quanto você deve se interessar por determinado filme ou seriado com base naquilo que você e vários usuários já viram e avaliaram. Ou você achou mesmo que as indicações eram aleatórias e que, por passe de mágica, todas elas tinham TUDO a ver com o seu gosto cinematográfico?
Esse modelo se aplica a vários outros serviços equipados de machine learning: Waze, filtros de spam de e-mails, exibição de determinados banners de publicidade online e detecção de fraudes no e-commerce – sim, é o nosso caso na Konduto!
Machine learning na análise de risco
A Konduto não exige que a área de risco das empresas crie centenas de regras manualmente e faça a calibragem ao longo da operação. O processo é muito mais simples para a operação: o nosso algoritmo aprende o comportamento de navegação e compra do cliente de cada loja e se adapta da melhor maneira possível para aquele estabelecimento.
Assim, a cada dia que passa e a cada transação analisada, o nosso antifraude se torna mais capaz de aprovar mais pedidos automaticamente, enviar menos compras para a fila de revisão e barrar somente aquelas transações que sejam realmente suspeitas.
Mas como o algoritmo aprende? Já vimos que não existe mágica quando falamos de machine learning. A “magia” só acontece se você ensinar o sistema, para que ele entenda que determinados comportamentos de clientes são suspeitos ou não, que são perfeitamente normais para o seu e-commerce. Afinal, o comportamento de navegação e compra de clientes de uma loja de smartphones é completamente diferente do comportamento de navegação e compra de clientes em uma loja de roupas.
E, para ensinar o antifraude e extrair dele o máximo possível na detecção de fraudes, há duas maneiras: a primeira, e que faz parte do bê-a-bá da análise de risco, é realizar a revisão manual dos pedidos que mais deixaram o algoritmo em dúvida. Esta atividade é importantíssima como tira-teima para diversas compras, sendo capaz de evitar um prejuízo altíssimo ou garantir um lucro interessante.
Já a segunda atividade que você deve fazer para ensinar o algoritmo na detecção de fraudes é retroativa – e muitas vezes acaba sendo ignorada pelo e-commerce em geral, porque há a impressão equivocada de que não gerará resultado imediato para as empresas. Trata-se de mostrar para o antifraude os erros que ele cometeu, com as fraudes que a sua loja eventualmente acabou sofrendo mesmo estando com uma solução implementada. Você quer que o antifraude aprenda? Então você deve ensiná-lo! Não faz sentido?
Treinar o antifraude não é tempo perdido
Nada melhor do que imagens para mostrar como é importante ensinar o antifraude sobre o modelo de risco do seu negócio. Vamos mostrar três gráficos, com dados de vendas enviadas para revisão, vendas negadas e vendas que se transformaram em chargebacks. Eles são hipotéticos e ilustram três cenários completamente distintos: o cenário ideal, com um algoritmo extremamente bem treinado em uma empresa que dás feedbacks ao sistema, revisa pedidos suspeitos manualmente e dá o feedback de eventuais chargebacks ao sistema, e aproveitando ao máximo o serviço.
Já o segundo cenário apresenta um lojista que é mais cauteloso e decide negar automaticamente uma ou mais vendas marcadas apenas como suspeitas pelo algoritmo. Por fim, o terceiro cenário apresenta um lojista que igualmente não confia no que foi apresentado pela solução e acaba aprovando automaticamente transações consideradas suspeitas pela análise automática.
Cenário ideal
Note como as taxas de pedidos enviados para revisão, pedidos negados e chargebacks se mantêm estáveis ao longo do tempo. Neste cenário, as vendas enviadas para revisão manual tendem a ficar entre 10 e 12%, com a linha roxa, de vendas negadas por fraude, sempre na casa de 3%. Eventualmente, uma ou outra venda pode ser contestada pelo cliente, mas a taxa de chargebacks também se mantém próxima de 0,1%.
Muitas vendas negadas
Uma vez que a análise de risco do e-commerce passou a negar mais vendas consideradas suspeitas, sem revisá-las manualmente, o sistema aprendeu com este comportamento e se tornou extremamente conservador. Desta forma, muito mais vendas acabaram sendo tratadas como suspeitas de antemão, e consequentemente menos vendas foram aprovadas.
Note, porém, a linha pontilhada, que indica a taxa real de fraudes do negócio: ela está muito abaixo da linha de vendas negadas. Isso significa que a loja está aprovando menos pedidos do que poderia (sim, ela está vendendo menos)e, por tabela, está deixando de ganhar um bom dinheiro.
Muitas vendas aprovadas
Já este caso apresenta um lojista que ignorou a recomendação de revisão, passou a aprovar pedidos considerados suspeitos pelo sistema e não alimentou o sistema posteriormente com dados de chargebacks. Logo, o modelo acabou se tornando permissivo demais, e vendas que inicialmente cairiam em um filtro de suspeita foram aprovadas. O resultado: muitas fraudes acabaram passando, em um nível muito acima do que era esperado, causando um prejuízo importante ao empreendimento.
Concluindo…
Apesar de hipotéticos, os gráficos acima ilustram o conceito do machine learning: o sistema, por mais inteligente que seja, depende claramente da intervenção humana para atingir o máximo do seu potencial. Caso contrário, sem essa dedicação, a solução apresentará resultados muito aquém do esperado.
Categoria: Tendências