Machine learning (e antifraude) não é magia: você precisa ensinar o sistema

| 19/04/2016 - 15:13 PM | Comentários (0)

robot

Um dos ramos da tecnologia que evolui a passos mais largos com o intuito de facilitar o dia a dia da sociedade é o machine learning, ou aprendizado de máquina. Há alguns meses, listamos aqui no blog 20 tarefas que já são executadas por sistemas computadorizados, e muitas delas já são praticamente indispensáveis para muitos de nós.

Recentemente, o machine learning voltou a ganhar notoriedade na imprensa depois do desafio de Go (um jogo de estratégia bastante popular na Ásia), entre o campeão mundial Lee Se-Dol e o supercomputador AlphaGo, desenvolvido pela empresa Deep Mind, filial do Google. O sistema computadorizado, que “aprendeu” o jogo e se aperfeiçoou nas estratégias graças ao aprendizado de máquina, venceu quatro das cinco partidas, de maneira surpreendente. E o caso correu o mundo.

Mas, por trás das telas dos computadores e dos smartphones, como as coisas funcionam? Magia?

Não.

Então um programador (ou uma equipe com muitos deles) escreve algumas linhas de códigos, aperta um botão e voilà, o sistema já está lendo milhões de dados, reconhecendo padrões, cruzando informações e resolvendo as nossas vidas?

Também não. Há sim a inegável contribuição dos programadores para a criação do sistema de machine learning, mas tudo irá por água abaixo sem uma peça fundamental para a manutenção do sistema:

É, você mesmo! Você, eu, todos nós que fazemos uso dos sistemas que utilizam machine learning para executar tarefas ou automatizar decisões.

O aprendizado de máquina, por mais fantástico e inteligente que seja, precisa ser ensinado. O sistema tem que receber informações para aprender com elas e, assim, tomar as decisões que esperamos que ele tome. Caso contrário, todo o propósito do machine learning se perde.

Quer um exemplo?

Assim que você termina de assistir a um filme na Netflix pode aparecer uma opção para a avaliação daquele conteúdo. A sua recomendação rapidamente é digerida pelo algoritmo deles, que indicará o quanto você deve se interessar por determinado filme ou seriado com base naquilo que você e vários usuários já viram e avaliaram. Ou você achou mesmo que as indicações eram aleatórias e que, por passe de mágica, todas elas tinham TUDO a ver com o seu gosto cinematográfico?

Esse modelo se aplica a vários outros serviços equipados de machine learning: Waze, filtros de spam de e-mails, exibição de determinados banners de publicidade online e detecção de fraudes no e-commerce – sim, é o nosso caso na Konduto!

Machine learning na análise de risco

A Konduto não exige que a área de risco das empresas crie centenas de regras manualmente e faça a calibragem ao longo da operação. O processo é muito mais simples para a operação: o nosso algoritmo aprende o comportamento de navegação e compra do cliente de cada loja e se adapta da melhor maneira possível para aquele estabelecimento.

Assim, a cada dia que passa e a cada transação analisada, o nosso antifraude se torna mais capaz de aprovar mais pedidos automaticamente, enviar menos compras para a fila de revisão e barrar somente aquelas transações que sejam realmente suspeitas.

Mas como o algoritmo aprende? Já vimos que não existe mágica quando falamos de machine learning. A “magia” só acontece se você ensinar o sistema, para que ele entenda que determinados comportamentos de clientes são suspeitos ou não, que são perfeitamente normais para o seu e-commerce. Afinal, o comportamento de navegação e compra de clientes de uma loja de smartphones é completamente diferente do comportamento de navegação e compra de clientes em uma loja de roupas.

E, para ensinar o antifraude e extrair dele o máximo possível na detecção de fraudes, há duas maneiras: a primeira, e que faz parte do bê-a-bá da análise de risco, é realizar a revisão manual dos pedidos que mais deixaram o algoritmo em dúvida. Esta atividade é importantíssima como tira-teima para diversas compras, sendo capaz de evitar um prejuízo altíssimo ou garantir um lucro interessante.

Já a segunda atividade que você deve fazer para ensinar o algoritmo na detecção de fraudes é retroativa – e muitas vezes acaba sendo ignorada pelo e-commerce em geral, porque há a impressão equivocada de que não gerará resultado imediato para as empresas. Trata-se de mostrar para o antifraude os erros que ele cometeu, com as fraudes que a sua loja eventualmente acabou sofrendo mesmo estando com uma solução implementada. Você quer que o antifraude aprenda? Então você deve ensiná-lo! Não faz sentido?

Treinar o antifraude não é tempo perdido

Nada melhor do que imagens para mostrar como é importante ensinar o antifraude sobre o modelo de risco do seu negócio. Vamos mostrar três gráficos, com dados de vendas enviadas para revisão, vendas negadas e vendas que se transformaram em chargebacks. Eles são hipotéticos e ilustram três cenários completamente distintos: o cenário ideal, com um algoritmo extremamente bem treinado em uma empresa que dás feedbacks ao sistema, revisa pedidos suspeitos manualmente e dá o feedback de eventuais chargebacks ao sistema, e aproveitando ao máximo o serviço.

Já o segundo cenário apresenta um lojista que é mais cauteloso e decide negar automaticamente uma ou mais vendas marcadas apenas como suspeitas pelo algoritmo. Por fim, o terceiro cenário apresenta um lojista que igualmente não confia no que foi apresentado pela solução e acaba aprovando automaticamente transações consideradas suspeitas pela análise automática.

Cenário ideal

ideal

Note como as taxas de pedidos enviados para revisão, pedidos negados e chargebacks se mantêm estáveis ao longo do tempo. Neste cenário, as vendas enviadas para revisão manual tendem a ficar entre 10 e 12%, com a linha roxa, de vendas negadas por fraude, sempre na casa de 3%. Eventualmente, uma ou outra venda pode ser contestada pelo cliente, mas a taxa de chargebacks também se mantém próxima de 0,1%.

Muitas vendas negadas

nega_muito

Uma vez que a análise de risco do e-commerce passou a negar mais vendas consideradas suspeitas, sem revisá-las manualmente, o sistema aprendeu com este comportamento e se tornou extremamente conservador. Desta forma, muito mais vendas acabaram sendo tratadas como suspeitas de antemão, e consequentemente menos vendas foram aprovadas.

Note, porém, a linha pontilhada, que indica a taxa real de fraudes do negócio: ela está muito abaixo da linha de vendas negadas. Isso significa que a loja está aprovando menos pedidos do que poderia (sim, ela está vendendo menos)e, por tabela, está deixando de ganhar um bom dinheiro.

Muitas vendas aprovadas

nega_pouco

Já este caso apresenta um lojista que ignorou a recomendação de revisão, passou a aprovar pedidos considerados suspeitos pelo sistema e não alimentou o sistema posteriormente com dados de chargebacks. Logo, o modelo acabou se tornando permissivo demais, e vendas que inicialmente cairiam em um filtro de suspeita foram aprovadas. O resultado: muitas fraudes acabaram passando, em um nível muito acima do que era esperado, causando um prejuízo importante ao empreendimento.

Concluindo…

Apesar de hipotéticos, os gráficos acima ilustram o conceito do machine learning: o sistema, por mais inteligente que seja, depende claramente da intervenção humana para atingir o máximo do seu potencial. Caso contrário, sem essa dedicação, a solução apresentará resultados muito aquém do esperado.

Tags: , , , , ,

Categoria: Tendências

Sobre Felipe Held: Felipe Held é Head of Marketing & Communications da Konduto, empresa especializada em soluções antifraude. Ver mais artigos deste autor.

  • Todos Fornecedores
  • Plataformas
    • Gestão de Anúncios
    • Atendimento ao Cliente
    • E-Mail Marketing
    • Sistema de ERP
    • Pagamento Online
    • Plataforma de E-Commerce
    • Precificação Dinâmica
  • Serviços
    • Escola Espelicializada
    • Agência Especializada
 
 

Comente esta Matéria




Para incluir uma imagem ao lado do seu comentário, registre-se em Gravatar.