Giter Site home page Giter Site logo

m7-comp-sem-6's Introduction

Ponderada Semana 6 - Computação

Rafael Mateus Zimmer Techio

Introdução

Ao resolver problemas do mundo real a partir de modelos de aprendizagem de máquina, é necessária atenção às mudanças que ocorrem em comportamentos de usuários, viéses e significados com o passar do tempo. Quando há uma mudança nesse sentido que impacta a acurácia do modelo, essa problemática é denominada "concept drift". Dessa forma, abordagens que solucionem ou diminuam os impactos das alterações de conceito são necessárias para engenheiros que utilizam recursos de aprendizagem de máquina para resolução de desafios reais.

Solução Proposta

Como proposta de solução para a problemática de concept drift, a abordagem do paradigma de aprendizado contínuo é uma solução, contemplando os seguintes passos:

image

Assim como todo modelo, é necessária a coleta de dados, pipeline de pré processamento a fim de transformar os dados em algo "entendível" para o algoritmo, o treinamento do modelo em si, alguns testes para a validação de seus resultados e o deploy para que possa ser implementado ou consultado por outros sistemas. Contudo, o paradigma de aprendizado contínuo adiciona uma etapa de testes automatizados periódicos, que podem ser realizados a partir de uma amostra atualizada de dados. Dessa forma, pode-se identificar uma queda na acurácia média do modelo em determinados cenários. Para resolver a questão, uma nova coleta de dados atualizada, com os conceitos corretos, é usada para reiniciar todo o processo de criação do modelo até o deploy de uma nova versão adaptada para o cenário real. Esse processo pode ser realizado automaticamente por meio de alertas como a diminuição das métricas de assertividade do modelo, em períodos de tempo ou até mesmo manualmente por algum administrador.

Conclusão

Contudo, acredito ser inviável a implantação de modelos para a resolução de problemas sem uma estratégia de re-treino em algum momento. Sabe-se que o comportamento humano muda constamente e as variáveis de ambiente também, desse modo, pouquíssimas situações podem dispensar a abordagem de aprendizado contínuo e manterem-se com alta assertividade em seus contextos. Ainda que os gatilhos que disparem o fluxo de criação de uma nova versão do modelo possam ser complexos, é um esforço necessário para as situações que necessitam de soluções de IA, porém, o acionamento humano ainda pode auxiliar. Dessa forma, em ambos os casos, devem haver testes automatizados e que cubram grande parte das possibilidades de cenários possíveis, a fim de gerar métricas e identificar fenômenos como concept drift e outros.

Referências Bibliográficas

BARBOZA, Eduardo Victor Lima; DE ALMEIDA, Paulo Ricardo Lisboa. Challenges on Classifying Data Streams with Concept Drift. In: WORKSHOP DE TESES E DISSERTAÇÕES (WTDBD) - SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 37. , 2022, Búzios. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2022 . p. 126-132. DOI: https://doi.org/10.5753/sbbd_estendido.2022.21854.

m7-comp-sem-6's People

Contributors

rafaeltechio avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.