Classificador simples de leads baseado em texto utilizando IA.
Essa solução foi escolhida para facilitar a priorização de contato por parte das equipes de vendas da empresa, dessa forma, podem focar nos leads que apresentam um potencial maior de fechar negócio.
A Prova de Conceito foi focada nos seguintes pontos:
Utilizar um RandomForestClassifier com TfidfVectorizer permite:
- Treinar rapidamente com poucos dados.
- Interpretar resultados com facilidade.
- Ter uma baseline confiável antes de introduzir modelos mais complexos.
O Random Forest fornece informações sobre importância de palavras e pode ser facilmente ajustado com novos dados rotulados. Ele funciona bem mesmo com dados de texto de tamanho moderado sem necessidade de embeddings pesados ou GPU.
Desta forma, temos um modelo com performance aceitável mas que usa muito pouco recurso computacional.
O modelo gerado com scikit-learn é leve, pode ser salvo com joblib e servido com uma API Flask simples, facilitando o deploy inicial em ambientes locais ou cloud.
O dataset usado serve apenas para exemplificação e possui poucos dados. Desta forma, um modelo clássico supervisionado é mais adequado do que redes neurais ou LLMs que exigiriam muitos dados ou fine-tuning.
Amostra do arquivo leads.csv usado para treinar o modelo:
message,label
"Estamos analisando o mercado antes de definir prioridades.",morno
"A proposta é relevante, mas ainda sem urgência.",morno
"Estamos apenas pesquisando o mercado, sem intenção de compra.",frio
"Precisamos da solução implementada até o próximo mês.",quenteEste dataset contém mensagens de leads classificadas em três categorias: quente, morno e frio.
Uso do Streamlit para ter uma interface mais amigável, enquanto mantém a API executando para integrações com outros serviços e aplicações.

pip install -r requirements.txt
python model/train.py
python api.py
streamlit run frontend.pyImportante ressaltar que a API e o Streamlit precisam ser executados em dois terminais simultaneamente.
curl -X POST http://localhost:5000/predict -H "Content-Type: application/json" -d '{"message": "Estamos prontos para implementar essa solução ainda este mês."}'- Integração com CRM
- Permite o treino com dados reais de leads
- Classificação em mais categorias (lead scoring)
- Gerar uma pontuação de cada lead permite priorizar ainda mais os leads e encontrar falhas do modelo com mais facilidade
- Uso de LLMs para embeddings mais precisos
- Ajuste fino com mais dados rotulados
- Implementação de segurança Stateless com JWT na API
- Containerizar as aplicações para deploy com Docker