Uma equipe de ciência de dados esta desenvolvendo um modelo de risco para identificar empresas envolvidas na emissão de
notas frias, usando dados de NF-e, escriturações fiscais digitais, cadastros, histérico de autuações e cruzamentos bancários.
Foram definidas as seguintes atividades:
1. Definir objetivos de negócio (ex.: aumentar em 10% a recuperação de crédito em operações com notas frias, mantendo o numero de fiscalizações).
2. Mapear as fontes de dados disponíveis (NF-e, cadastros, autuações) e avaliar sua qualidade e completude.
3. Selecionar técnicas de modelagem (ex.: redes neurais) e definir a estratégia de validação.
4. Definir métricas técnicas de avaliação (ex.: recall em top-k contribuintes, precisão por faixa de risco) alinhadas aos objetivos de negócio.
5. Planejar a integração do score ao sistema de seleção de contribuintes, incluindo monitoramento e possíveis recalibrações.
A correlação mais consistente dessas atividades as fases do modelo CRISP-DM esta em:
1. Definir objetivos de negócio (ex.: aumentar em 10% a recuperação de crédito em operações com notas frias, mantendo o numero de fiscalizações).
2. Mapear as fontes de dados disponíveis (NF-e, cadastros, autuações) e avaliar sua qualidade e completude.
3. Selecionar técnicas de modelagem (ex.: redes neurais) e definir a estratégia de validação.
4. Definir métricas técnicas de avaliação (ex.: recall em top-k contribuintes, precisão por faixa de risco) alinhadas aos objetivos de negócio.
5. Planejar a integração do score ao sistema de seleção de contribuintes, incluindo monitoramento e possíveis recalibrações.
A correlação mais consistente dessas atividades as fases do modelo CRISP-DM esta em:
Provas
Questão presente nas seguintes provas