Foram encontradas 4.892 questões.
Acerca de data warehouse, data lake, data mesh, CI/CD e ETL, julgue o item a seguir.
Como data warehouse é não volátil, a etapa intermediária do ETL deve efetuar todos os tratamentos necessários nos dados para melhorar a sua qualidade.
Provas
Questão presente nas seguintes provas
Analise as afirmativas abaixo sobre Deep Learning.
1. É um tipo ou subconjunto de machine learning ou aprendizagem de máquina.
2. Trabalha sempre com aprendizado não supervisionado, no qual o aprendizado emerge naturalmente através dos nós da rede.
3. Emprega redes neurais artificiais multicamadas, atribuindo pesos e vieses distintos em camadas e nós, ou neurônios artificais, distintos.
Assinale a alternativa que indica todas as afirmativas corretas.
1. É um tipo ou subconjunto de machine learning ou aprendizagem de máquina.
2. Trabalha sempre com aprendizado não supervisionado, no qual o aprendizado emerge naturalmente através dos nós da rede.
3. Emprega redes neurais artificiais multicamadas, atribuindo pesos e vieses distintos em camadas e nós, ou neurônios artificais, distintos.
Assinale a alternativa que indica todas as afirmativas corretas.
Provas
Questão presente nas seguintes provas
No contexto de bancos de dados multidimensionais, assinale a alternativa que apresenta corretamente a operação de navegação que permite ao usuário descer em uma hierarquia de dados, passando de
um nível agregado para um mais detalhado, como de
vendas anuais para vendas mensais, ou de uma região
para seus estados individuais, aumentando a granularidade e o detalhamento das informações analisadas.
Provas
Questão presente nas seguintes provas
Sobre a rede neural do tipo perceptron de camada única, assinale a alternativa correta.
Provas
Questão presente nas seguintes provas
Com relação ao uso de ferramentas de inteligência artificial,
um dos tipos de modelos de deep learning é treinado em imensas
quantidades de dados, tornando-o capaz de entender e gerar
linguagem natural e outros tipos de conteúdo para executar uma
grande variedade de tarefas. Esse tipo e sua respectiva sigla, em
inglês, são chamados de:
Provas
Questão presente nas seguintes provas
A Secretaria da Fazenda de determinado Estado implementou uma solução corporativa para centralizar dados fiscais provenientes
de múltiplas fontes heterogêneas: declarações de contribuintes, notas fiscais eletrônicas, dados cadastrais e informações de fiscalizações. A equipe técnica precisava garantir escalabilidade, processamento de grandes volumes e capacidade analítica para identificar irregularidades tributárias. Após análise, optou-se por uma arquitetura que permite armazenar dados brutos em formato nativo, aplicar transformações sob demanda mediante ferramentas de processamento distribuído e disponibilizar estruturas otimizadas
para consultas analíticas pelos auditores fiscais, mantendo a governança através de controles transacionais sobre os metadados.
A arquitetura implementada
A arquitetura implementada
Provas
Questão presente nas seguintes provas
Uma Secretaria da Fazenda Estadual recebeu uma base de dados contendo 2,3 milhões de registros de declarações fiscais para
análise de conformidade tributária. Durante a fase de exploração inicial, a equipe técnica identificou diversos problemas: campos de
CNPJ com formatações inconsistentes (alguns com pontuação, outros sem), valores monetários registrados com separadores
decimais divergentes (vírgula e ponto), datas em formatos distintos (DD/MM/AÄAA, AAAA-MM-DD), campos obrigatórios vazios em
aproximadamente 12% dos registros, e a presença de valores extremos de receita bruta (outliers) que distorciam as análises
estatísticas. Além disso, a variável "regime tributário" apresentava categorias redundantes devidoa erros de digitação (ex:
"Simples Nacional", "SIMPLES NACIONAL", "Simples nacional"). Para viabilizar a análise de risco fiscal e a construção de modelos
preditivos, tornou-se necessário aplicar técnicas sistemáticas de preparação dos dados antes do processamento analítico.
Considerando as melhores práticas de pré-processamento de dados, o tratamento correto e adequado para essa situação é
Provas
Questão presente nas seguintes provas
No desenvolvimento de um modelo de detecção de contribuintes com alto risco de simulação de operações, após definir claramente com a área de fiscalização quais tipos de fraude serão priorizados, quais indicadores de negócio serão acompanhados
(como aumento de autos de infração qualificados e redução de fiscalizações improdutivas) e quais restrições legais e
operacionais existem para uso do modelo, a equipe de uma Secretaria da Fazenda registra esses critérios e alinha expectativas
com a alta gestão. Com base na metodologia CRISP-DM, essa descrição se encaixa principalmente na fase de
Provas
Questão presente nas seguintes provas
Uma equipe de auditoria possui uma tabela de NF-e com mais de 1 bilhão de registros em um pyspark.sgl.DataFrame
chamado df. A auditora deseja inspecionar apenas 1.000 registros localmente em seu notebook, usando funcionalidades
avangadas de pandas para buscar inconsisténcias. Nesse cenário, a abordagem em PySpark mais apropriada para gerar esses
registros em um pandas. DataFrame, minimizando o risco de estouro de memória no ambiente local é:
Provas
Questão presente nas seguintes provas
Uma Secretaria da Fazenda pretende, ao mesmo tempo:
I. prever o valor de arrecadação mensal de ICMS para os próximos meses;
II. classificar cada declaração de contribuinte em “alto risco” ou “baixo risco” para fins de seleção de auditoria.
Considerando os tipos de modelos de aprendizado de maquina, a combinação de tarefas que está conceitualmente alinhada com esses objetivos é:
I. prever o valor de arrecadação mensal de ICMS para os próximos meses;
II. classificar cada declaração de contribuinte em “alto risco” ou “baixo risco” para fins de seleção de auditoria.
Considerando os tipos de modelos de aprendizado de maquina, a combinação de tarefas que está conceitualmente alinhada com esses objetivos é:
Provas
Questão presente nas seguintes provas
Cadernos
Caderno Container