4051296 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: TCU

Provas:

Auditor Federal de Controle Externo - TI
Provas ×

Acerca de data warehouse, data lake, data mesh, CI/CD e ETL, julgue o item a seguir.

Como data warehouse é não volátil, a etapa intermediária do ETL deve efetuar todos os tratamentos necessários nos dados para melhorar a sua qualidade.

Provas

Questão presente nas seguintes provas

4050836 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FEPESE
Orgão: Polícia Científica-SC

Provas:

Perito Oficial Criminal - Informática
Provas ×

Inteligência ArtificialConceitos e Fundamentos de IA

Analise as afirmativas abaixo sobre Deep Learning.

1. É um tipo ou subconjunto de machine learning ou aprendizagem de máquina.
2. Trabalha sempre com aprendizado não supervisionado, no qual o aprendizado emerge naturalmente através dos nós da rede.
3. Emprega redes neurais artificiais multicamadas, atribuindo pesos e vieses distintos em camadas e nós, ou neurônios artificais, distintos.

Assinale a alternativa que indica todas as afirmativas corretas.

Provas

Questão presente nas seguintes provas

4050823 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FEPESE
Orgão: Polícia Científica-SC

Provas:

Perito Oficial Criminal - Informática
Provas ×

BI: Business IntelligenceOLAP e OLTP

No contexto de bancos de dados multidimensionais, assinale a alternativa que apresenta corretamente a operação de navegação que permite ao usuário descer em uma hierarquia de dados, passando de um nível agregado para um mais detalhado, como de vendas anuais para vendas mensais, ou de uma região para seus estados individuais, aumentando a granularidade e o detalhamento das informações analisadas.

Provas

Questão presente nas seguintes provas

4049999 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FCPC
Orgão: UFC

Provas:

Estatístico
Provas ×

Inteligência ArtificialConceitos e Fundamentos de IA

Sobre a rede neural do tipo perceptron de camada única, assinale a alternativa correta.

Provas

Questão presente nas seguintes provas

4048378 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: SELECON
Orgão: UFRJ

Provas:

Técnico de TI
Provas ×
Técnico de TI - Redes
Provas ×
Técnico de TI - Suporte e Infraestrutura
Provas ×

Inteligência ArtificialConceitos e Fundamentos de IA

Com relação ao uso de ferramentas de inteligência artificial, um dos tipos de modelos de deep learning é treinado em imensas quantidades de dados, tornando-o capaz de entender e gerar linguagem natural e outros tipos de conteúdo para executar uma grande variedade de tarefas. Esse tipo e sua respectiva sigla, em inglês, são chamados de:

Provas

Questão presente nas seguintes provas

4047856 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: SEFAZ-SP

Provas:

Auditor-Fiscal da Receita Estadual - Gestão Tributária
Provas ×

Big Data

A Secretaria da Fazenda de determinado Estado implementou uma solução corporativa para centralizar dados fiscais provenientes de múltiplas fontes heterogêneas: declarações de contribuintes, notas fiscais eletrônicas, dados cadastrais e informações de fiscalizações. A equipe técnica precisava garantir escalabilidade, processamento de grandes volumes e capacidade analítica para identificar irregularidades tributárias. Após análise, optou-se por uma arquitetura que permite armazenar dados brutos em formato nativo, aplicar transformações sob demanda mediante ferramentas de processamento distribuído e disponibilizar estruturas otimizadas para consultas analíticas pelos auditores fiscais, mantendo a governança através de controles transacionais sobre os metadados.

A arquitetura implementada

A

constitui um Data Lakehouse, que combina a flexibilidade do armazenamento de dados brutos em formato nativo com capacidades de processamento estruturado e consultas analíticas otimizadas, aplicando camadas de gerenciamento transacional sobre metadados mediante protocolos como Delta Lake ou Apache Iceberg, viabilizando transformações sob demanda e governança de dados para análises tributárias complexas.

B

representa um Data Lake federado com camadas de virtualização, que integram fontes heterogêneas mediante conectores distribuídos sem replicação física dos dados, aplicando transformações em tempo real através de processamento streaming para disponibilizar visões consolidadas aos usuários fiscais, mantendo os dados originais nos sistemas de origem com acesso mediante queries federadas.

C

corresponde a um Data Warehouse tradicional, pois consolida dados estruturados mediante processos ETL prévios, aplicando modelagem dimensional em esquema estrela para viabilizar consultas OLAP pelos gestores tributários, garantindo consistência transacional através de protocolos ACID nas camadas de apresentação dos dados fiscais consolidados.

D

corresponde a um Data Mart departamental, uma vez que atende exclusivamente às demandas analíticas da área tributária, implementando subconjuntos especializados dos dados corporativos com modelagem otimizada para relatórios gerenciais, utilizando processos de extração incremental dos sistemas transacionais para alimentar as estruturas dimensionais específicas do domínio fiscal.

E

caracteriza um Data Lake convencional, que armazena dados em estado bruto sem aplicar transformações prévias, utilizando o método point to data para suportar volumes massivos de metadados.

Provas

Questão presente nas seguintes provas

4047855 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: SEFAZ-SP

Provas:

Auditor-Fiscal da Receita Estadual - Gestão Tributária
Provas ×

BI: Business IntelligenceETL/ELT

Uma Secretaria da Fazenda Estadual recebeu uma base de dados contendo 2,3 milhões de registros de declarações fiscais para análise de conformidade tributária. Durante a fase de exploração inicial, a equipe técnica identificou diversos problemas: campos de CNPJ com formatações inconsistentes (alguns com pontuação, outros sem), valores monetários registrados com separadores decimais divergentes (vírgula e ponto), datas em formatos distintos (DD/MM/AÄAA, AAAA-MM-DD), campos obrigatórios vazios em aproximadamente 12% dos registros, e a presença de valores extremos de receita bruta (outliers) que distorciam as análises estatísticas. Além disso, a variável "regime tributário" apresentava categorias redundantes devidoa erros de digitação (ex: "Simples Nacional", "SIMPLES NACIONAL", "Simples nacional"). Para viabilizar a análise de risco fiscal e a construção de modelos preditivos, tornou-se necessário aplicar técnicas sistemáticas de preparação dos dados antes do processamento analítico. Considerando as melhores práticas de pré-processamento de dados, o tratamento correto e adequado para essa situação é

A

aplicar tokenização em campos textuais para fragmentar as informações em unidades menores, utilização de técnicas de stemming e lemmatização para uniformizar as categorias de regime tributário, implementação de métodos de detecção de anomalias baseados em Isolation Forest para identificar registros fiscais suspeitos e preenchimento de valores ausentes mediante algoritmos de interpolação linear ou polinomial, assegurando a completude da base de dados para processamento posterior.

B

iniciar com a aplicação de técnicas de feature scaling através de padronização z-score em todas as variáveis numéricas para centralizá-las em média zero e desvio padrão unitário, seguida de codificação ordinal para variáveis categóricas respeitando hierarquias naturais, detecção de outliers multivariados mediante distância de Mahalanobis e imputação de dados faltantes exclusivamente por valores constantes predefinidos conforme regras de negócio tributário, evitando métodos estatísticos que alterem distribuições originais.

C

priorizar, inicialmente, a exclusão automática de todos os registros que apresentem campos obrigatórios vazios, seguida da aplicação de técnicas de winsorização para substituir valores extremos pelos percentis 5 e 95, padronização das strings mediante conversão para maiúsculas e remoção de acentuação, garantindo assim a integridade da base sem necessidade de imputação de dados faltantes que poderia introduzir viés nas análises tributárias.

D

aplicar técnicas de normalização min-max em todas as variáveis numéricas para escaloná-las entre 0 e 1, realizar a codificação one-hot encoding nas variáveis categóricas incluindo a variável regime tributário, implementar detecção de outliers através do método de Tukey (IQR) com remoção automática dos valores identificados e utilizar forward fill para preencher dados faltantes sequencialmente, preservando a ordenação temporal dos registros fiscais.

E

padronizar formatos mediante expressões regulares para unificar CNPJ, valores monetários e datas em padrões consistentes, tratamento de dados faltantes através de análise contextual para decidir entre imputação (por média, mediana ou algoritmos como KNN) ou exclusão baseada em criticidade, normalização de texto com conversão para caixa baixa, remoção de espaços extras para eliminar duplicatas categóricas e análise criteriosa de outliers distinguindo valores legítimos de erros de registro antes de qualquer ação corretiva.

Provas

Questão presente nas seguintes provas

4047853 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: SEFAZ-SP

Provas:

Auditor-Fiscal da Receita Estadual - Gestão Tributária
Provas ×

No desenvolvimento de um modelo de detecção de contribuintes com alto risco de simulação de operações, após definir claramente com a área de fiscalização quais tipos de fraude serão priorizados, quais indicadores de negócio serão acompanhados (como aumento de autos de infração qualificados e redução de fiscalizações improdutivas) e quais restrições legais e operacionais existem para uso do modelo, a equipe de uma Secretaria da Fazenda registra esses critérios e alinha expectativas com a alta gestão. Com base na metodologia CRISP-DM, essa descrição se encaixa principalmente na fase de

Provas

Questão presente nas seguintes provas

4047723 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: SEFAZ-SP

Provas:

Auditor-Fiscal da Receita Estadual - TI
Provas ×

Big Data

Uma equipe de auditoria possui uma tabela de NF-e com mais de 1 bilhão de registros em um pyspark.sgl.DataFrame chamado df. A auditora deseja inspecionar apenas 1.000 registros localmente em seu notebook, usando funcionalidades avangadas de pandas para buscar inconsisténcias. Nesse cenário, a abordagem em PySpark mais apropriada para gerar esses registros em um pandas. DataFrame, minimizando o risco de estouro de memória no ambiente local é:

Provas

Questão presente nas seguintes provas

4047722 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: SEFAZ-SP

Provas:

Auditor-Fiscal da Receita Estadual - TI
Provas ×

Uma Secretaria da Fazenda pretende, ao mesmo tempo:

I. prever o valor de arrecadação mensal de ICMS para os próximos meses;
II. classificar cada declaração de contribuinte em “alto risco” ou “baixo risco” para fins de seleção de auditoria.

Considerando os tipos de modelos de aprendizado de maquina, a combinação de tarefas que está conceitualmente alinhada com esses objetivos é: