Foram encontradas 5.009 questões.
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: SERPRO
Sobre as técnicas de classificação em aprendizado de máquina, julgue o item a seguir.
As árvores de decisão apresentam significativa independência dos dados de treinamento, o que garante forte estabilidade dos caminhos em caso de mudanças nos dados.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: SERPRO
No que se refere a técnicas de regressão, técnicas de agrupamento e aprendizado profundo, julgue o item a seguir.
Nos agrupamentos hierárquicos, um dendrograma é uma árvore que controla quando os clusters são criados e que determina qual é a métrica das distâncias.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: SERPRO
Dados ausentes são muito comuns em aplicações que envolvem preenchimentos de formulários. Para o seu tratamento estatístico, encontra-se, na literatura, uma taxonomia para o mecanismo gerador de dados ausentes que os classifica em tipos como MAR (missing at random), MCAR (missing completely at random) e MNAR (missing not at random).
Considerando essas informações, julgue o item a seguir, relativos ao tratamento de dados ausentes.
Geralmente, os dados ausentes do tipo MNAR são ignoráveis por não haver relação entre o processo gerador de dados ausentes e os parâmetros que são objeto de estudo estatístico.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: SERPRO
Com relação aos fundamentos do big data, julgue o item a seguir.
No que se refere aos três Vs do big data, o termo volume refere-se a dados que, atualmente, não são estruturados nem armazenados em tabelas relacionais, o que torna sua análise mais complexa.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: SERPRO
Acerca dos conceitos de ingestão de dados, julgue o item a seguir.
No ambiente de ingestão de dados, CDC refere-se ao controle distribuído de computação de dados coletados remotamente para o ambiente de análise.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: SERPRO
Sobre as técnicas de classificação em aprendizado de máquina, julgue o item a seguir.
Devido ao fato de pressupor independência entre atributos, o algoritmo Naive Bayes é capaz de realizar, com precisão, o treinamento de um modelo com uma quantidade reduzida de amostras.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: SERPRO
Julgue o item a seguir relativos a conceitos de ingestão de dados estruturados, semiestruturados, não estruturados e em streaming.
Os dados não estruturados constam de bancos de dados relacionais que são eminentemente pesquisáveis tanto por meio de consultas realizadas por humanos quanto por meio daquelas realizadas por algoritmos que usam tipos de dados e nomes de campos, como alfabéticos ou numéricos, moeda ou data.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: SERPRO
Julgue o item a seguir, referentes a conceitos e especificidades de MDM (master data management).
A grande diferença entre algoritmos fuzzy matching e stemming reside no fato de que, enquanto o primeiro combina palavras com a mesma raiz linguística, o segundo trabalha com semelhanças de ortografia.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: SERPRO
Considerando o projeto Apache Hadoop, julgue o item a seguir.
As formas de execução do Hadoop podem ser modo local, modo pseudodistribuído ou modo completamente distribuído, e a especificação do seu modo de execução é definida na configuração dos arquivos core-site.xml, hdfs-site.xml e mapred-site.xml.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: SERPRO
Dados ausentes são muito comuns em aplicações que envolvem preenchimentos de formulários. Para o seu tratamento estatístico, encontra-se, na literatura, uma taxonomia para o mecanismo gerador de dados ausentes que os classifica em tipos como MAR (missing at random), MCAR (missing completely at random) e MNAR (missing not at random).
Considerando essas informações, julgue o item a seguir, relativos ao tratamento de dados ausentes.
Os dados ausentes do tipo MAR são aqueles que dependem de fatores — ou variáveis — observáveis, como, por exemplo, o horário de preenchimento de um formulário.
Provas
Caderno Container