Foram encontradas 5.009 questões.
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: SEFAZ-SE
No aprendizado de máquina, o algoritmo de classificação considerado mais rudimentar e simples, que cria o modelo simplesmente baseado na moda da classe, ou seja, classifica todas as instâncias de acordo com a classe dominante, é conhecido como
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue.
Considere que, em uma análise de agrupamentos por meio de mistura de gaussianas, três distribuições normais com médias \( \mu_1,\mu_2, \mu_3 \) e se referem, respectivamente, aos clusters 1, 2 e 3. Nessa situação, pelo modelo de mistura de gaussianas, o cluster 1 é constituído pelas observações mais próximas da média \( \mu_1 \).
Provas
Assinale a opção que apresenta um princípio de dados abertos em que todos os dados públicos são disponibilizados, não se limitando a documentos, banco de dados, transcrições e gravações audiovisuais.
Provas
Para a realização de clustering utilizando-se o algoritmo k-médias (k-means), o número mínimo de variáveis ou recursos necessário é
Provas
Quanto aos conceitos relativos à arquitetura de dados, julgue o item a seguir.
Os modelos multidimensionais de banco de dados usualmente possuem esquemas mais complexos que os dos modelos relacionais utilizados nos sistemas que processam transações on-line.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Um usuário deseja importar para o Python, por meio do módulo Pandas, o arquivo no formato csv de nome pesquisa.csv, cujo conteúdo é mostrado a seguir. Esse arquivo se encontra no diretório (ou pasta ou caminho) D:/.
|
05/06/2008,16:00,2.5788,2.5813,,, |
|
05/06/2008,16:15,2.5768,2.5793,,, |
|
05/06/2008,16:30,2.5744,2.5769,,, |
|
05/06/2008,16:45,2.574,2.5765,,, |
|
05/06/2008,17:00,2.571,2.5735,,, |
|
05/06/2008,17:15,2.5733,2.5758,,, |
|
05/06/2008,17:30,2.5728,2.5753,,, |
|
05/06/2008,17:45,2.5727,2.5752,,, |
|
05/06/2008,18:00,2.5788,2.5813,,, |
|
05/06/2008,18:15,2.5731,2.5756,,, |
|
05/06/2008,18:30,2.5743,2.5768,,, |
Considerando essas informações, julgue o próximo item.
O código abaixo permite importar corretamente o arquivo pesquisa.csv para ser manuseado como um data frame no Python.
import os
os.chdir('D:/')
import pandas
dados = pandas.read_csv('pesquisa.csv')
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Com respeito a métodos para imputação de dados, julgue o seguinte item.
Um dos passos para tratar com dados faltantes é avaliar o tipo de dado perdido; assim, por exemplo, o método MICE (multivariate imputation by chained equations) não seria aplicável para dados perdidos do tipo MAR (missing at random).
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Com respeito a machine learning aplicado, julgue o próximo item.
O CBOW é um modelo de aprendizado de máquina desenhado para prever contexto com base em determinada palavra.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Com respeito a machine learning aplicado, julgue o próximo item.
Mask RCNN (region-based convolutional neural network) é um método para segmentação de objetos e instâncias que se baseia em detecção, enquanto o método SSAP (single-shot instance segmentation) se baseia em pixels.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
As máquinas de vetores de suporte (SVMs) são originalmente utilizadas para a classificação de dados em duas classes, ou seja, na geração de dicotomias. Nas SVMs com margens rígidas, conjuntos de treinamento linearmente separáveis podem ser classificados. Acerca das características das SVMs com margens rígidas, julgue o item a seguir.
Um conjunto linearmente separável é composto por exemplos que podem ser separados por pelo menos um hiperplano. As SVMs lineares buscam o hiperplano ótimo segundo a teoria do aprendizado estatístico, definido como aquele em que a margem de separação entre as classes presentes nos dados é minimizada.
Provas
Caderno Container