Magna Concursos

Foram encontradas 5.009 questões.

2065450 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Um usuário deseja importar para o Python, por meio do módulo Pandas, o arquivo no formato csv de nome pesquisa.csv, cujo conteúdo é mostrado a seguir. Esse arquivo se encontra no diretório (ou pasta ou caminho) D:/.

05/06/2008,16:00,2.5788,2.5813,,,

05/06/2008,16:15,2.5768,2.5793,,,

05/06/2008,16:30,2.5744,2.5769,,,

05/06/2008,16:45,2.574,2.5765,,,

05/06/2008,17:00,2.571,2.5735,,,

05/06/2008,17:15,2.5733,2.5758,,,

05/06/2008,17:30,2.5728,2.5753,,,

05/06/2008,17:45,2.5727,2.5752,,,

05/06/2008,18:00,2.5788,2.5813,,,

05/06/2008,18:15,2.5731,2.5756,,,

05/06/2008,18:30,2.5743,2.5768,,,

Considerando essas informações, julgue o próximo item.

O código abaixo permite importar apenas a última linha das duas primeiras colunas do arquivo pesquisa.csv.

import os
os.chdir('D:/')
import pandas
dados=pandas.read_csv('pesquisa.csv',
header=None,usecols=[1,2],
skiprows = range(1,9))

 

Provas

Questão presente nas seguintes provas
2065449 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Com respeito a métodos para imputação de dados, julgue o seguinte item.

O método de imputação K-NN (k-nearest neighbours) leva em consideração os padrões de similaridade presentes no conjunto de dados para predizer os valores faltantes. No entanto, a escolha da função de distância para a aplicação desse método, como, por exemplo, HEOM (heterogeneous euclidean-overlap metric) ou HVDM (heterogeneous value difference metric), pode influenciar significativamente nos resultados da imputação.

 

Provas

Questão presente nas seguintes provas
2065445 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Com respeito a machine learning aplicado, julgue o próximo item.

Suponha que a palavra amor ocorra 1.000 vezes no último livro escrito por certo autor, que escreveu, no total, 10 livros. Nesse caso, se a palavra amor for encontrada em todos os livros desse autor, então o valor do TF-IDF (term frequencyinverse document frequency) referente à palavra amor no último livro escrito será igual a 1/1.000.

 

Provas

Questão presente nas seguintes provas
2065444 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Com respeito a machine learning aplicado, julgue o próximo item.

Stop-words constituem um conjunto de palavras que proporcionam pouca informação para o significado de uma frase.

 

Provas

Questão presente nas seguintes provas
2065443 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Julgue o próximo item, relativo a redes neurais artificiais (RNA).

O algoritmo de backpropagation consiste das fases de propagação e de retro propagação: na primeira, as entradas são passadas através da rede e as previsões de saída são obtidas; na segunda, se calcula o termo de correção dos pesos e, por conseguinte, a atualização dos pesos.

 

Provas

Questão presente nas seguintes provas
2065442 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Julgue o próximo item, relativo a redes neurais artificiais (RNA).

As funções de ativação são elementos importantes nas redes neurais artificiais; essas funções introduzem componente não linear nas redes neurais, fazendo que elas possam aprender mais do que relações lineares entre as variáveis dependentes e independentes, tornando-as capazes de modelar também relações não lineares.

 

Provas

Questão presente nas seguintes provas
2065441 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue.

Considere a tabela abaixo que mostra as distâncias entre cada observação de um conjunto de dados hipotético e os vetores médios (centroides) do cluster correspondente ao final da aplicação do algoritmo de agrupamento k-means. Com base nessa tabela, infere-se que o cluster 1 é constituído pelas observações 2, 5 e 10.

  cluster
observação 1 2 3 4
1 3 8 7 12
2 12 7 5 10
3 7 3 8 10
4 4 8 12 8
5 12 5 7 7
6 2 7 6 10
7 7 12 9 1
8 8 10 4 9
9 5 2 6 6
10 9 8 5 2
 

Provas

Questão presente nas seguintes provas
2065439 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Uma árvore de decisão representa um determinado número de caminhos possíveis de decisão e os resultados de cada um deles, apresentando muitos pontos positivos, ou seja, são fáceis de entender e interpretar. Elas têm processo de previsão completamente transparente e lidam facilmente com diversos atributos numéricos, assim como atributos categóricos, podendo até mesmo classificar dados sem atributos definidos.

De acordo com os aspectos construtivos de uma árvore de decisão, julgue o item a seguir.

A entropia de uma árvore de decisão aborda o aspecto da quantidade de informações que está associada às respostas que podem ser obtidas às perguntas formuladas, representando o grau de incerteza associado aos dados.

 

Provas

Questão presente nas seguintes provas
2065438 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás

Uma árvore de decisão representa um determinado número de caminhos possíveis de decisão e os resultados de cada um deles, apresentando muitos pontos positivos, ou seja, são fáceis de entender e interpretar. Elas têm processo de previsão completamente transparente e lidam facilmente com diversos atributos numéricos, assim como atributos categóricos, podendo até mesmo classificar dados sem atributos definidos.

De acordo com os aspectos construtivos de uma árvore de decisão, julgue o item a seguir.

Se o processo adotado para a construção de árvores de decisão for determinístico, uma forma de obtenção de árvores aleatórias, que compõem as florestas aleatórias, pode ser realizada por meio do bootstrap dos dados, em que cada árvore é treinada com base no resultado de bootstrap_sample (inputs).

 

Provas

Questão presente nas seguintes provas
2059275 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: TELEBRAS

Julgue o próximo item, acerca do mapeamento de fontes de a dados e da arquitetura de business inteligence (BI).

A coleta de dados visa obter informações estratégicas e pode ser realizada de diferentes formas. Nesse sentido: métodos de coleta de dados quantitativos são os menos indicados para previsões de longo prazo, pois são subjetivos; métodos de coleta de dados qualitativos são objetivos, pois se baseiam em experiência, julgamento, intuição, conjecturas, emoções etc.

 

Provas

Questão presente nas seguintes provas