Foram encontradas 5.009 questões.
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Um usuário deseja importar para o Python, por meio do módulo Pandas, o arquivo no formato csv de nome pesquisa.csv, cujo conteúdo é mostrado a seguir. Esse arquivo se encontra no diretório (ou pasta ou caminho) D:/.
|
05/06/2008,16:00,2.5788,2.5813,,, |
|
05/06/2008,16:15,2.5768,2.5793,,, |
|
05/06/2008,16:30,2.5744,2.5769,,, |
|
05/06/2008,16:45,2.574,2.5765,,, |
|
05/06/2008,17:00,2.571,2.5735,,, |
|
05/06/2008,17:15,2.5733,2.5758,,, |
|
05/06/2008,17:30,2.5728,2.5753,,, |
|
05/06/2008,17:45,2.5727,2.5752,,, |
|
05/06/2008,18:00,2.5788,2.5813,,, |
|
05/06/2008,18:15,2.5731,2.5756,,, |
|
05/06/2008,18:30,2.5743,2.5768,,, |
Considerando essas informações, julgue o próximo item.
O código abaixo permite importar apenas a última linha das duas primeiras colunas do arquivo pesquisa.csv.
import os
os.chdir('D:/')
import pandas
dados=pandas.read_csv('pesquisa.csv',
header=None,usecols=[1,2],
skiprows = range(1,9))
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Com respeito a métodos para imputação de dados, julgue o seguinte item.
O método de imputação K-NN (k-nearest neighbours) leva em consideração os padrões de similaridade presentes no conjunto de dados para predizer os valores faltantes. No entanto, a escolha da função de distância para a aplicação desse método, como, por exemplo, HEOM (heterogeneous euclidean-overlap metric) ou HVDM (heterogeneous value difference metric), pode influenciar significativamente nos resultados da imputação.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Com respeito a machine learning aplicado, julgue o próximo item.
Suponha que a palavra amor ocorra 1.000 vezes no último livro escrito por certo autor, que escreveu, no total, 10 livros. Nesse caso, se a palavra amor for encontrada em todos os livros desse autor, então o valor do TF-IDF (term frequencyinverse document frequency) referente à palavra amor no último livro escrito será igual a 1/1.000.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Com respeito a machine learning aplicado, julgue o próximo item.
Stop-words constituem um conjunto de palavras que proporcionam pouca informação para o significado de uma frase.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Julgue o próximo item, relativo a redes neurais artificiais (RNA).
O algoritmo de backpropagation consiste das fases de propagação e de retro propagação: na primeira, as entradas são passadas através da rede e as previsões de saída são obtidas; na segunda, se calcula o termo de correção dos pesos e, por conseguinte, a atualização dos pesos.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Julgue o próximo item, relativo a redes neurais artificiais (RNA).
As funções de ativação são elementos importantes nas redes neurais artificiais; essas funções introduzem componente não linear nas redes neurais, fazendo que elas possam aprender mais do que relações lineares entre as variáveis dependentes e independentes, tornando-as capazes de modelar também relações não lineares.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue.
Considere a tabela abaixo que mostra as distâncias entre cada observação de um conjunto de dados hipotético e os vetores médios (centroides) do cluster correspondente ao final da aplicação do algoritmo de agrupamento k-means. Com base nessa tabela, infere-se que o cluster 1 é constituído pelas observações 2, 5 e 10.
| cluster | ||||
| observação | 1 | 2 | 3 | 4 |
| 1 | 3 | 8 | 7 | 12 |
| 2 | 12 | 7 | 5 | 10 |
| 3 | 7 | 3 | 8 | 10 |
| 4 | 4 | 8 | 12 | 8 |
| 5 | 12 | 5 | 7 | 7 |
| 6 | 2 | 7 | 6 | 10 |
| 7 | 7 | 12 | 9 | 1 |
| 8 | 8 | 10 | 4 | 9 |
| 9 | 5 | 2 | 6 | 6 |
| 10 | 9 | 8 | 5 | 2 |
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Uma árvore de decisão representa um determinado número de caminhos possíveis de decisão e os resultados de cada um deles, apresentando muitos pontos positivos, ou seja, são fáceis de entender e interpretar. Elas têm processo de previsão completamente transparente e lidam facilmente com diversos atributos numéricos, assim como atributos categóricos, podendo até mesmo classificar dados sem atributos definidos.
De acordo com os aspectos construtivos de uma árvore de decisão, julgue o item a seguir.
A entropia de uma árvore de decisão aborda o aspecto da quantidade de informações que está associada às respostas que podem ser obtidas às perguntas formuladas, representando o grau de incerteza associado aos dados.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Uma árvore de decisão representa um determinado número de caminhos possíveis de decisão e os resultados de cada um deles, apresentando muitos pontos positivos, ou seja, são fáceis de entender e interpretar. Elas têm processo de previsão completamente transparente e lidam facilmente com diversos atributos numéricos, assim como atributos categóricos, podendo até mesmo classificar dados sem atributos definidos.
De acordo com os aspectos construtivos de uma árvore de decisão, julgue o item a seguir.
Se o processo adotado para a construção de árvores de decisão for determinístico, uma forma de obtenção de árvores aleatórias, que compõem as florestas aleatórias, pode ser realizada por meio do bootstrap dos dados, em que cada árvore é treinada com base no resultado de bootstrap_sample (inputs).
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: TELEBRAS
Julgue o próximo item, acerca do mapeamento de fontes de a dados e da arquitetura de business inteligence (BI).
A coleta de dados visa obter informações estratégicas e pode ser realizada de diferentes formas. Nesse sentido: métodos de coleta de dados quantitativos são os menos indicados para previsões de longo prazo, pois são subjetivos; métodos de coleta de dados qualitativos são objetivos, pois se baseiam em experiência, julgamento, intuição, conjecturas, emoções etc.
Provas
Caderno Container