Magna Concursos

Foram encontradas 5.012 questões.

3076579 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Na arquitetura de redes neurais, diferentes funções de ativação são utilizadas nas camadas de neurônios para aplicar transformações não lineares aos dados. Uma dessas funções é a ReLU, conhecida por sua eficácia em diversos modelos de aprendizado profundo.

Ao implementar a função ReLU, um pesquisador deve seguir a fórmula:

 

Provas

Questão presente nas seguintes provas
3076578 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

No gráfico XY, são apresentados pontos que representam duas propriedades de elementos de duas classes, R e S. Os pontos da classe R, representados como círculos, são [(3,5),(3,4),(2,3)], enquanto os pontos da classe S, representados como quadrados, são [(4,3),(4,2),(4,1),(3,1),(2,2)]. É necessário classificar pontos novos, de acordo com o algoritmo K-NN, com K=3, considerando a distância euclidiana.

Enunciado 3328440-1

Nesse contexto, as classes dos pontos [(3,2),(3,3) e (4,4)] são, respectivamente:

 

Provas

Questão presente nas seguintes provas
3076577 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Em processamento de linguagem natural, o modelo Skip-Gram é uma técnica popular para treinar word embeddings.

O treinamento do modelo Skip-Gram destaca-se de outras técnicas, como o Continuous Bag of Words (CBOW), por ter a seguinte característica:

 

Provas

Questão presente nas seguintes provas
3076576 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Um pesquisador iniciante em aprendizado de máquina trabalhava com um modelo de classificação binário com as duas classes equilibradas. Inicialmente, ele fez a avaliação de seu modelo, separando 20% dos dados disponíveis para a avaliação, e o treinou com 80% dos dados, fazendo o processo apenas uma vez. Depois, a pedido de seu chefe, ele trocou a forma de avaliação, separando o conjunto de dados em 10 partes e escolhendo, em 10 rodadas, uma parte diferente para avaliação e as outras para treinamento.

Essas duas formas de avaliar um modelo são conhecidas, respectivamente, como

 

Provas

Questão presente nas seguintes provas
3076575 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Na avaliação de um modelo criado por aprendizado de máquina em um experimento que buscava identificar textos de opinião sobre o desempenho da economia, separando- os dos que não forneciam opinião alguma, só fatos e dados, foi encontrada a seguinte matriz de confusão:

Opinião

Não Opinião

Opinião

440 60

Não Opinião

20 480

Considerando-se que, nessa matriz, as linhas indicam a resposta correta e as colunas indicam a previsão, a acurácia é de

 

Provas

Questão presente nas seguintes provas
3076556 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Um programa em Python contém um vetor unidimensional, de tamanho 20, chamado vetor, criado com o Numpy. Deseja-se obter, em apenas uma expressão, uma matriz de 4 linhas e 5 colunas criada linha a linha a partir dos elementos desse vetor.

Para tal fim, a expressão a ser utilizada é

 

Provas

Questão presente nas seguintes provas
3076554 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Um cientista de dados recebeu um vetor chamado dados contendo valores da renda mensal da população de uma cidade e resolveu obter algumas estatísticas que descrevessem os dados recebidos. A linha de código em R que calcula corretamente a média do vetor dados é

 

Provas

Questão presente nas seguintes provas
3076553 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Um projeto de saúde utiliza a biblioteca Pandas, em Python, para analisar dados biométricos. O conjunto de dados é trabalhado em um DataFrame chamado saude_df, com várias colunas representando medidas típicas de saúde, como o peso e a pressão arterial. Cada linha representa o valor dessas medidas para uma pessoa.

Para selecionar aleatoriamente 20% das linhas do DataFrame e apenas as colunas Peso e Pressão Arterial, pode ser usada a expressão

 

Provas

Questão presente nas seguintes provas
3076552 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Um cientista de dados está trabalhando com um conjunto de dados e usando a linguagem de programação R. O conjunto de dados, chamado dados, consiste em três colunas: ID, Idade e Salario, em que Idade indica um grupo de idade. O cientista de dados precisa calcular a média de Salario para cada grupo de idade. No entanto, ele deve realizar essa tarefa utilizando apenas as funções base do R, sem pacotes adicionais.

Qual função ou conjunto de funções do R ele deve usar para realizar essa tarefa de forma eficiente?

 

Provas

Questão presente nas seguintes provas
3076551 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Um analista de dados está utilizando R e o pacote ggplot2 para criar um gráfico XY apenas com pontos. Ele possui dois vetores, vetor_x e vetor_y, ambos com o mesmo tamanho, representando os valores dos eixos X e Y, respectivamente.

Uma forma correta de criar um gráfico XY básico, apenas com pontos, passando esses vetores como parâmetros é

 

Provas

Questão presente nas seguintes provas