Magna Concursos

Foram encontradas 5.012 questões.

2629125 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: RFB

Suponha que um modelo de classificação binária foi treinado para distinguir e-mails de spam de e-mails legítimos. O modelo foi testado em um conjunto de dados de teste com 200 e-mails, sendo 100 e-mails de spam e 100 e-mails legítimos.

A matriz de confusão é dada por 80 verdadeiros positivos, 85 verdadeiros negativos, 15 falsos positivos (erro tipo 1) e 20 falsos negativos (erro tipo 2).

Nessas condições, o F1-Score do modelo deve ser aproximadamente igual a

 

Provas

Questão presente nas seguintes provas
2629123 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: RFB

O objetivo principal do uso de técnicas de Agrupamento (Clustering) em Análise de Dados é dividir um grande conjunto de dados em subconjuntos, agrupando elementos similares em categorias distintas.

Assinale a opção que indica o tipo de algoritmo que não se enquadra nessa descrição.

 

Provas

Questão presente nas seguintes provas
2614118 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: Consulplan
Orgão: MPE-MG

As ferramentas OLAP (On-Line Analytical Processing) permitem ao usuário analisar o porquê dos resultados obtidos. Atualmente, existe disponível no mercado uma variedade dessas ferramentas com diferentes abordagens. As ferramentas OLAP, que possuem como característica principal permitir o acesso tanto aos bancos de dados relacionais quanto aos multidimensionais, são conhecidas como:

 

Provas

Questão presente nas seguintes provas
2612205 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-ES

Com o objetivo de minimizar os riscos na concessão de crédito, um banco contratou uma empresa especializada em sistemas digitais para desenvolver um classificador de requisitantes de crédito em bons ou maus pagadores. Ao entregar o modelo de classificação para o banco, a empresa afirmou que o classificador havia obtido nos testes uma precisão de mais de 95%. No entanto, após alguns meses, o banco notou que o desempenho do classificador estava aquém do esperado, ficando abaixo de 60%.

Essa situação apresenta um problema de:

 

Provas

Questão presente nas seguintes provas
2612204 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-ES

João e Júlio fazem parte da equipe de Ciência de Dados do TCE/ES e estão realizando um estudo para o desenvolvimento de um classificador binário (classes positiva e negativa) usando Naive Bayes. Com o intuito de dividirem suas tarefas, João ficou responsável por treinar o modelo de classificação, e Júlio, por avaliar o desempenho do modelo. Após o treinamento do modelo, João aplicou-o ao conjunto de teste e enviou um e-mail a Júlio com a matriz de confusão resultante.

Dessa forma, Júlio poderá calcular:

 

Provas

Questão presente nas seguintes provas
2612203 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-ES

Uma Rede Neural Artificial (RNA) feed-forward sem nenhum bias possui uma camada oculta composta de três neurônios e uma camada de saída composta por dois neurônios. A função de ativação da camada oculta e da camada de saída é a Rectified Linear Unit (ReLU), onde

!$ f(x) = \left \{ \begin{matrix} x, se & x \ge 0 \\ 0, se & x<0 \end{matrix} \right. !$

e as matrizes

!$ W !$1 = !$ \begin{bmatrix} 0,1 & -0,2 \\ 0,4 & 0 \\ 0 & 0,2 \end{bmatrix} !$ e !$ W !$2 =!$ \begin{bmatrix} 0,3 & -0,5 & 0,1 \\ 0 & 0,2 & -0,1 \end{bmatrix} !$

representam os pesos entre a camada de entrada e a camada oculta e entre a camada oculta e a camada de saída, respectivamente.

Considerando um vetor de entrada !$ X !$ = !$ \begin{bmatrix} 1 \\ 2 \end{bmatrix} !$, o vetor de saída será:

 

Provas

Questão presente nas seguintes provas
2612202 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-ES

Ao ser contratado por uma empresa da área de e-commerce, o cientista de dados Pedro foi alocado a um importante projeto: desenvolver um classificador para análise de sentimentos considerando as opiniões emitidas no Twitter pelos clientes dessa empresa. Para o início do trabalho, Pedro recebeu um pequeno conjunto de dados de tweets parcialmente anotados, que foram coletados da rede social por intermédio de uma API, usando como palavras-chave na busca os nomes de diversas empresas de e-commerce.

Como parte das escolhas de técnicas a serem utilizadas no projeto, Pedro optou pelo uso de word embeddings, com o objetivo de resolver o problema muito comum em processamento de linguagem natural de:

 

Provas

Questão presente nas seguintes provas
2612192 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-ES

Ana está desenvolvendo um banco de dados analítico a partir da integração de dados do sistema de pagamento com o sistema de gestão de pessoal. No sistema de pagamento, os colaboradores são identificados pelo CPF. No sistema de gestão de pessoal, os colaboradores são identificados pelas iniciais do seu nome concatenadas com sua data de nascimento. Ana sabe que essas chaves primárias naturais apresentam diversas desvantagens e riscos para um ambiente de análise de dados integrados, como seu reuso e alteração de regras de composição, além de questões de desempenho.

Com isso, para carregar os dados no banco de dados analítico, Ana desenvolveu um ETL que substituiu as chaves naturais dos sistemas por uma chave artificial contendo inteiros simples sequenciais, utilizando uma:

 

Provas

Questão presente nas seguintes provas

Como analista de dados, Joaquim quer comparar os dados de vendas dos produtos de bandeiras e torcidas da sua empresa com os resultados da Copa do Mundo ao longo dos anos. Para isso, Joaquim precisa dos dados dos vencedores das Copas que estão disponíveis em https://pt.wikipedia.org/wiki/Lista_de_finais_da_Copa_do_Mundo_FIFA.

No Power BI, para obter os dados disponíveis na URL https://pt.wikipedia.org/wiki/Lista_de_finais_da_Copa_do_Mundo_FIFA, Joaquim deve selecionar a fonte de dados do tipo:

 

Provas

Questão presente nas seguintes provas
2610313 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: SEF-MG

A recente explosão de machine learning e deep learning tornou os tensores populares. TensorFlow e PyTorch são dois frameworks com suporte a API de tensor.

Em relação aos tensores, assinale a opção incorreta.

 

Provas

Questão presente nas seguintes provas