Magna Concursos

Foram encontradas 5.009 questões.

2217525 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-DFT

A tradução automática de texto, embora possua raízes na metade do século passado, vem recebendo melhorias substanciais na última década, alimentadas pelo crescimento do poder computacional, disponibilidade de dados linguísticos e inovações técnicas.

Com relação às inovações, e levando em consideração os recursos mencionados, a alternativa que apresenta apenas vantagens da Tradução Automática Neural (NMT) sobre técnicas de Tradução Automática Estatística (SMT) é:

 

Provas

Questão presente nas seguintes provas
2217524 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-DFT

Um analista precisa construir um modelo de tópicos para uma grande base de documentos legais, mas há uma preocupação quanto à interpretabilidade do modelo e à capacidade de inspecionar os resultados.

Considerando essa preocupação, a técnica mais apropriada para a construção do modelo e a razão da escolha são, respectivamente:

 

Provas

Questão presente nas seguintes provas
2217523 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-DFT

Considere o parágrafo a seguir.

“Os beija-flores são aves de pequeno porte, que medem em média de 6 a 12 centímetros de comprimento e pesam de 2 a 6 gramas. Maioria dos bicos são normalmente longos, mas o formato preciso varia bastante com a espécie e está adaptado ao formato da flor que constitui a base da alimentação de cada tipo de beija-flor.”

E seu sumário, obtido através de um modelo de sumarização automática:

“Os beija-flores são aves de pequeno porte, com os bicos normalmente longos cujo formato varia com a espécie, dependendo do formato da flor que constitui a base da alimentação de cada tipo de beija-flor.”

Com relação à técnica utilizada para essa sumarização, a alternativa que apresenta, respectivamente, o tipo de sumarização realizada e a evidência que nos permite classificá-la é:

 

Provas

Questão presente nas seguintes provas
2217522 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-DFT

Um cientista de dados está ponderando sobre a aplicação de um modelo Paragraph Vector (PV-DM) sobre uma coleção de documentos, no lugar de usar a média de vetores de palavras em cada documento.

Uma razão pela qual ele deveria aplicar PV-DM, e uma contrapartida à sua aplicação, são, respectivamente:

 

Provas

Questão presente nas seguintes provas
2217521 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-DFT

Após concluir sua formação no

<ent type="ORG"
url="http://dbpedia.org/resource/King's_College_London">
King’s College</ent> em
<ent type="" url="http://dbpedia.org/resource/London">
Londres</ent>,
<ent type="PER"
url="http://dbpedia.org/resource/Peter_Higgs">Higgs</ent>
assumiu a cadeira de Teoria Física na Universidade de
Edimburgo.

A respeito das anotações, o tipo correto com o qual a segunda entidade deveria ser preenchida e o propósito dos links contidos no atributo “url” são:

 

Provas

Questão presente nas seguintes provas
2217520 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-DFT

Considere a sentença a seguir.

s: “O acesso ao auditório também pode ser feito através de uma rampa”

Aplicando a função f à sentença, obtém-se o seguinte resultado:

f(s) = “acesso auditório pode ser feito através rampa”

A melhor descrição para a tarefa realizada pela função f é:

 

Provas

Questão presente nas seguintes provas
2217519 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-DFT

Considerando a seguinte matriz de confusão obtida de um experimento de classificação:

real/previsto gato rato

cachorro

gato

10 2 3

rato

5 14 1

cachorro

1 2 12

Os valores corretos das métricas de precisão e recall (revocação/sensibilidade), para a classe rato, são, respectivamente:

 

 
 

Provas

Questão presente nas seguintes provas
2217518 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-DFT

Durante o processo de treinamento e validação de uma rede neural, foi observado o fenômeno de underfitting do modelo, necessitando de ajustes ao procedimento. A arquitetura utilizada foi a Multilayer Perceptron (MLP) e o conjunto de dados foi separado em regime de holdout (50%, 30% e 20% para treinamento, validação e teste, respectivamente).

Dois fatores que podem ter condicionado o fenômeno observado são:

 

Provas

Questão presente nas seguintes provas
2217517 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-DFT

Baseado nos dados de infecções coletados durante semanas anteriores, a Secretaria de Saúde de uma pequena cidade solicitou a criação de um mecanismo para decidir sobre a priorização de vacinas na sua população.

Como resultado, foi criado o modelo de árvore de decisão ilustrado a seguir.

Enunciado 3421732-1

Uma evidência de que esse modelo foi construído usando o algoritmo C4.5 ou uma de suas variantes é:

 

Provas

Questão presente nas seguintes provas
2217516 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-DFT

Após alguns resultados insatisfatórios usando funções de ativação linear em um projeto de rede neural artificial, um cientista de dados resolve tentar outras funções e recebe algumas sugestões de um colega.

Dadas as alternativas abaixo, cada uma representando uma sugestão de função recebida, aquela que apresenta uma função apropriada ao uso como ativação em uma rede neural é:

 

Provas

Questão presente nas seguintes provas