Magna Concursos

Foram encontradas 5.009 questões.

2218570 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

Um problema comum no processamento de texto é o tratamento de termos compostos por mais de um token, tais como “Ministério Público”, tal que represente uma unidade linguística distinta, em particular na construção de modelos de linguagem.

Considerando o problema acima descrito, a alternativa que apresenta uma técnica usada para sua resolução é:

 

Provas

Questão presente nas seguintes provas
2218569 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

O método Latent Dirichlet Allocation (LDA) é popularmente utilizado para a construção de modelos de tópicos devido a sua flexibilidade e robustez, particularmente em grandes quantidades de texto. Ao mencionar a escolha do LDA em um projeto, um analista foi questionado sobre que aspectos caracterizam a flexibilidade do modelo, especialmente em comparação a um modelo pLSA.

O analista respondeu corretamente:

 

Provas

Questão presente nas seguintes provas
2218567 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

A atividade de classificação de documentos envolve um grande número de tarefas de processamento de linguagem natural, o que pode levar a dúvidas quanto a sua aplicação.

A alternativa que contém apenas tarefas que sejam exemplos de classificação de documentos é:

 

Provas

Questão presente nas seguintes provas
2218565 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

A aplicação do algoritmo AdaBoost, utilizando classificadores SVM, permitiu a obtenção de um modelo classificador de sinais sonoros com excelente precisão. Entretanto, esse modelo possui requisitos computacionais além da capacidade da plataforma onde se deseja aplicá-lo.

Considerando o problema acima descrito, a técnica a ser utilizada para contornar o problema é:

 

Provas

Questão presente nas seguintes provas
2218564 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

O método random forests para classificação ou regressão potencializa alguns benefícios das árvores de decisão e por isso é preferido em certas situações.

O uso de random forests seria vantajoso em relação à árvore de decisão no seguinte caso:

 

Provas

Questão presente nas seguintes provas
2218563 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

Uma biblioteca está classificando os seus frequentadores em grupos literários para facilitar a aquisição e a organização dos livros. Isso foi feito aplicando o algoritmo KNN ao banco de dados de usuários da biblioteca, incluindo alguns dos campos de informação como atributos, tais como idade e nível de formação acadêmica. Em um experimento, uma segunda classificação foi feita usando um conjunto maior de atributos, incluindo ambos de maior ou menor relevância percebida com relação aos grupos definidos.

A segunda classificação tende a ser:

 

Provas

Questão presente nas seguintes provas
2218556 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

Na avaliação de um modelo para detecção de fraude, foi utilizado um conjunto de dados conhecido que resultou na matriz de confusão abaixo.

  Predito
Modelo Fraude Não Fraude
Fraude 4 96
Não Fraude 1 9999

É correto afirmar que o modelo apresenta:

 

Provas

Questão presente nas seguintes provas
2217743 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-DFT

Utilizando a Linguagem R tem-se um objeto x como consta a seguir.

x

## [1] 1 3 4 3 4 <NA>

## Levels: 1 3 4

is.factor(x)

## [1] TRUE

O comando que resulta na soma dos elementos numéricos de x é:

 

Provas

Questão presente nas seguintes provas
2217673 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-DFT

Lino precisa preparar um grande volume de dados para minerar realizando operações de limpeza, adequação de formato, exclusão de brancos e inclusão de novos atributos derivados.

Para realizar o pré-processamento dos dados, Lino deve usar uma ferramenta do tipo:

 

Provas

Questão presente nas seguintes provas
2217672 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-DFT

Maria está explorando a seguinte tabela da base de dados de vendas do mercado HortVega:

IDvenda

ItensComprados

1

Cacau, castanha, cogumelo, chia

2

Cacau, chia

3

Cacau, aveia

4

Castanha, cogumelo, tâmara

Utilizando técnicas de Mineração de Dados, Maria encontrou a seguinte informação:

Se um cliente compra Cacau, a probabilidade de ele comprar chia é de 50%. Cacau => Chia, suporte = 50% e confiança = 66,7%.

Para explorar a base de dados do HortVega, Maria utilizou a técnica de Mineração de Dados:

 

Provas

Questão presente nas seguintes provas