Questões do Concurso MPE-SC - FGV

2218573 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

Provas:

Analista - Dados e Pesquisas
Provas ×

ProgramaçãoLinguagem R

No contexto da linguagem de programação R, analise as afirmativas a seguir.

I. Vetores (vectors) são listas de itens que devem ter o mesmo tipo.

II. R trabalha com vários tipos de dados (data types), numéricos, lógicos e textuais, mas as variáveis podem mudar de tipo mesmo depois da instanciação.

III. Os itens de uma lista (list) não podem ser substituídos. São permitidas apenas a inserção e a remoção de itens.

Está correto somente o que se afirma em:

Provas

Questão presente nas seguintes provas

2218572 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

Provas:

Analista - Dados e Pesquisas
Provas ×

ProgramaçãoLinguagem R

Analise o código da linguagem de programação R a seguir.

xpto <- array(c(1:24), dim = c(4, 3, 2))
print (xpto[3, 2, 1])

Na execução desse código, o print produz o valor:

Provas

Questão presente nas seguintes provas

2218571 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

Provas:

Analista - Dados e Pesquisas
Provas ×

ProgramaçãoLinguagem R

No contexto da linguagem de programação R, analise o código a seguir.

for (x in 1:10) {

if (x >= 4) {

print(x)
next }

if (x == 8) {break}

}

O número de linhas exibidas pela execução desse código é:

Provas

Questão presente nas seguintes provas

2218570 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

Provas:

Analista - Dados e Pesquisas
Provas ×

Inteligência ArtificialMachine LearningAplicaçõesPLN: Processamento de Linguagem Natural

Um problema comum no processamento de texto é o tratamento de termos compostos por mais de um token, tais como “Ministério Público”, tal que represente uma unidade linguística distinta, em particular na construção de modelos de linguagem.

Considerando o problema acima descrito, a alternativa que apresenta uma técnica usada para sua resolução é:

Provas

Questão presente nas seguintes provas

2218569 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

Provas:

Analista - Dados e Pesquisas
Provas ×

Inteligência ArtificialMachine LearningAplicaçõesPLN: Processamento de Linguagem Natural

O método Latent Dirichlet Allocation (LDA) é popularmente utilizado para a construção de modelos de tópicos devido a sua flexibilidade e robustez, particularmente em grandes quantidades de texto. Ao mencionar a escolha do LDA em um projeto, um analista foi questionado sobre que aspectos caracterizam a flexibilidade do modelo, especialmente em comparação a um modelo pLSA.

O analista respondeu corretamente:

Provas

Questão presente nas seguintes provas

2218568 Ano: 2022
Disciplina: Estatística
Banca: FGV
Orgão: MPE-SC

Provas:

Analista - Dados e Pesquisas
Provas ×

Um modelo semântico vetorial foi criado com a seguinte definição:

!$ v(w)_i = tf(w, d_i) \cdot idf(w, D) !$

onde !$ v !$ é o vetor correspondente à palavra !$ w !$, !$ d_i !$ é o i-ésimo documento da coleção !$ D !$ de artigos da Wikipédia, ordenados alfabeticamente por título, e !$ tf !$ e !$ idf !$ são, respectivamente, as funções de frequência de termo e inverso da frequência em documentos.

A alternativa que classifica corretamente o modelo acima descrito e apresenta a razão correta para a classificação é:

Provas

Questão presente nas seguintes provas

2218567 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

Provas:

Analista - Dados e Pesquisas
Provas ×

Inteligência ArtificialMachine LearningAplicaçõesPLN: Processamento de Linguagem Natural

A atividade de classificação de documentos envolve um grande número de tarefas de processamento de linguagem natural, o que pode levar a dúvidas quanto a sua aplicação.

A alternativa que contém apenas tarefas que sejam exemplos de classificação de documentos é:

Provas

Questão presente nas seguintes provas

2218566 Ano: 2022
Disciplina: Estatística
Banca: FGV
Orgão: MPE-SC

Provas:

Analista - Dados e Pesquisas
Provas ×

Para realizar o agrupamento de um conjunto de 4 observações (A, B, C e D) foi decidido usar o método de agrupamento hierárquico aglomerativo com ligação simples (single-linkage).

A matriz de distância inicial entre os elementos é apresentada a seguir.

	A	B	C	D
A	0.0	3.5	4.0	1.5
B	4.0	0.0	0.5	3.0
C	3.0	1.0	0.0	3.5
D	2.0	2.5	3.5	0.0

Considerando essas informações, a matriz de distância obtida após o primeiro passo do agrupamento é:

Provas

Questão presente nas seguintes provas

2218565 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

Provas:

Analista - Dados e Pesquisas
Provas ×

Inteligência ArtificialMachine LearningAlgoritmosEnsembles

A aplicação do algoritmo AdaBoost, utilizando classificadores SVM, permitiu a obtenção de um modelo classificador de sinais sonoros com excelente precisão. Entretanto, esse modelo possui requisitos computacionais além da capacidade da plataforma onde se deseja aplicá-lo.

Considerando o problema acima descrito, a técnica a ser utilizada para contornar o problema é:

Provas

Questão presente nas seguintes provas

2218564 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-SC

Provas:

Analista - Dados e Pesquisas
Provas ×

Inteligência ArtificialMachine LearningAlgoritmosRandom Forests

O método random forests para classificação ou regressão potencializa alguns benefícios das árvores de decisão e por isso é preferido em certas situações.

O uso de random forests seria vantajoso em relação à árvore de decisão no seguinte caso: