Magna Concursos

Foram encontradas 204 questões.

Com relação ao ajuste de dados e a aplicação de modelos preditivos de aprendizado de máquina, analise os itens a seguir.

I. O subajuste (underfitting) indica baixa capacidade preditiva do modelo para os dados de treinamento.
II. O superajuste (overfitting) impacta negativamente a capacidade de generalização do modelo.
III. A presença de ruído nos dados favorece a ocorrência de superajuste (overfitting) do modelo.

Está correto o que se afirma em
 

Provas

Questão presente nas seguintes provas
A popularização da Internet permitiu que grande parcela da população pudesse expressar suas opiniões na forma de fóruns, blogs, avaliações de produtos, entre outros. Assim, deixou de ser necessário que empresas conduzam enquetes ou pesquisas para que possam saber a opinião dos consumidores sobre seus produtos ou de concorrentes. O volume de textos opinativos disponíveis é tal, que a tarefa de ler, sumarizar e organizar de forma útil essas informações é desafiadora. O campo da análise de sentimento, no processamento de linguagem natural, trata justamente dessa necessidade, da automatização da descoberta e da sumarização de opiniões.
Considerando este tema, avalie as afirmativas a seguir.

I. A análise de sentimentos pode ser tratada como um problema de classificação de textos, onde é importante definir se o texto é objetivo ou subjetivo. Textos subjetivos são os de principal interesse nesse campo de pesquisa.

II. A análise de sentimentos pode ser usada para a identificação de avaliações falsas em sites de e-commerce. Uma limitação para essa aplicação é a dificuldade de obtenção de dados para treinamento de modelos, uma vez que a marcação manual de avaliações com opiniões falsas ou enganosas é muitas vezes difícil.

III. Um exemplo de algoritmo supervisionado de análise de sentimentos para avaliações de produtos pode ser resumido nos seguintes passos: extração de frases com padrões predeterminados de opinião; cálculo de um indicador de orientação de cada frase; obtenção da orientação média da avaliação como um todo; e determinação se é positiva ou negativa.

Está correto o que se afirma em
 

Provas

Questão presente nas seguintes provas
Um conceito fundamental na modelagem probabilística de sequências de palavras é o de n-grama. Com relação a esse conceito, analise as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Um modelo bigrama assume a aproximação de que a probabilidade da próxima palavra em uma frase, considerando todas as palavras anteriores, é dada pela probabilidade condicional apenas da palavra imediatamente anterior.

( ) O modelo trigrama é também conhecido como modelo de Markov de terceira ordem.

( ) O cálculo de probabilidades em modelos n-grama é geralmente realizado utilizando logaritmos para evitar o fenômeno do underflow numérico.


As afirmativas são, respectivamente,
 

Provas

Questão presente nas seguintes provas
No campo da mineração de dados existem alguns problemas fundamentais que costumam aparecer com frequência em variados cenários de aplicação. O estudo desses problemas fornece ferramentas ao analista de dados que são aplicáveis em diferentes projetos de mineração de dados. Nesse conjunto se encontram os problemas de determinação de padrões, classificação de dados, segmentação de dados (clustering) e detecção de valores discrepantes (outliers).
Considerando os problemas citados, analise as afirmativas a seguir.

I. Em uma tabela binária esparsa, que representa uma base de dados de transações de clientes, em que as colunas representam cada produto e as linhas cada transação, verifica-se que, frequentemente, três das colunas apresentam simultaneamente o valor 1 para vários registros. Este tipo de análise é um problema de detecção de valores discrepantes.

II. A identificação de consumidores que são similares entre si, para uso no contexto de aplicação de promoções orientadas, constitui um problema de segmentação de dados.

III. O problema de classificação de dados pode ser considerado como supervisionado, pelo fato das relações entre as classes definidas e os demais atributos dos dados serem “aprendidas” pelo modelo.


Está correto o que se afirma em
 

Provas

Questão presente nas seguintes provas
Um analista de dados recebeu a tarefa de estimar os consumidores de uma rede de lojas de varejo digital que têm maior probabilidade de voltar a adquirir determinado produto. A empresa disponibilizou tabelas contendo, respectivamente, a lista de consumidores com seus dados demográficos, os resultados de vendas de cada loja e os dados básicos como endereço e área ocupada por cada loja. Para alimentar sua ferramenta de mineração de dados é necessário agregar as tabelas repassadas em um único banco de dados.
Considerando o modelo de referência CRISP-DM, esse analista encontra-se na etapa de
 

Provas

Questão presente nas seguintes provas

Dez cidadãos com processos na Justiça entraram com o pedido de gratuidade, como mostra o quadro abaixo. A Justiça determinou que as condições para concessão de gratuidade eram: o cidadão ser casado, ter pelo menos um filho e estar desempregado. Foi então pedido a um analista que determinasse quantos cidadãos se enquadravam nas referidas condições.

Cidadão Casado Nº de filhos Empregado
A Sim 1 Sim
B Sim 2 Não
C Não 1 Não
D Não 0 Não
E Sim 1 Sim
F Sim 3 Não
G Sim 0 Não
H Não 1 Não
I Sim 4 Não
J Não 2 Sim

O analista resolveu utilizar uma tabela dinâmica no Excel para determinar esse número.

 

Provas

Questão presente nas seguintes provas
Um determinado cartório registrou a informação da distribuição do número de serviços gratuitos oferecidos a 60 famílias carentes em determinado mês do ano.
As informações estão sumarizadas na tabela a seguir.

Enunciado 4144511-1

Sobre as medidas descritivas associadas a esses dados, assinale a afirmativa correta.
 

Provas

Questão presente nas seguintes provas
Três funcionários de uma sociedade empresária executam uma mesma tarefa rotineira, mas importante para o faturamento da sociedade.
O tempo médio de execução da tarefa dos funcionários, em minutos, e suas respectivas variâncias, estão na tabela abaixo.

Enunciado 4144510-1

Sobre a variabilidade relativa da execução da tarefa, assinale a afirmativa correta.
 

Provas

Questão presente nas seguintes provas
O setor de recursos humanos de uma sociedade empresária avaliou, com notas de 0 a 5, quatro candidatos ao cargo de gerente, digamos A, B, C e D, considerando quatro atributos: organização, liderança, discrição e iniciativa.
O resultado da avaliação encontra-se no gráfico a seguir.

Enunciado 4144509-1


Se considerarmos a média dos atributos para seleção do candidato, assinale a afirmativa correta acerca do candidato a ser escolhido.
 

Provas

Questão presente nas seguintes provas
Um analista do Tribunal de Contas realizou um estudo para tentar prever o gasto com passagens áreas com os servidores do tribunal.
Nesse estudo, ele levou em consideração as seguintes variáveis:
1. A distância entre o local de origem e o local de destino. 2. Se o servidor é de nível médio ou superior. 3. Se o servidor tem direito a bagagem ou não.
Essas variáveis são dos seguintes tipos, respectivamente:
 

Provas

Questão presente nas seguintes provas