Foram encontradas 204 questões.
Com relação ao ajuste de dados e a aplicação de modelos
preditivos de aprendizado de máquina, analise os itens a seguir.
I. O subajuste (underfitting) indica baixa capacidade preditiva do modelo para os dados de treinamento.
II. O superajuste (overfitting) impacta negativamente a capacidade de generalização do modelo.
III. A presença de ruído nos dados favorece a ocorrência de superajuste (overfitting) do modelo.
Está correto o que se afirma em
I. O subajuste (underfitting) indica baixa capacidade preditiva do modelo para os dados de treinamento.
II. O superajuste (overfitting) impacta negativamente a capacidade de generalização do modelo.
III. A presença de ruído nos dados favorece a ocorrência de superajuste (overfitting) do modelo.
Está correto o que se afirma em
Provas
Questão presente nas seguintes provas
A popularização da Internet permitiu que grande parcela da
população pudesse expressar suas opiniões na forma de fóruns,
blogs, avaliações de produtos, entre outros. Assim, deixou de ser
necessário que empresas conduzam enquetes ou pesquisas para
que possam saber a opinião dos consumidores sobre seus
produtos ou de concorrentes. O volume de textos opinativos
disponíveis é tal, que a tarefa de ler, sumarizar e organizar de
forma útil essas informações é desafiadora. O campo da análise
de sentimento, no processamento de linguagem natural, trata
justamente dessa necessidade, da automatização da descoberta
e da sumarização de opiniões.
Considerando este tema, avalie as afirmativas a seguir.
I. A análise de sentimentos pode ser tratada como um problema de classificação de textos, onde é importante definir se o texto é objetivo ou subjetivo. Textos subjetivos são os de principal interesse nesse campo de pesquisa.
II. A análise de sentimentos pode ser usada para a identificação de avaliações falsas em sites de e-commerce. Uma limitação para essa aplicação é a dificuldade de obtenção de dados para treinamento de modelos, uma vez que a marcação manual de avaliações com opiniões falsas ou enganosas é muitas vezes difícil.
III. Um exemplo de algoritmo supervisionado de análise de sentimentos para avaliações de produtos pode ser resumido nos seguintes passos: extração de frases com padrões predeterminados de opinião; cálculo de um indicador de orientação de cada frase; obtenção da orientação média da avaliação como um todo; e determinação se é positiva ou negativa.
Está correto o que se afirma em
Considerando este tema, avalie as afirmativas a seguir.
I. A análise de sentimentos pode ser tratada como um problema de classificação de textos, onde é importante definir se o texto é objetivo ou subjetivo. Textos subjetivos são os de principal interesse nesse campo de pesquisa.
II. A análise de sentimentos pode ser usada para a identificação de avaliações falsas em sites de e-commerce. Uma limitação para essa aplicação é a dificuldade de obtenção de dados para treinamento de modelos, uma vez que a marcação manual de avaliações com opiniões falsas ou enganosas é muitas vezes difícil.
III. Um exemplo de algoritmo supervisionado de análise de sentimentos para avaliações de produtos pode ser resumido nos seguintes passos: extração de frases com padrões predeterminados de opinião; cálculo de um indicador de orientação de cada frase; obtenção da orientação média da avaliação como um todo; e determinação se é positiva ou negativa.
Está correto o que se afirma em
Provas
Questão presente nas seguintes provas
Um conceito fundamental na modelagem probabilística de
sequências de palavras é o de n-grama. Com relação a esse
conceito, analise as afirmativas a seguir e assinale (V) para a
verdadeira e (F) para a falsa.
( ) Um modelo bigrama assume a aproximação de que a probabilidade da próxima palavra em uma frase, considerando todas as palavras anteriores, é dada pela probabilidade condicional apenas da palavra imediatamente anterior.
( ) O modelo trigrama é também conhecido como modelo de Markov de terceira ordem.
( ) O cálculo de probabilidades em modelos n-grama é geralmente realizado utilizando logaritmos para evitar o fenômeno do underflow numérico.
As afirmativas são, respectivamente,
( ) Um modelo bigrama assume a aproximação de que a probabilidade da próxima palavra em uma frase, considerando todas as palavras anteriores, é dada pela probabilidade condicional apenas da palavra imediatamente anterior.
( ) O modelo trigrama é também conhecido como modelo de Markov de terceira ordem.
( ) O cálculo de probabilidades em modelos n-grama é geralmente realizado utilizando logaritmos para evitar o fenômeno do underflow numérico.
As afirmativas são, respectivamente,
Provas
Questão presente nas seguintes provas
No campo da mineração de dados existem alguns problemas
fundamentais que costumam aparecer com frequência em
variados cenários de aplicação. O estudo desses problemas
fornece ferramentas ao analista de dados que são aplicáveis em
diferentes projetos de mineração de dados. Nesse conjunto se
encontram os problemas de determinação de padrões,
classificação de dados, segmentação de dados (clustering) e
detecção de valores discrepantes (outliers).
Considerando os problemas citados, analise as afirmativas a seguir.
I. Em uma tabela binária esparsa, que representa uma base de dados de transações de clientes, em que as colunas representam cada produto e as linhas cada transação, verifica-se que, frequentemente, três das colunas apresentam simultaneamente o valor 1 para vários registros. Este tipo de análise é um problema de detecção de valores discrepantes.
II. A identificação de consumidores que são similares entre si, para uso no contexto de aplicação de promoções orientadas, constitui um problema de segmentação de dados.
III. O problema de classificação de dados pode ser considerado como supervisionado, pelo fato das relações entre as classes definidas e os demais atributos dos dados serem “aprendidas” pelo modelo.
Está correto o que se afirma em
Considerando os problemas citados, analise as afirmativas a seguir.
I. Em uma tabela binária esparsa, que representa uma base de dados de transações de clientes, em que as colunas representam cada produto e as linhas cada transação, verifica-se que, frequentemente, três das colunas apresentam simultaneamente o valor 1 para vários registros. Este tipo de análise é um problema de detecção de valores discrepantes.
II. A identificação de consumidores que são similares entre si, para uso no contexto de aplicação de promoções orientadas, constitui um problema de segmentação de dados.
III. O problema de classificação de dados pode ser considerado como supervisionado, pelo fato das relações entre as classes definidas e os demais atributos dos dados serem “aprendidas” pelo modelo.
Está correto o que se afirma em
Provas
Questão presente nas seguintes provas
Um analista de dados recebeu a tarefa de estimar os
consumidores de uma rede de lojas de varejo digital que têm
maior probabilidade de voltar a adquirir determinado produto. A
empresa disponibilizou tabelas contendo, respectivamente, a
lista de consumidores com seus dados demográficos, os
resultados de vendas de cada loja e os dados básicos como
endereço e área ocupada por cada loja. Para alimentar sua
ferramenta de mineração de dados é necessário agregar as
tabelas repassadas em um único banco de dados.
Considerando o modelo de referência CRISP-DM, esse analista encontra-se na etapa de
Considerando o modelo de referência CRISP-DM, esse analista encontra-se na etapa de
Provas
Questão presente nas seguintes provas
Dez cidadãos com processos na Justiça entraram com o pedido de gratuidade, como mostra o quadro abaixo. A Justiça determinou que as condições para concessão de gratuidade eram: o cidadão ser casado, ter pelo menos um filho e estar desempregado. Foi então pedido a um analista que determinasse quantos cidadãos se enquadravam nas referidas condições.
| Cidadão | Casado | Nº de filhos | Empregado |
| A | Sim | 1 | Sim |
| B | Sim | 2 | Não |
| C | Não | 1 | Não |
| D | Não | 0 | Não |
| E | Sim | 1 | Sim |
| F | Sim | 3 | Não |
| G | Sim | 0 | Não |
| H | Não | 1 | Não |
| I | Sim | 4 | Não |
| J | Não | 2 | Sim |
O analista resolveu utilizar uma tabela dinâmica no Excel para determinar esse número.
Provas
Questão presente nas seguintes provas
Um determinado cartório registrou a informação da distribuição
do número de serviços gratuitos oferecidos a 60 famílias carentes
em determinado mês do ano.
As informações estão sumarizadas na tabela a seguir.
Sobre as medidas descritivas associadas a esses dados, assinale a afirmativa correta.
As informações estão sumarizadas na tabela a seguir.
Sobre as medidas descritivas associadas a esses dados, assinale a afirmativa correta.
Provas
Questão presente nas seguintes provas
Três funcionários de uma sociedade empresária executam uma
mesma tarefa rotineira, mas importante para o faturamento da
sociedade.
O tempo médio de execução da tarefa dos funcionários, em minutos, e suas respectivas variâncias, estão na tabela abaixo.
Sobre a variabilidade relativa da execução da tarefa, assinale a afirmativa correta.
O tempo médio de execução da tarefa dos funcionários, em minutos, e suas respectivas variâncias, estão na tabela abaixo.
Sobre a variabilidade relativa da execução da tarefa, assinale a afirmativa correta.
Provas
Questão presente nas seguintes provas
O setor de recursos humanos de uma sociedade empresária
avaliou, com notas de 0 a 5, quatro candidatos ao cargo de
gerente, digamos A, B, C e D, considerando quatro atributos:
organização, liderança, discrição e iniciativa.
O resultado da avaliação encontra-se no gráfico a seguir.
Se considerarmos a média dos atributos para seleção do candidato, assinale a afirmativa correta acerca do candidato a ser escolhido.
O resultado da avaliação encontra-se no gráfico a seguir.
Se considerarmos a média dos atributos para seleção do candidato, assinale a afirmativa correta acerca do candidato a ser escolhido.
Provas
Questão presente nas seguintes provas
Um analista do Tribunal de Contas realizou um estudo para tentar prever o gasto com passagens áreas com os servidores do tribunal.
Nesse estudo, ele levou em consideração as seguintes variáveis:
1. A distância entre o local de origem e o local de destino. 2. Se o servidor é de nível médio ou superior. 3. Se o servidor tem direito a bagagem ou não.
Essas variáveis são dos seguintes tipos, respectivamente:
Nesse estudo, ele levou em consideração as seguintes variáveis:
1. A distância entre o local de origem e o local de destino. 2. Se o servidor é de nível médio ou superior. 3. Se o servidor tem direito a bagagem ou não.
Essas variáveis são dos seguintes tipos, respectivamente:
Provas
Questão presente nas seguintes provas
Cadernos
Caderno Container