Foram encontradas 518 questões.
Visando a maximizar a eficiência de uma equipe de auditores
fiscais, um sistema de classificação de documentação foi
encomendado à equipe de ciência de dados, com o objetivo de
decidir, com base nos documentos obtidos durante uma
fiscalização, se um exame detalhado de documentação é ou não
necessário.
Idealmente, o sistema permitiria aos auditores direcionar mais tempo às auditorias complexas e agilizar a análise dos casos mais simples, otimizando o custo de pessoal e equipamento especializado. Contudo, não examinar detalhadamente um caso complexo pode custar muito caro ao governo, a ponto de anular quaisquer ganhos obtidos usando o sistema com um pequeno número de erros.
Considerando esse cenário, e o fato de o sistema de classificação responder apenas “sim” ou “não” quanto à necessidade de exame detalhado, a métrica de classificação a ser maximizada pela equipe que irá implementar o sistema é:
Idealmente, o sistema permitiria aos auditores direcionar mais tempo às auditorias complexas e agilizar a análise dos casos mais simples, otimizando o custo de pessoal e equipamento especializado. Contudo, não examinar detalhadamente um caso complexo pode custar muito caro ao governo, a ponto de anular quaisquer ganhos obtidos usando o sistema com um pequeno número de erros.
Considerando esse cenário, e o fato de o sistema de classificação responder apenas “sim” ou “não” quanto à necessidade de exame detalhado, a métrica de classificação a ser maximizada pela equipe que irá implementar o sistema é:
Provas
Questão presente nas seguintes provas
Uma equipe de analistas de dados preparou um modelo preditivo
cuja entrada consiste em planilhas contendo uma matriz de
valores reais entre 1 e 10. Tais planilhas são obtidas de um
sistema externo à equipe. O modelo foi treinado com um
conjunto de planilhas que foi coletado pelos analistas, de forma a
obter uma amostra representativa dos dados a serem utilizados.
A média e o desvio padrão de duas colunas importantes foram
calculados do conjunto de treinamento, como uma forma simples
de verificar a consistência da distribuição dos dados, sendo seus
valores 4,89 e 3,08, respectivamente. O modelo obteve bons
resultados durante sua etapa de testes, com uma precisão de
94%.
Ao iniciar a operação do modelo com planilhas atuais, entretanto, os analistas observaram que o modelo teve um desempenho muito inferior, com precisão de apenas 72%. Investigando as planilhas recebidas, obtiveram a média e o desvio padrão para as duas colunas importantes com valores 5,34 e 3,68, respectivamente.
A explicação mais adequada à situação descrita é:
Ao iniciar a operação do modelo com planilhas atuais, entretanto, os analistas observaram que o modelo teve um desempenho muito inferior, com precisão de apenas 72%. Investigando as planilhas recebidas, obtiveram a média e o desvio padrão para as duas colunas importantes com valores 5,34 e 3,68, respectivamente.
A explicação mais adequada à situação descrita é:
Provas
Questão presente nas seguintes provas
Uma certa organização busca melhorar a qualidade e agilidade do
seu atendimento eletrônico. Para isso um projeto foi criado para
agrupar os e-mails recebidos de acordo com o tipo de problema a
ser resolvido e assim repassá-los para o setor mais apropriado.
A equipe responsável pela implementação do projeto resolveu utilizar um modelo de linguagem recente para representar o máximo possível de informação contida num e-mail em um vetor de dimensão 768. Entretanto, depararam-se com o seguinte problema: as distâncias entre os vetores se mostraram muito pequenas, tornando o agrupamento por diversos algoritmos muito pouco significativo.
Com esse último problema em mente, a sequência mais apropriada de algoritmos a ser aplicada sobre os vetores, de forma a obter um agrupamento significativo dos e-mails, é:
A equipe responsável pela implementação do projeto resolveu utilizar um modelo de linguagem recente para representar o máximo possível de informação contida num e-mail em um vetor de dimensão 768. Entretanto, depararam-se com o seguinte problema: as distâncias entre os vetores se mostraram muito pequenas, tornando o agrupamento por diversos algoritmos muito pouco significativo.
Com esse último problema em mente, a sequência mais apropriada de algoritmos a ser aplicada sobre os vetores, de forma a obter um agrupamento significativo dos e-mails, é:
Provas
Questão presente nas seguintes provas
Flávia, responsável pelo setor de análise de dados de uma rede
de concessionárias de carros, está realizando o pré-processamento dos dados dos clientes da rede. Entre os atributos
do conjunto de dados, estão os CPFs dos clientes, o seu sexo e a
quantidade de carros que eles já compraram na rede.
Esses três atributos podem ser classificados, respectivamente, como:
Esses três atributos podem ser classificados, respectivamente, como:
Provas
Questão presente nas seguintes provas
Alexandre recebe a tarefa de treinar um sistema de detecção de
fraudes no banco em que trabalha. Para isso, ele testa cinco
modelos, M1, M2, M3, M4 e M5, que possuem, respectivamente,
2, 2, 2, 3 e 3 parâmetros. Alexandre realiza uma seleção
bayesiana dos modelos, usando o critério de informação
bayesiano.
Sabendo que o tamanho da amostra é 200 e que os valores maximizados das funções de verossimilhança dos modelos são 0,3; 0,4; 0,5; 0,3 e 0,5, respectivamente, Alexandre seleciona o modelo:
(se necessário, use ln(2) = 0,7; ln(3) = 1,1 e ln(5) = 1,6)
Sabendo que o tamanho da amostra é 200 e que os valores maximizados das funções de verossimilhança dos modelos são 0,3; 0,4; 0,5; 0,3 e 0,5, respectivamente, Alexandre seleciona o modelo:
(se necessário, use ln(2) = 0,7; ln(3) = 1,1 e ln(5) = 1,6)
Provas
Questão presente nas seguintes provas
- Data Mining
- Inteligência ArtificialMachine LearningAplicaçõesPLN: Processamento de Linguagem Natural
Texto 1
Aline, cientista de dados da CVM, foi designada para aferir a
reação à prova da CVM entre os usuários de uma rede social de
textos curtos usando técnicas de análise de sentimentos. Para
isso, ela realiza um processo de KDD. Nesse processo, Aline opta
por representar os textos obtidos da rede social no formato de
vetores reais de baixa dimensionalidade, calculados a partir das
representações das palavras obtidas de um modelo de
linguagem pré-treinado utilizando a técnica word2vec.
Provas
Questão presente nas seguintes provas
Texto 1
Aline, cientista de dados da CVM, foi designada para aferir a
reação à prova da CVM entre os usuários de uma rede social de
textos curtos usando técnicas de análise de sentimentos. Para
isso, ela realiza um processo de KDD. Nesse processo, Aline opta
por representar os textos obtidos da rede social no formato de
vetores reais de baixa dimensionalidade, calculados a partir das
representações das palavras obtidas de um modelo de
linguagem pré-treinado utilizando a técnica word2vec.
Provas
Questão presente nas seguintes provas
As informações são a base de toda tomada de decisão e gestão
de empresas, sendo um diferencial importante o uso de grandes
volumes de dados de diversas fontes.
Nesse contexto, as soluções de Big Data para análise de dados devem ter a capacidade de:
Nesse contexto, as soluções de Big Data para análise de dados devem ter a capacidade de:
Provas
Questão presente nas seguintes provas
O sistema CVMWeb armazena os dados pessoais dos consultores
de valores mobiliários, como nome, telefone e e-mail. Uma
entidade financeira privada solicita, ao setor de recursos
humanos da CVM, os dados de contato dos consultores
cadastrados para oferecer linhas de crédito e financiamento
imobiliário.
Nesse contexto, é correto afirmar que o pedido foi:
Nesse contexto, é correto afirmar que o pedido foi:
Provas
Questão presente nas seguintes provas
O cientista de dados Miguel decidiu buscar um serviço de nuvem
que forneça recursos de computação sob demanda, tais como
servidores, rede, armazenamento e outros, para construir seu
ambiente de análise e exploração de dados, podendo incorporar
sistemas operacionais e aplicativos.
Para isso, Miguel deve contratar o serviço de nuvem:
Para isso, Miguel deve contratar o serviço de nuvem:
Provas
Questão presente nas seguintes provas
Cadernos
Caderno Container