Prova Completa: Analista de Sistemas (USP - FUVEST

3736460 Ano: 2025
Disciplina: TI - Banco de Dados
Banca: FUVEST
Orgão: USP

Provas:

Analista de Sistemas
Provas ×

Banco de Dados Relacional
SQL

As tabelas, a seguir, foram criadas no banco de dados relacional para armazenar informações sobre vendas:

CREATE TABLE Clientes ( Cliente_ID INT PRIMARY KEY, Nome VARCHAR(100), Cidade VARCHAR(100), Estado CHAR(2) );
CREATE TABLE Pedidos ( Pedido_ID INT PRIMARY KEY, Cliente_ID INT, Data_Pedido DATE, Valor_Total DECIMAL(10,2), FOREIGN KEY (Cliente_ID) REFERENCES Clientes(Cliente_ID) );

A consulta SQL, a seguir, retorna quais resultados?
SELECT c.Nome, COUNT(p.Pedido_ID) AS Num_Pedidos, COALESCE(SUM(p.Valor_Total), 0) AS Total_Gasto FROM Clientes c LEFT JOIN Pedidos p ON c.Cliente_ID = p.Cliente_ID WHERE p.Data_Pedido >= '2025-02-01' GROUP BY c.Nome HAVING COUNT(p.Pedido_ID) >= 1;

A

Retorna todos os clientes, independentemente de terem feito pedidos, mas exibe NULL no campo Total_Gasto para aqueles que não realizaram compras.

B

Retorna apenas os clientes que fizeram pedidos antes de 01/02/2025, pois a condição no WHERE exclui pedidos posteriores.

C

Retorna os clientes que fizeram ao menos um pedido a partir de 01/02/2025, incluindo seu número de pedidos e o total gasto.

D

Retorna os clientes que fizeram pedidos a partir de 01/02/2025, mas pode incluir clientes sem pedidos devido ao LEFT JOIN.

E

Retorna erro, pois a cláusula HAVING não pode ser usada com COUNT() dessa maneira.

Provas

Questão presente nas seguintes provas

3736459 Ano: 2025
Disciplina: TI - Banco de Dados
Banca: FUVEST
Orgão: USP

Provas:

Analista de Sistemas
Provas ×

Banco de Dados RelacionalNormalização

A tabela a seguir contém informações sobre pedidos de clientes em uma loja. No entanto, essa tabela apresenta redundâncias e dependências parciais, indicando que não está normalizada.

Tabela Pedidos (forma não normalizada)
Pedido_ID	Cliente_Nome	Cliente_Endereço	Produto_Nome	Quantidade	Preço_Unitário
1	João Silva	Rua A, 123	Produto A	2	50,00
1	João Silva	Rua A, 123	Produto B	1	30,00
2	Maria Souza	Rua B, 456	Produto A	3	50,00
3	Carlos Lima	Rua C, 789	Produto C	1	20,00
3	Carlos Lima	Rua C, 789	Produto B	2	30,00

Considerando apenas as regras da 1ª e 2ª formas normais (1FN e 2FN), assinale a alternativa que apresenta a correta normalização da tabela apresentada.

A

Tabela Clientes
Cliente_ID	Cliente_Nome	Cliente_Endereço
1	João Silva	Rua A, 123
2	Maria Souza	Rua B, 456
3	Carlos Lima	Rua C, 789

Tabela Produtos
Produto_ID	Produto_Nome	Preço_Unitário
1	Produto A	50,00
2	Produto B	30,00
3	Produto C	20,00

Tabela Pedidos
Pedido_ID	Cliente_ID
1	1
2	2
3	3

Tabela Itens_Pedido
Pedido_ID	Produto_ID	Quantidade
1	1	2
1	2	1
2	1	3
3	2	2
3	3	1

B

Tabela Clientes
Cliente_ID	Cliente_Nome	Cliente_Endereço
1	João Silva	Rua A, 123
2	Maria Souza	Rua B, 456
3	Carlos Lima	Rua C, 789

Tabela Pedidos
Pedido_ID	Cliente_Nome	Cliente_Endereço	Produto_Nome	Quantidade	Preço_Unitário
1	João Silva	Rua A, 123	Produto A	2	50,00
1	João Silva	Rua A, 123	Produto B	1	30,00
2	Maria Souza	Rua B, 456	Produto A	3	50,00
3	Carlos Lima	Rua C, 789	Produto C	1	20,00
3	Carlos Lima	Rua C, 789	Produto B	2	30,00

C

Tabela Clientes
Pedido_ID	Cliente_Nome	Cliente_Endereço	Produto_Nome	Quantidade
1	João Silva	Rua A, 123	Produto A	2
1	João Silva	Rua A, 123	Produto B	1
2	Maria Souza	Rua B, 456	Produto A	3
3	Carlos Lima	Rua C, 789	Produto C	1
3	Carlos Lima	Rua C, 789	Produto B	2

D

Tabela Clientes
Cliente_ID	Cliente_Nome	Cliente_Endereço
1	João Silva	Rua A, 123
2	Maria Souza	Rua B, 456
3	Carlos Lima	Rua C, 789

Tabela Pedidos
Pedido_ID	Cliente_ID	Produto_Nome	Quantidade
1	1	Produto A	2
1	1	Produto B	1
2	2	Produto A	3
3	3	Produto C	1
3	3	Produto B	2

E

Tabela Clentes
Cliente_ID	Cliente_Nome	Cliente_Endereço	Produto_Nome	Preço_Unitário
1	João Silva	Rua A, 123	Produto A	50,00
2	Maria Souza	Rua B, 456	Produto B	30,00
3	Carlos Lima	Rua C, 789	Produto A	50,00

Tabela Pedidos
Pedido_ID	Cliente_Nome	Produto_Nome	Quantidade
1	João Silva	Produto A	2
2	Maria Souza	Produto B	1
3	Carlos Lima	Produto A	3

Provas

Questão presente nas seguintes provas

3736458 Ano: 2025
Disciplina: Estatística
Banca: FUVEST
Orgão: USP

Provas:

Analista de Sistemas
Provas ×

Séries TemporaisAnálise de Séries Temporais

Uma empresa do setor financeiro deseja prever a cotação diária de uma ação com base nos preços históricos. Para isso, a equipe de ciência de dados decide utilizar técnicas de modelagem de séries temporais.
A equipe analisou diferentes abordagens e encontraram os seguintes padrões nos dados:
• Os preços seguem uma tendência crescente ao longo do tempo; • Há um padrão sazonal, com aumentos e quedas recorrentes em períodos específicos; • Os valores atuais são fortemente influenciados pelos valores anteriores.

Com base nas características descritas, assinale a alternativa que apresenta a técnica de modelagem de séries temporais mais adequada para capturar esses padrões e gerar previsões precisas.

A

Utilizar Regressão Linear Simples, pois ela assume que os preços das ações sempre seguem uma relação linear com o tempo, independentemente de tendências ou sazonalidades.

B

Aplicar um modelo ARIMA (AutoRegressive Integrated Moving Average), pois ele é eficaz para qualquer tipo de série temporal, inclusive aquelas com sazonalidade complexa e não estacionárias, sem necessidade de ajustes adicionais.

C

Utilizar K-Means Clustering, pois o agrupamento de dias com preços semelhantes permite prever diretamente os valores futuros da ação.

D

Aplicar um Perceptron de Camada Única, pois redes neurais simples são suficientes para prever séries temporais sem a necessidade de considerar padrões sazonais ou de tendência.

E

Utilizar Redes Neurais Recorrentes (RNN) ou LSTMs (Long Short-Term Memory), pois esses modelos são especializados em capturar dependências temporais longas e padrões sazonais complexos em séries temporais.

Provas

Questão presente nas seguintes provas

3736457 Ano: 2025
Disciplina: TI - Desenvolvimento de Sistemas
Banca: FUVEST
Orgão: USP

Provas:

Analista de Sistemas
Provas ×

Linguagens

Em Python, a manipulação de arquivos é essencial para lidar com grandes volumes de dados de forma eficiente. Um Analista de Ciência de Dados precisa abrir, ler e processar um arquivo de texto contendo dados tabulares. Com base nos conceitos corretos de manipulação de arquivos em Python, assinale a alternativa que apresenta a abordagem correta para manipular arquivos.

A

Para abrir um arquivo para leitura, utiliza-se open('arquivo.txt', 'r'). Caso o arquivo não exista, ele será criado automaticamente para evitar erros.

B

Para gravar dados em um arquivo sem sobrescrever seu conteúdo, deve-se abrir o arquivo no modo 'w', como em open('arquivo.txt', 'w'), pois esse modo adiciona novos dados ao final do arquivo sem apagar os já existentes.

C

A função readlines() sempre lê e processa um arquivo de forma otimizada, independentemente do seu tamanho, pois armazena apenas uma linha por vez na memória, garantindo eficiência mesmo para arquivos extremamente grandes.

D

O comando with open('arquivo.txt', 'r') as f: permite que o arquivo seja manipulado e garante seu fechamento automático após o uso, evitando vazamento de recursos. Além disso, essa abordagem permite a leitura de arquivos grandes sem carregar todo o conteúdo para a memória de uma só vez.

E

Em Python, arquivos binários, como imagens e vídeos, não podem ser manipulados, pois a função open() suporta apenas a leitura de arquivos de texto.

Provas

Questão presente nas seguintes provas

3736456 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FUVEST
Orgão: USP

Provas:

Analista de Sistemas
Provas ×

Inteligência ArtificialMachine LearningAplicaçõesPLN: Processamento de Linguagem Natural

Uma plataforma de e-commerce deseja analisar automaticamente as avaliações deixadas pelos clientes nos produtos para determinar se são positivas ou negativas. Para isso, a equipe de ciência de dados está treinando um modelo de aprendizado de máquina para análise de sentimentos. Dado que as avaliações são textos não estruturados, a equipe experimentou diferentes métodos de representação vetorial para transformar os textos em formatos que o modelo pode processar. Após testar diferentes abordagens, eles obtiveram os seguintes resultados em um modelo de classificação de sentimentos:

Representação Vetorial	Acurácia nos Dados de Treinamento	Acurácia nos Dados de Teste
Bag of Words (BoW)	95%	70%
TF-IDF	94%	73%
Word2Vec (CBOW)	90%	80%
BERT (Transformers)	89%	88%

Com base nos resultados apresentados, assinale a alternativa que descreve a melhor escolha de representação vetorial para este problema e sua justificativa.

A

Bag of Words é a melhor escolha, pois obteve a maior acurácia nos dados de treinamento, garantindo que o modelo tenha aprendido melhor os padrões do conjunto de dados.

B

TF-IDF é superior às outras técnicas, pois atribui pesos mais altos às palavras raras e, por isso, obteve um pequeno ganho de acurácia nos dados de teste em comparação ao BoW.

C

Word2Vec (CBOW) é inferior ao BoW e ao TF-IDF, pois não captura bem as características estatísticas das palavras, o que resulta em modelos menos precisos para tarefas de classificação de sentimentos.

D

Bag of Words e Word2Vec devem ser combinados para obter um modelo híbrido, pois BoW traz alta acurácia e Word2Vec melhora a generalização, compensando as fraquezas de cada abordagem.

E

BERT (Transformers) é a melhor escolha, pois teve desempenho mais equilibrado entre os dados de treinamento e teste, indicando que o modelo não está sofrendo de sobreajuste e captura melhor o contexto do texto.

Provas

Questão presente nas seguintes provas

3736455 Ano: 2025
Disciplina: TI - Desenvolvimento de Sistemas
Banca: FUVEST
Orgão: USP

Provas:

Analista de Sistemas
Provas ×

Linguagens

No ecossistema Python, diversas bibliotecas são amplamente utilizadas para diferentes tarefas em ciência de dados, aprendizado de máquina e processamento de linguagem natural (PLN). Considerando as características e aplicações dessas bibliotecas, assinale a alternativa que descreve a funcionalidade principal de uma delas?

A

O spaCy é uma biblioteca especializada em Processamento de Linguagem Natural (PLN), oferecendo suporte para tokenização, lematização, reconhecimento de entidades nomeadas e modelos de linguagem pré-treinados.

B

O TensorFlow é uma biblioteca voltada para manipulação e análise de dados tabulares, oferecendo suporte nativo para consultas SQL e operações eficientes com DataFrames.

C

O Apache Arrow é um framework voltado para a criação e otimização de redes neurais profundas, fornecendo camadas e funções de ativação para treinamento de modelos de aprendizado profundo.

D

A Scikit-learn (Sklearn) é uma biblioteca desenvolvida para visualização avançada de dados, com suporte a gráficos interativos e construção de dashboards dinâmicos.

E

O PyTorch é uma biblioteca especializada exclusivamente na manipulação de arquivos e na aceleração de operações de leitura e escrita, sem aplicação para aprendizado de máquina ou redes neurais. #

Provas

Questão presente nas seguintes provas

3736454 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FUVEST
Orgão: USP

Provas:

Analista de Sistemas
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosOverfitting e Underfitting

Em aprendizado de máquina, underfitting (subajuste) e overfitting (sobreajuste) são problemas que afetam o desempenho dos modelos. Considerando as definições apresentadas, assinale a alternativa que descreve a diferença entre esses dois problemas.

A

Underfitting ocorre quando o modelo se ajusta excessivamente aos dados de treinamento, enquanto overfitting ocorre quando o modelo não aprende o suficiente e generaliza bem para novos dados.

B

Overfitting acontece quando o modelo é muito simples e não consegue capturar padrões nos dados, enquanto underfitting ocorre quando o modelo é muito complexo e memoriza os dados de treinamento.

C

Underfitting ocorre quando o modelo é muito simples e não consegue capturar padrões nos dados, enquanto overfitting ocorre quando o modelo memoriza os dados de treinamento e tem baixo desempenho em novos dados.

D

Underfitting e overfitting são problemas opostos, mas ambos ocorrem apenas quando os dados de treinamento contêm ruídos ou inconsistências.

E

Underfitting e overfitting são sinônimos e indicam que um modelo está generalizando mal os dados de teste, independentemente da complexidade do modelo.

Provas

Questão presente nas seguintes provas

3736453 Ano: 2025
Disciplina: Estatística
Banca: FUVEST
Orgão: USP

Provas:

Analista de Sistemas
Provas ×

Fundamentos
Estatística Descritiva

Uma empresa de e-commerce processa 10 milhões de transações diárias e deseja identificar compras anômalas que possam indicar fraude. Para lidar com esse grande volume de dados, a equipe de ciência de dados decide utilizar o Apache Spark para processar os dados de forma distribuída. A equipe analisou um subconjunto de transações (em dólares):
[35, 42, 38, 40, 1500, 37, 39, 41, 36, 2500, 43, 5000, 38, 44, 3700]
Utilizando o Spark SQL, calcularam a média e o desvio padrão amostral das compras. Um valor é considerado anomalia se estiver acima de 2 desvios padrão da média.
Em relação à situação proposta e à análise, assinale a alternativa que apresenta as transações que podem ser classificadas como anômalas.

Provas

Questão presente nas seguintes provas

3736452 Ano: 2025
Disciplina: TI - Gestão e Governança de TI
Banca: FUVEST
Orgão: USP

Provas:

Analista de Sistemas
Provas ×

Gestão da Informação

Uma empresa do setor varejista deseja melhorar sua tomada de decisão utilizando técnicas de mineração de dados. A equipe de ciência de dados está avaliando análises descritivas e preditivas para diferentes necessidades. Assinale a alternativa que caracteriza, corretamente, esses dois tipos de análise.

A

A análise descritiva busca prever eventos futuros com base em padrões históricos, enquanto a análise preditiva apenas resume os dados sem fazer inferências.

B

A análise preditiva é usada para compreender padrões históricos e tendências passadas, enquanto a análise descritiva emprega algoritmos de aprendizado de máquina para prever eventos futuros.

C

A análise descritiva fornece um resumo dos dados históricos para identificar padrões e tendências, enquanto a análise preditiva utiliza esses padrões para prever comportamentos e eventos futuros.

D

A análise preditiva é baseada apenas em estatísticas descritivas e não emprega técnicas como aprendizado de máquina ou modelagem estatística.

E

A análise descritiva e a análise preditiva são termos intercambiáveis, pois ambas se limitam a descrever dados sem gerar insights para o futuro.

Provas

Questão presente nas seguintes provas

3736451 Ano: 2025
Disciplina: TI - Banco de Dados
Banca: FUVEST
Orgão: USP

Provas:

Analista de Sistemas
Provas ×

Banco de Dados Relacional
Modelagem de Dados

No processo de modelagem de um banco de dados relacional, é importante seguir boas práticas para garantir integridade, eficiência e escalabilidade. Qual das alternativas, a seguir, representa uma prática correta ao projetar um banco de dados relacional?

A

Criar colunas duplicadas em tabelas diferentes para facilitar a busca dos dados e reduzir o tempo de execução das consultas.

B

Evitar a criação de relações entre tabelas, pois junções (JOINs) podem prejudicar a performance das consultas em bancos relacionais.

C

Armazenar todos os dados em um único arquivo CSV, pois facilita a manipulação sem necessidade de um sistema gerenciador de banco de dados (SGBD).

D

Utilizar chaves primárias (PK) para identificar unicamente cada registro em uma tabela, garantindo integridade e evitando registros duplicados.

E

Utilizar sempre nomes genéricos para tabelas e colunas, como "Tabela1" e "DadoX", pois simplifica a manutenção do banco de dados.

Comentários

×