Questões do Concurso USP - FUVEST

3686005 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

ProgramaçãoLinguagem R

Considere os dois trechos de código a seguir, ambos escritos na Linguagem R. O primeiro utiliza o pacote tidyverse, enquanto o segundo utiliza caret para o mesmo propósito.

Código 1 (tidyverse)

library(tidyverse)
set.seed(123)
dados <- tibble(
  X1 = rnorm(100),
  X2 = rnorm(100),
  Y = sample(c("A", "B"), 100, replace = TRUE)
)
dados_treino <- dados %>% sample_frac(0.7)
dados_teste <- anti_join(dados, dados_treino)

Código 2 (carret)

library(caret)
set.seed(123)
dados <- data.frame(
  X1 = rnorm(100),
  X2 = rnorm(100),
  Y = sample(c("A", "B"), 100, replace = TRUE)
)
indices <- createDataPartition(dados$Y, p = 0.7,
                               list = FALSE)
dados_treino <- dados[indices, ]
dados_teste <- dados[-indices, ]

Em relação aos códigos apresentados, assinale a alternativa correta.

A

Ambos os códigos garantem que a proporção da variável de saída seja mantida na divisão entre treino e teste, evitando possíveis desbalanceamentos.

B

O primeiro código seleciona uma parte dos dados de maneira totalmente aleatória, sem se preocupar com a distribuição da variável de saída, enquanto o segundo código faz a divisão garantindo que as proporções da variável de saída sejam mantidas nos dois conjuntos.

C

Os dois códigos realizam a divisão dos dados utilizando a mesma estratégia, sem diferenças na forma como as observações são separadas entre treino e teste.

D

O primeiro código apresenta uma inconsistência na forma como o conjunto de teste é gerado, podendo resultar na seleção de observações duplicadas ou na omissão de algumas delas.

E

O segundo código realiza uma divisão aleatória simples, sem nenhuma preocupação com a distribuição da variável de saída entre os conjuntos de treino e teste.

Provas

Questão presente nas seguintes provas

3686004 Ano: 2025
Disciplina: TI - Desenvolvimento de Sistemas
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

Frameworks

Um desenvolvedor foi contratado para criar um sistema web para uma pequena startup que deseja lançar um MVP (Produto Mínimo Viável) de uma plataforma de cursos online.

O objetivo inicial é disponibilizar um catálogo de cursos, permitir o cadastro de usuários e oferecer um painel administrativo para gerenciar os conteúdos.

A startup tem poucos recursos e precisa lançar a plataforma rapidamente. O desenvolvedor deseja escolher um framework que permita crescer e escalar o projeto futuramente, caso o produto tenha sucesso.

Considerando o cenário descrito, assinale a alternativa que apresenta a melhor escolha para o desenvolvedor e sua justificativa.

A

Flask é a melhor opção, pois oferece um ambiente minimalista que permite ao desenvolvedor adicionar apenas os componentes necessários, resultando em um sistema mais leve e otimizado para escalar rapidamente.

B

Flask e Django são igualmente recomendáveis para este caso, pois ambos permitem um desenvolvimento rápido sem grandes diferenças em relação às ferramentas disponíveis por padrão.

C

O Flask é a escolha ideal, pois oferece um suporte nativo para administração de usuários e gerenciamento de banco de dados, eliminando a necessidade de instalar bibliotecas adicionais para essas funções.

D

Django é mais adequado, pois já inclui um painel administrativo embutido, um ORM poderoso e mecanismos de autenticação, acelerando o desenvolvimento e reduzindo o esforço necessário para implementar funcionalidades essenciais.

E

Django não é uma boa escolha, pois sua estrutura rígida e quantidade de funcionalidades embutidas tornam a aplicação pesada e inadequada para MVPs e startups que buscam desenvolvimento ágil.

Provas

Questão presente nas seguintes provas

3686003 Ano: 2025
Disciplina: Informática
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

Internet

Em relação aos principais provedores de serviços de Cloud Computing (AWS, GCP e Azure), assinale a alternativa correta.

A

AWS (Amazon Web Services) é um serviço de cloud computing exclusivo para empresas de grande porte, não oferecendo soluções para pequenas e médias empresas.

B

O Google Cloud Platform (GCP) é amplamente utilizado por empresas que utilizam serviços de redes sociais, como o Facebook, mas não oferece soluções de armazenamento em nuvem.

C

O Microsoft Azure oferece soluções de cloud computing focadas em integração com os sistemas e softwares da Microsoft, como o Windows Server e o Office 365, além de ser amplamente utilizado para hospedar máquinas virtuais.

D

O AWS, GCP e Azure são plataformas de cloud computing que oferecem apenas armazenamento de dados, não disponibilizando outros serviços como computação ou redes.

E

O Microsoft Azure foi o primeiro provedor de serviços de cloud computing a oferecer serviços de IaaS (Infraestrutura como Serviço), enquanto o AWS e o GCP seguiram, posteriormente, essa tendência.

Provas

Questão presente nas seguintes provas

3686002 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

BI: Business Intelligence

Uma empresa está implementando uma estratégia de Business Intelligence (BI) para melhorar a análise de seus dados operacionais. Para isso, a equipe de dados precisa criar dashboards interativos e realizar análises avançadas usando Power BI e Tableau.

Durante o desenvolvimento dos relatórios, os analistas se depararam com os seguintes desafios:

• Precisam criar uma métrica personalizada para calcular a média ponderada de preços com base no volume de vendas.

• Desejam otimizar o tempo de carregamento ao lidar com milhões de registros armazenados em um banco de dados relacional.

• Precisam implementar um filtro dinâmico que permita ao usuário selecionar intervalos de datas personalizados sem afetar cálculos em outros gráficos.

Com base nos desafios acima, assinale a alternativa que apresenta as melhores soluções utilizando as funcionalidades nativas do Power BI e do Tableau.

A

No Power BI, a melhor abordagem é criar uma média ponderada manualmente em Excel antes da importação dos dados, enquanto no Tableau, o filtro dinâmico pode ser configurado apenas com parâmetros fixos.

B

No Power BI, a média ponderada pode ser calculada com DAX usando SUMX(), a otimização de carregamento pode ser feita ativando o DirectQuery e o filtro dinâmico pode ser configurado com um "Slicer de Datas" sem conexões cruzadas. No Tableau, a média ponderada pode ser criada com um campo calculado em LOD (Level of Detail), e o filtro dinâmico pode ser ajustado usando um "Context Filter".

C

No Power BI, a média ponderada deve ser calculada usando somente a função AVERAGE(), e a melhor abordagem para lidar com milhões de registros é importar todos os dados para o modo Import, pois isso sempre melhora a performance. No Tableau, filtros dinâmicos não são possíveis sem alterar os cálculos nos gráficos.

D

No Power BI, cálculos avançados como médias ponderadas exigem a criação de medidas em SQL dentro da fonte de dados, pois DAX não suporta esse tipo de operação. No Tableau, filtros contextuais devem ser evitados, pois reduzem a eficiência dos dashboards.

E

Power BI e Tableau não possuem suporte nativo para cálculos de médias ponderadas e filtros dinâmicos devem ser aplicados, exclusivamente, no banco de dados antes da importação dos dados para otimizar a performance.

Provas

Questão presente nas seguintes provas

3686001 Ano: 2025
Disciplina: TI - Gestão e Governança de TI
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

Gestão da Informação

Uma equipe de cientistas de dados está desenvolvendo um pipeline de ETL (Extract, Transform, Load) para processar grandes volumes de dados diariamente. Para isso, eles decidiram utilizar o Apache Airflow para orquestrar e monitorar o fluxo de trabalho, garantindo a execução das tarefas na ordem correta e com tolerância a falhas.

No Apache Airflow, os DAGs (Directed Acyclic Graphs) são a estrutura principal usada para definir os workflows. Dentro de uma DAG, as tarefas são organizadas e executadas de acordo com suas dependências.

Assinale a alternativa que melhor descreve o funcionamento de um DAG no Apache Airflow.

A

Uma DAG é um conjunto de tarefas organizadas de forma sequencial, onde todas as tarefas devem ser executadas uma após a outra, sem paralelismo.

B

Uma DAG é um modelo de machine learning embutido no Airflow, usado para treinar redes neurais automaticamente, sem a necessidade de definir tarefas manualmente.

C

Uma DAG no Apache Airflow é um script em SQL que permite a execução direta de consultas em bancos de dados sem necessidade de programação em Python, pois o Apache Airflow é uma ferramenta exclusiva para SQL.

D

Uma DAG representa um modelo probabilístico baseado em inteligência artificial, que ajusta, dinamicamente, a execução das tarefas conforme os dados são processados.

E

Uma DAG define um conjunto de tarefas interdependentes, organizadas de forma acíclica, permitindo que algumas tarefas sejam executadas em paralelo, conforme suas dependências são resolvidas.

Provas

Questão presente nas seguintes provas

3686000 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

Data Mining

Uma rede de supermercados deseja entender os padrões de compra dos clientes para organizar melhor seus produtos e otimizar suas estratégias de vendas. Para isso, a equipe de análise de dados decidiu utilizar um algoritmo de descoberta de regras de associação para identificar itens, frequentemente, comprados juntos.

Assinale a alternativa que representa a métrica fundamental para avaliar a relevância de uma regra de associação.

Provas

Questão presente nas seguintes provas

3685999 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

Em aprendizado de máquina, classificadores binários e multiclasses são usados para categorizar dados em duas ou mais classes. Considere os cenários a seguir:

1. Um sistema de detecção de fraudes bancárias, onde cada transação deve ser classificada como fraudulenta ou não fraudulenta.

2. Um modelo de classificação de espécies de flores, onde cada flor pode ser categorizada como setosa, versicolor ou virginica.

Em relação aos cenários apresentados, assinale a alternativa que descreve os modelos mais adequados para cada tipo de problema.

A

O primeiro cenário exige um classificador binário, e um algoritmo adequado seria Regressão Logística, enquanto o segundo exige um classificador multiclasses, podendo ser resolvido com Árvores de Decisão.

B

Ambos os cenários exigem um classificador binário, pois a classificação sempre se baseia em decisões binárias internamente, independentemente do número de classes.

C

O primeiro cenário deve ser tratado com um algoritmo de clusterização, como K-Means, pois detectar fraudes exige agrupar comportamentos similares, enquanto o segundo pode ser resolvido com um modelo de regressão linear.

D

O primeiro cenário pode ser resolvido, apenas, com Redes Neurais Profundas, pois são os únicos modelos capazes de lidar com classificações binárias e multiclasses.

E

O primeiro problema exige aprendizado supervisionado, enquanto o segundo deve ser tratado exclusivamente com métodos de aprendizado não supervisionado, pois a separação das espécies de flores deve ser feita sem um conjunto de dados previamente rotulado.

Provas

Questão presente nas seguintes provas

3685998 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

BI: Business IntelligenceData Warehouse

Uma empresa deseja implementar uma arquitetura de dados robusta para dar suporte à análise e ao processamento diário de informações. A empresa já possui um sistema de OLTP, mas agora precisa de uma solução de OLAP para análise histórica e de tendências. Além disso, a equipe de TI está considerando a criação de Data Marts para áreas de marketing, vendas e finanças, com o objetivo de melhorar a tomada de decisões.

Com base no cenário apresentado, assinale a alternativa que melhor descreve a relação entre Data Marts, OLTP e OLAP.

A

OLTP é utilizado para consultas analíticas complexas e relatórios históricos, enquanto OLAP é usado para transações diárias em tempo real. Data Marts são criados para centralizar dados específicos de uma unidade de negócios de uma organização.

B

OLAP é utilizado para transações diárias e em tempo real, enquanto OLTP é usado para análise de dados históricos. Data Marts são criados para gerenciar os dados operacionais de toda a empresa, com foco em relatórios financeiros.

C

OLTP e OLAP são praticamente intercambiáveis e podem ser usados para transações e consultas analíticas, respectivamente. Data Marts são usados para armazenar dados não estruturados e não são alimentados por OLTP.

D

OLAP é focado em dados não estruturados e em tempo real, enquanto OLTP é utilizado para análises históricas e agregações. Data Marts são criados para centralizar dados operacionais da empresa.

E

OLTP é otimizado para transações rápidas e operações de leitura e escrita em tempo real, enquanto OLAP é utilizado para consultas analíticas e agregações de dados históricos. Data Marts são usados para armazenar subconjuntos de dados específicos para áreas da empresa.

Provas

Questão presente nas seguintes provas

3685997 Ano: 2025
Disciplina: Estatística
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

Estatística Descritiva

Durante uma análise exploratória de dados (EDA), um cientista de dados está avaliando a dispersão de um conjunto de dados financeiros que contém informações sobre variações diárias no preço de uma ação. Ele deseja utilizar uma métrica que atenda os seguintes requisitos:

• Leve em conta todos os valores da amostra para evitar que outliers distorçam excessivamente a análise.

• Seja expressa na mesma unidade de medida dos dados originais, facilitando a interpretação dos resultados.

• Permita comparar a variabilidade entre diferentes ativos, mesmo que tenham médias diferentes.

Dado esse contexto, assinale a alternativa que apresenta a técnica estatística que melhor atende aos requisitos mencionados

Provas

Questão presente nas seguintes provas

3685996 Ano: 2025
Disciplina: TI - Banco de Dados
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

SQLDDLCREATE TABLE
SQLDMLSELECT

Considere a tabela Funcionarios de um banco de dados de uma empresa:

CREATE TABLE Funcionarios (
    id INT PRIMARY KEY,
    nome VARCHAR(100),
    cargo VARCHAR(50),
    salario DECIMAL(10,2)
);

Qual das consultas, a seguir, retorna, corretamente, o nome, o cargo e o salário de todos os funcionários que ganham mais de R$ 3.000,00, ordenados em ordem decrescente de salário?