Prova Completa: Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina (USP - FUVEST

3686009 Ano: 2025
Disciplina: TI - Desenvolvimento de Sistemas
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

Qualidade de Software

Uma equipe de desenvolvimento de software está adotando práticas de DevOps para melhorar a qualidade e a velocidade das entregas. Para isso, decidiram implementar um pipeline CI/CD, garantindo que todas as alterações de código sejam testadas e implantadas automaticamente. No fluxo definido, o pipeline segue as etapas:

1. O código é enviado para o repositório remoto, acionando o pipeline.

2. O código é analisado e testado por ferramentas automatizadas.

3. Se os testes passarem, um build é gerado e enviado para o ambiente de staging.

4. O código é revisado e validado antes de ser implantado em produção.

Após algumas execuções do pipeline, a equipe percebeu que, quando há falha nos testes automatizados, o código não é promovido para a próxima etapa. Além disso, alguns da equipe querem que a implantação em produção ocorra automaticamente, enquanto outros preferem que seja necessária uma aprovação manual.

Com base no cenário apresentado, assinale a alternativa correta.

A

Um pipeline CI/CD bem configurado deve sempre implantar, automaticamente, todas as versões do código na produção, independentemente de erros encontrados nos testes.

B

A implantação contínua exige que todas as atualizações passem por uma aprovação manual antes de serem enviadas para produção.

C

A fase de integração contínua tem como objetivo validar e testar, automaticamente, o código após cada alteração, impedindo a progressão de código defeituoso.

D

O uso de um pipeline CI/CD torna desnecessário o controle de versões, pois todas as alterações são gerenciadas, automaticamente, pela ferramenta de integração.

E

Se um erro for encontrado em produção, o pipeline CI/CD, automaticamente, desfaz a última alteração sem necessidade de intervenção manual.

Provas

Questão presente nas seguintes provas

3686008 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

ProgramaçãoPythonNumPy
ProgramaçãoPythonPandas
ProgramaçãoPythonScikit-learn (Sklearn)
ProgramaçãoPythonTensorFlow/Keras

Um cientista de dados deseja analisar um conjunto de dados tabular, pré processá-lo e treinar um modelo de rede neural para prever valores contínuos. Ele utiliza Pandas para manipulação dos dados, Scikit-learn para normalização e TensorFlow/Keras para construir o modelo.

Considere o seguinte código em Python:

import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler
import tensorflow as tf
from tensorflow import keras
# 1. Carregar os dados
df = pd.DataFrame({
    "feature1": [10, 20, 30, 40, 50],
    "feature2": [5, 15, 25, 35, 45],
    "target": [100, 200, 300, 400, 500]
})
# 2. Selecionar apenas as colunas de entrada (features)
X = df[["feature1", "feature2"]]
y = df["target"]
# 3. Normalizar os dados de entrada
scaler = MinMaxScaler()
X_scaled = scaler.fit_transform(X)
# 4. Criar um modelo de rede neural para regressão
modelo = keras.Sequential([
    keras.Input(shape=(X_scaled.shape[1],)), # Definir a camada de entrada explicitamente
    tf.keras.layers.Dense(16, activation='relu'),
    tf.keras.layers.Dense(8, activation='relu'),
    tf.keras.layers.Dense(1, activation='linear') # Saída contínua
])
# 5. Compilar e treinar o modelo
modelo.compile(optimizer='adam', loss='mse')
modelo.fit(X_scaled, y, epochs=10, batch_size=2, verbose=0)

Com base no código apresentado, assinale a alternativa correta sobre a execução e o comportamento desse modelo.

A

O código implementa um modelo de classificação, pois a ativação linear na última camada indica que a saída será categórica.

B

A normalização dos dados de entrada não é necessária para redes neurais, pois o algoritmo Adam, já ajusta os pesos automaticamente.

C

A arquitetura do modelo está incorreta, pois redes neurais para regressão devem sempre conter uma camada de ativação softmax na saída.

D

O código cria um modelo de aprendizado profundo para regressão, onde os valores de entrada são normalizados e a saída é uma variável contínua, tornando adequada a ativação linear na última camada.

E

O código não funcionará corretamente, porque a normalização MinMaxScaler não é compatível com redes neurais em TensorFlow/Keras.

Provas

Questão presente nas seguintes provas

3686007 Ano: 2025
Disciplina: TI - Desenvolvimento de Sistemas
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

LinguagensPython

Considere o seguinte trecho de código em Python, que tem como objetivo processar um arquivo de texto contendo dados numéricos e realizar operações sobre tais valores:

def processar_arquivo(nome_arquivo):
    with open(nome_arquivo, 'r') as arquivo:
        dados = arquivo.readlines()
numeros = []
for linha in dados:
    valor = linha.strip()
    if valor.isdigit():
        numeros.append(int(valor))
# Continuação do código

Garantindo que:

1. A média dos números lidos seja calculada e armazenada na variável media, mesmo que o arquivo esteja vazio.
2. Os números maiores que a média sejam gravados sempre em um novo arquivo chamado "saida.txt"
3. O código esteja protegido contra divisão por zero, de forma que a função tenha continuidade, mesmo que identificada a possibilidade de erro.

Assinale a alternativa que apresenta um código válido para continuar a função corretamente.

A

if numeros:
    media = sum(numeros) / len(numeros)
else:
    media = 0
with open("saida.txt", "w") as saida:
    for num in numeros:
        if num > media:
            saida.write(f"{num}\n")

B

media = sum(numeros) / len(numeros)
with open("saida.txt", "w") as saida:
    for num in numeros:
        if num > media:
            saida.write(str(num) + "\n")

C

if len(numeros) == 0:
    return
media = sum(numeros) / len(numeros)
with open("saida.txt", "a") as saida:
    for num in numeros:
        if num > media:
            saida.write(f"{num}\n")

D

if not numeros:
    media = 1
else:
    media = sum(numeros) / len(numeros)
with open("saida.txt", "w") as saida:
    for num in numeros:
        if num > media:
            saida.write(f"{num}\n")

E

if numeros:
    media = sum(numeros)/len(numeros)
else:
    media = 0
with open("saida.txt", "w") as saida:
    for num in numeros:
        saida.write(f"{num}\n")

Provas

Questão presente nas seguintes provas

3686006 Ano: 2025
Disciplina: TI - Desenvolvimento de Sistemas
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

Controle de VersãoGit

O versionamento de código é uma prática essencial no desenvolvimento de software, permitindo que múltiplos desenvolvedores colaborem de forma organizada, mantenham um histórico de alterações e revertam mudanças quando necessário. O Git, um dos sistemas de controle de versão mais populares, fornece uma série de comandos que auxiliam na gestão do código-fonte. Considere o seguinte conjunto de comandos executados em um repositório Git:

git init
git add main.py
git commit -m "Adiciona o arquivo principal"
git branch nova-feature
git checkout nova-feature
echo "print('Nova funcionalidade')" >> main.py
git add main.py
git commit -m "Adiciona nova funcionalidade"
git checkout main
git merge nova-feature

Com base nos comandos apresentados, assinale a alternativa correta.

A

O comando git init clona um repositório remoto do GitHub para o computador local, permitindo edição e commits offline.

B

O comando git checkout nova-feature exclui a branch main e cria uma nova branch chamada nova-feature, que passa a ser a principal do repositório.

C

O comando git commit -m "Adiciona nova funcionalidade" altera permanentemente o arquivo main.py na branch main, independentemente de qual branch esteja ativa no momento.

D

O comando git add main.py faz o commit automático do arquivo main.py, sem a necessidade de um git commit.

E

Após a execução dos comandos, o código escrito na branch nova-feature foi incorporado à branch main por meio do comando git merge.

Provas

Questão presente nas seguintes provas

3686005 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

ProgramaçãoLinguagem R

Considere os dois trechos de código a seguir, ambos escritos na Linguagem R. O primeiro utiliza o pacote tidyverse, enquanto o segundo utiliza caret para o mesmo propósito.

Código 1 (tidyverse)

library(tidyverse)
set.seed(123)
dados <- tibble(
  X1 = rnorm(100),
  X2 = rnorm(100),
  Y = sample(c("A", "B"), 100, replace = TRUE)
)
dados_treino <- dados %>% sample_frac(0.7)
dados_teste <- anti_join(dados, dados_treino)

Código 2 (carret)

library(caret)
set.seed(123)
dados <- data.frame(
  X1 = rnorm(100),
  X2 = rnorm(100),
  Y = sample(c("A", "B"), 100, replace = TRUE)
)
indices <- createDataPartition(dados$Y, p = 0.7,
                               list = FALSE)
dados_treino <- dados[indices, ]
dados_teste <- dados[-indices, ]

Em relação aos códigos apresentados, assinale a alternativa correta.

A

Ambos os códigos garantem que a proporção da variável de saída seja mantida na divisão entre treino e teste, evitando possíveis desbalanceamentos.

B

O primeiro código seleciona uma parte dos dados de maneira totalmente aleatória, sem se preocupar com a distribuição da variável de saída, enquanto o segundo código faz a divisão garantindo que as proporções da variável de saída sejam mantidas nos dois conjuntos.

C

Os dois códigos realizam a divisão dos dados utilizando a mesma estratégia, sem diferenças na forma como as observações são separadas entre treino e teste.

D

O primeiro código apresenta uma inconsistência na forma como o conjunto de teste é gerado, podendo resultar na seleção de observações duplicadas ou na omissão de algumas delas.

E

O segundo código realiza uma divisão aleatória simples, sem nenhuma preocupação com a distribuição da variável de saída entre os conjuntos de treino e teste.

Provas

Questão presente nas seguintes provas

3686004 Ano: 2025
Disciplina: TI - Desenvolvimento de Sistemas
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

Frameworks

Um desenvolvedor foi contratado para criar um sistema web para uma pequena startup que deseja lançar um MVP (Produto Mínimo Viável) de uma plataforma de cursos online.

O objetivo inicial é disponibilizar um catálogo de cursos, permitir o cadastro de usuários e oferecer um painel administrativo para gerenciar os conteúdos.

A startup tem poucos recursos e precisa lançar a plataforma rapidamente. O desenvolvedor deseja escolher um framework que permita crescer e escalar o projeto futuramente, caso o produto tenha sucesso.

Considerando o cenário descrito, assinale a alternativa que apresenta a melhor escolha para o desenvolvedor e sua justificativa.

A

Flask é a melhor opção, pois oferece um ambiente minimalista que permite ao desenvolvedor adicionar apenas os componentes necessários, resultando em um sistema mais leve e otimizado para escalar rapidamente.

B

Flask e Django são igualmente recomendáveis para este caso, pois ambos permitem um desenvolvimento rápido sem grandes diferenças em relação às ferramentas disponíveis por padrão.

C

O Flask é a escolha ideal, pois oferece um suporte nativo para administração de usuários e gerenciamento de banco de dados, eliminando a necessidade de instalar bibliotecas adicionais para essas funções.

D

Django é mais adequado, pois já inclui um painel administrativo embutido, um ORM poderoso e mecanismos de autenticação, acelerando o desenvolvimento e reduzindo o esforço necessário para implementar funcionalidades essenciais.

E

Django não é uma boa escolha, pois sua estrutura rígida e quantidade de funcionalidades embutidas tornam a aplicação pesada e inadequada para MVPs e startups que buscam desenvolvimento ágil.

Provas

Questão presente nas seguintes provas

3686003 Ano: 2025
Disciplina: Informática
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

Internet

Em relação aos principais provedores de serviços de Cloud Computing (AWS, GCP e Azure), assinale a alternativa correta.

A

AWS (Amazon Web Services) é um serviço de cloud computing exclusivo para empresas de grande porte, não oferecendo soluções para pequenas e médias empresas.

B

O Google Cloud Platform (GCP) é amplamente utilizado por empresas que utilizam serviços de redes sociais, como o Facebook, mas não oferece soluções de armazenamento em nuvem.

C

O Microsoft Azure oferece soluções de cloud computing focadas em integração com os sistemas e softwares da Microsoft, como o Windows Server e o Office 365, além de ser amplamente utilizado para hospedar máquinas virtuais.

D

O AWS, GCP e Azure são plataformas de cloud computing que oferecem apenas armazenamento de dados, não disponibilizando outros serviços como computação ou redes.

E

O Microsoft Azure foi o primeiro provedor de serviços de cloud computing a oferecer serviços de IaaS (Infraestrutura como Serviço), enquanto o AWS e o GCP seguiram, posteriormente, essa tendência.

Provas

Questão presente nas seguintes provas

3686002 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

BI: Business Intelligence

Uma empresa está implementando uma estratégia de Business Intelligence (BI) para melhorar a análise de seus dados operacionais. Para isso, a equipe de dados precisa criar dashboards interativos e realizar análises avançadas usando Power BI e Tableau.

Durante o desenvolvimento dos relatórios, os analistas se depararam com os seguintes desafios:

• Precisam criar uma métrica personalizada para calcular a média ponderada de preços com base no volume de vendas.

• Desejam otimizar o tempo de carregamento ao lidar com milhões de registros armazenados em um banco de dados relacional.

• Precisam implementar um filtro dinâmico que permita ao usuário selecionar intervalos de datas personalizados sem afetar cálculos em outros gráficos.

Com base nos desafios acima, assinale a alternativa que apresenta as melhores soluções utilizando as funcionalidades nativas do Power BI e do Tableau.

A

No Power BI, a melhor abordagem é criar uma média ponderada manualmente em Excel antes da importação dos dados, enquanto no Tableau, o filtro dinâmico pode ser configurado apenas com parâmetros fixos.

B

No Power BI, a média ponderada pode ser calculada com DAX usando SUMX(), a otimização de carregamento pode ser feita ativando o DirectQuery e o filtro dinâmico pode ser configurado com um "Slicer de Datas" sem conexões cruzadas. No Tableau, a média ponderada pode ser criada com um campo calculado em LOD (Level of Detail), e o filtro dinâmico pode ser ajustado usando um "Context Filter".

C

No Power BI, a média ponderada deve ser calculada usando somente a função AVERAGE(), e a melhor abordagem para lidar com milhões de registros é importar todos os dados para o modo Import, pois isso sempre melhora a performance. No Tableau, filtros dinâmicos não são possíveis sem alterar os cálculos nos gráficos.

D

No Power BI, cálculos avançados como médias ponderadas exigem a criação de medidas em SQL dentro da fonte de dados, pois DAX não suporta esse tipo de operação. No Tableau, filtros contextuais devem ser evitados, pois reduzem a eficiência dos dashboards.

E

Power BI e Tableau não possuem suporte nativo para cálculos de médias ponderadas e filtros dinâmicos devem ser aplicados, exclusivamente, no banco de dados antes da importação dos dados para otimizar a performance.

Provas

Questão presente nas seguintes provas

3686001 Ano: 2025
Disciplina: TI - Gestão e Governança de TI
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

Gestão da Informação

Uma equipe de cientistas de dados está desenvolvendo um pipeline de ETL (Extract, Transform, Load) para processar grandes volumes de dados diariamente. Para isso, eles decidiram utilizar o Apache Airflow para orquestrar e monitorar o fluxo de trabalho, garantindo a execução das tarefas na ordem correta e com tolerância a falhas.

No Apache Airflow, os DAGs (Directed Acyclic Graphs) são a estrutura principal usada para definir os workflows. Dentro de uma DAG, as tarefas são organizadas e executadas de acordo com suas dependências.

Assinale a alternativa que melhor descreve o funcionamento de um DAG no Apache Airflow.

A

Uma DAG é um conjunto de tarefas organizadas de forma sequencial, onde todas as tarefas devem ser executadas uma após a outra, sem paralelismo.

B

Uma DAG é um modelo de machine learning embutido no Airflow, usado para treinar redes neurais automaticamente, sem a necessidade de definir tarefas manualmente.

C

Uma DAG no Apache Airflow é um script em SQL que permite a execução direta de consultas em bancos de dados sem necessidade de programação em Python, pois o Apache Airflow é uma ferramenta exclusiva para SQL.

D

Uma DAG representa um modelo probabilístico baseado em inteligência artificial, que ajusta, dinamicamente, a execução das tarefas conforme os dados são processados.

E

Uma DAG define um conjunto de tarefas interdependentes, organizadas de forma acíclica, permitindo que algumas tarefas sejam executadas em paralelo, conforme suas dependências são resolvidas.

Provas

Questão presente nas seguintes provas

3686000 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FUVEST
Orgão: USP

Provas:

Especialista em Laboratório - Inteligência Artificial e Aprendizado de Máquina
Provas ×

Data Mining

Uma rede de supermercados deseja entender os padrões de compra dos clientes para organizar melhor seus produtos e otimizar suas estratégias de vendas. Para isso, a equipe de análise de dados decidiu utilizar um algoritmo de descoberta de regras de associação para identificar itens, frequentemente, comprados juntos.

Assinale a alternativa que representa a métrica fundamental para avaliar a relevância de uma regra de associação.