Foram encontradas 810 questões.
Considere os dois trechos de código a seguir, ambos escritos na Linguagem R. O primeiro utiliza o pacote tidyverse, enquanto o segundo utiliza caret para o mesmo propósito.
Código 1 (tidyverse)
library(tidyverse)
set.seed(123)
dados <- tibble(
X1 = rnorm(100),
X2 = rnorm(100),
Y = sample(c("A", "B"), 100, replace = TRUE)
)
dados_treino <- dados %>% sample_frac(0.7)
dados_teste <- anti_join(dados, dados_treino)
Código 2 (carret)
library(caret)
set.seed(123)
dados <- data.frame(
X1 = rnorm(100),
X2 = rnorm(100),
Y = sample(c("A", "B"), 100, replace = TRUE)
)
indices <- createDataPartition(dados$Y, p = 0.7,
list = FALSE)
dados_treino <- dados[indices, ]
dados_teste <- dados[-indices, ]
Em relação aos códigos apresentados, assinale a alternativa correta.
Provas
Um desenvolvedor foi contratado para criar um sistema web para uma pequena startup que deseja lançar um MVP (Produto Mínimo Viável) de uma plataforma de cursos online.
O objetivo inicial é disponibilizar um catálogo de cursos, permitir o cadastro de usuários e oferecer um painel administrativo para gerenciar os conteúdos.
A startup tem poucos recursos e precisa lançar a plataforma rapidamente. O desenvolvedor deseja escolher um framework que permita crescer e escalar o projeto futuramente, caso o produto tenha sucesso.
Considerando o cenário descrito, assinale a alternativa que apresenta a melhor escolha para o desenvolvedor e sua justificativa.
Provas
Provas
Uma empresa está implementando uma estratégia de Business Intelligence (BI) para melhorar a análise de seus dados operacionais. Para isso, a equipe de dados precisa criar dashboards interativos e realizar análises avançadas usando Power BI e Tableau.
Durante o desenvolvimento dos relatórios, os analistas se depararam com os seguintes desafios:
• Precisam criar uma métrica personalizada para calcular a média ponderada de preços com base no volume de vendas.
• Desejam otimizar o tempo de carregamento ao lidar com milhões de registros armazenados em um banco de dados relacional.
• Precisam implementar um filtro dinâmico que permita ao usuário selecionar intervalos de datas personalizados sem afetar cálculos em outros gráficos.
Com base nos desafios acima, assinale a alternativa que apresenta as melhores soluções utilizando as funcionalidades nativas do Power BI e do Tableau.
Provas
Uma equipe de cientistas de dados está desenvolvendo um pipeline de ETL (Extract, Transform, Load) para processar grandes volumes de dados diariamente. Para isso, eles decidiram utilizar o Apache Airflow para orquestrar e monitorar o fluxo de trabalho, garantindo a execução das tarefas na ordem correta e com tolerância a falhas.
No Apache Airflow, os DAGs (Directed Acyclic Graphs) são a estrutura principal usada para definir os workflows. Dentro de uma DAG, as tarefas são organizadas e executadas de acordo com suas dependências.
Assinale a alternativa que melhor descreve o funcionamento de um DAG no Apache Airflow.
Provas
Uma rede de supermercados deseja entender os padrões de compra dos clientes para organizar melhor seus produtos e otimizar suas estratégias de vendas. Para isso, a equipe de análise de dados decidiu utilizar um algoritmo de descoberta de regras de associação para identificar itens, frequentemente, comprados juntos.
Assinale a alternativa que representa a métrica fundamental para avaliar a relevância de uma regra de associação.
Provas
Em aprendizado de máquina, classificadores binários e multiclasses são usados para categorizar dados em duas ou mais classes. Considere os cenários a seguir:
1. Um sistema de detecção de fraudes bancárias, onde cada transação deve ser classificada como fraudulenta ou não fraudulenta.
2. Um modelo de classificação de espécies de flores, onde cada flor pode ser categorizada como setosa, versicolor ou virginica.
Em relação aos cenários apresentados, assinale a alternativa que descreve os modelos mais adequados para cada tipo de problema.
Provas
Uma empresa deseja implementar uma arquitetura de dados robusta para dar suporte à análise e ao processamento diário de informações. A empresa já possui um sistema de OLTP, mas agora precisa de uma solução de OLAP para análise histórica e de tendências. Além disso, a equipe de TI está considerando a criação de Data Marts para áreas de marketing, vendas e finanças, com o objetivo de melhorar a tomada de decisões.
Com base no cenário apresentado, assinale a alternativa que melhor descreve a relação entre Data Marts, OLTP e OLAP.
Provas
Durante uma análise exploratória de dados (EDA), um cientista de dados está avaliando a dispersão de um conjunto de dados financeiros que contém informações sobre variações diárias no preço de uma ação. Ele deseja utilizar uma métrica que atenda os seguintes requisitos:
• Leve em conta todos os valores da amostra para evitar que outliers distorçam excessivamente a análise.
• Seja expressa na mesma unidade de medida dos dados originais, facilitando a interpretação dos resultados.
• Permita comparar a variabilidade entre diferentes ativos, mesmo que tenham médias diferentes.
Dado esse contexto, assinale a alternativa que apresenta a técnica estatística que melhor atende aos requisitos mencionados
Provas
Considere a tabela Funcionarios de um banco de dados de uma empresa:
CREATE TABLE Funcionarios (
id INT PRIMARY KEY,
nome VARCHAR(100),
cargo VARCHAR(50),
salario DECIMAL(10,2)
);
Qual das consultas, a seguir, retorna, corretamente, o nome, o cargo e o salário de todos os funcionários que ganham mais de R$ 3.000,00, ordenados em ordem decrescente de salário?
Provas
Caderno Container