Foram encontradas 810 questões.
Provas
Provas
CREATE TABLE Clientes ( Cliente_ID INT PRIMARY KEY, Nome VARCHAR(100), Cidade VARCHAR(100), Estado CHAR(2) );
CREATE TABLE Pedidos ( Pedido_ID INT PRIMARY KEY, Cliente_ID INT, Data_Pedido DATE, Valor_Total DECIMAL(10,2), FOREIGN KEY (Cliente_ID) REFERENCES Clientes(Cliente_ID) );
A consulta SQL, a seguir, retorna quais resultados?
SELECT c.Nome, COUNT(p.Pedido_ID) AS Num_Pedidos, COALESCE(SUM(p.Valor_Total), 0) AS Total_Gasto FROM Clientes c LEFT JOIN Pedidos p ON c.Cliente_ID = p.Cliente_ID WHERE p.Data_Pedido >= '2025-02-01' GROUP BY c.Nome HAVING COUNT(p.Pedido_ID) >= 1;
Provas
A tabela a seguir contém informações sobre pedidos de clientes em uma loja. No entanto, essa tabela apresenta redundâncias e dependências parciais, indicando que não está normalizada.
| Pedido_ID | Cliente_Nome | Cliente_Endereço | Produto_Nome | Quantidade | Preço_Unitário |
|---|---|---|---|---|---|
| 1 | João Silva | Rua A, 123 | Produto A | 2 | 50,00 |
| 1 | João Silva | Rua A, 123 | Produto B | 1 | 30,00 |
| 2 | Maria Souza | Rua B, 456 | Produto A | 3 | 50,00 |
| 3 | Carlos Lima | Rua C, 789 | Produto C | 1 | 20,00 |
| 3 | Carlos Lima | Rua C, 789 | Produto B | 2 | 30,00 |
Considerando apenas as regras da 1ª e 2ª formas normais (1FN e 2FN), assinale a alternativa que apresenta a correta normalização da tabela apresentada.
Provas
A equipe analisou diferentes abordagens e encontraram os seguintes padrões nos dados:
• Os preços seguem uma tendência crescente ao longo do tempo; • Há um padrão sazonal, com aumentos e quedas recorrentes em períodos específicos; • Os valores atuais são fortemente influenciados pelos valores anteriores.
Com base nas características descritas, assinale a alternativa que apresenta a técnica de modelagem de séries temporais mais adequada para capturar esses padrões e gerar previsões precisas.
Provas
Provas
Uma plataforma de e-commerce deseja analisar automaticamente as avaliações deixadas pelos clientes nos produtos para determinar se são positivas ou negativas. Para isso, a equipe de ciência de dados está treinando um modelo de aprendizado de máquina para análise de sentimentos. Dado que as avaliações são textos não estruturados, a equipe experimentou diferentes métodos de representação vetorial para transformar os textos em formatos que o modelo pode processar. Após testar diferentes abordagens, eles obtiveram os seguintes resultados em um modelo de classificação de sentimentos:
| Representação Vetorial | Acurácia nos Dados de Treinamento |
Acurácia nos Dados de Teste |
|---|---|---|
| Bag of Words (BoW) | 95% | 70% |
| TF-IDF | 94% | 73% |
| Word2Vec (CBOW) | 90% | 80% |
| BERT (Transformers) | 89% | 88% |
Com base nos resultados apresentados, assinale a alternativa que descreve a melhor escolha de representação vetorial para este problema e sua justificativa.
Provas
Provas
Provas
[35, 42, 38, 40, 1500, 37, 39, 41, 36, 2500, 43, 5000, 38, 44, 3700]
Utilizando o Spark SQL, calcularam a média e o desvio padrão amostral das compras. Um valor é considerado anomalia se estiver acima de 2 desvios padrão da média.
Em relação à situação proposta e à análise, assinale a alternativa que apresenta as transações que podem ser classificadas como anômalas.
Provas
Caderno Container