Foram encontradas 810 questões.
Com base nas técnicas de pré-processamento citadas, como ficará o texto original após a aplicação de tokenização e remoção de stop words?
Provas
Provas
• n_estimators (número de árvores na floresta); • max_depth (profundidade máxima de cada árvore); • min_samples_split (número mínimo de amostras necessárias para dividir um nó).
Assinale a alternativa que apresenta a melhor abordagem para encontrar a combinação ideal desses hiperparâmetros.
Provas
Os algoritmos de clusterização são utilizados na ciência de dados para agrupar elementos semelhantes com base em suas características. Um dos métodos mais comuns para medir a similaridade entre pontos é a distância Euclidiana, que calcula o quão próximos ou distantes os elementos estão em um espaço multidimensional. Essa métrica é a base para a determinação da formação dos clusters em algoritmos como K-Means e DBSCAN. Uma empresa deseja agrupar clientes com base em seu comportamento de compra. Para isso, foram coletados dois atributos: a quantidade de produtos diferentes comprados no último mês (X) e o valor total gasto (em centenas de reais) (Y). A tabela, a seguir, apresenta os dados coletados de quatro clientes, que serão usados para gerar a matriz de distâncias com base na distância Euclidiana:
| Cliente | Qtde de produtos (X) | Valor Gasto (Y) |
|---|---|---|
| A | 2 | 3 |
| B | 5 | 7 |
| C | 1 | 4 |
| D | 6 | 2 |
Em relação à matriz de distância gerada, assinale a alternativa correta.
Provas
Analise o trecho de código Python a seguir:
1 a = [1,2,3,4,5,6,7,8,9,10]
2 for i in range (0, 10):
3 a[i] = a[i] + a[i-2]
4 print(a[i]*a[i-2] - a[i-1]*a[i-1])
Em relação ao trecho apresentado, assinale a alternativa que indica o conteúdo que será exibido na tela a partir da execução da linha 4 (print).
Provas
Assinale a alternativa que apresenta a abordagem mais adequada para construir este modelo preditivo.
Provas
E relação ao problema descrito, assinale a alternativa que apresenta a abordagem mais eficaz para aprimorar a capacidade de generalização de um modelo de aprendizado de máquina.
Provas
Em relação ao contexto apresentado, assinale a alternativa correta.
Provas
Provas
Uma empresa está implementando um dashboard no Power BI para monitorar as vendas de seus produtos em diversas regiões do país. O banco de dados contém informações sobre:
• Vendas realizadas (data, valor, quantidade, produto vendido, vendedor e região).
• Detalhes dos produtos (código, categoria, marca e preço unitário).
• Informações dos clientes (nome, CPF, idade, estado civil e cidade).
• Registros de vendedores (nome, código do vendedor e equipe de vendas).
Considerando as melhores práticas de modelagem de dados no Power BI, qual esquema de dados é mais adequado para estruturar esse modelo e garantir performance e facilidade de análise?
Provas
Caderno Container