Em Big Data, ruídos consistem em informações extras que acabam deturpando as análises, enquanto overfitting designa a interpretação equivocada dos ruídos como dados legítimos.

Comentários 1

×

Cadernos

×

Provas

Questão presente nas seguintes provas

3339452 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: ANATEL

Provas:

Especialista em Regulação - Ciência de Dados
Provas ×

Inteligência ArtificialMachine Learning

Julgue os próximos itens, referentes ao processamento de linguagem natural.

A lematização prescinde do POS tagging para que as palavras sejam reduzidas corretamente, pois todas as palavras são reduzidas ao mesmo lemma, independentemente de sua classe gramatical.

Provas

Questão presente nas seguintes provas

3339450 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: ANATEL

Provas:

Especialista em Regulação - Ciência de Dados
Provas ×

Julgue os próximos itens, referentes ao processamento de linguagem natural.

A similaridade de cosseno é uma métrica pela qual se avalia a similaridade entre dois vetores com base no ângulo entre eles em um espaço vetorial, de forma que, à medida que os vetores se aproximarem, aumentará a similaridade de cosseno.

Provas

Questão presente nas seguintes provas

3339449 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: ANATEL

Provas:

Especialista em Regulação - Ciência de Dados
Provas ×

Julgue os próximos itens, referentes ao processamento de linguagem natural.

A saída do Word2Vec consiste em vetores densos de baixa dimensão que representam palavras em um espaço contínuo, onde cada palavra é mapeada para um vetor numérico no qual cada dimensão captura uma característica da palavra.

Provas

Questão presente nas seguintes provas

3339446 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: ANATEL

Provas:

Especialista em Regulação - Ciência de Dados
Provas ×

A respeito de técnicas de redução de dimensionalidade, julgue os itens subsecutivos.

Para utilizar de forma adequada a análise de componentes principais (PCA, na sigla em inglês), é essencial normalizar os dados; se as variáveis não estiverem na mesma escala, aquelas com maior variância terão maior impacto, distorcendo o resultado da PCA.

Provas

Questão presente nas seguintes provas

3339445 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: ANATEL

Provas:

Especialista em Regulação - Ciência de Dados
Provas ×

Inteligência ArtificialMachine Learning

A respeito de técnicas de redução de dimensionalidade, julgue os itens subsecutivos.

Quando da configuração dos parâmetros do autoencoder, o tamanho do espaço latente é uma informação crucial, pois determina o tamanho do espaço onde os dados de entrada serão comprimidos.

Provas

Questão presente nas seguintes provas

3339441 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: ANATEL

Provas:

Especialista em Regulação - Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAvaliação de Modelos

Acerca da avaliação de modelos de classificação, julgue os itens que se seguem.

Um modelo de classificação que apresenta alta revocação é útil em contextos em que seja crucial identificar a maior quantidade possível de casos positivos, mesmo que isso resulte em um número maior de falsos positivos.

Provas

Questão presente nas seguintes provas

3339436 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: ANATEL

Provas:

Especialista em Regulação - Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAlgoritmosSVM: Máquinas de Vetores de Suporte

A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue os itens a seguir.

O SVM classifica os dados encontrando uma linha ou hiperplano ideal; essa linha de separação é encontrada entre duas classes distintas pela análise dos dois pontos, um de cada grupo, mais próximos da outra classe.