Foram encontradas 5.009 questões.
A respeito de Big Data, julgue os próximos itens.
Subconjunto de um data warehouse, o data mart é especializado em uma área específica de uma organização.
Provas
A respeito de Big Data, julgue os próximos itens.
Em um data lake, os dados são depositados em estado bruto, sem terem passado por qualquer análise e mesmo sem terem uma governança.
Provas
A respeito de Big Data, julgue os próximos itens.
Em Big Data, ruídos consistem em informações extras que acabam deturpando as análises, enquanto overfitting designa a interpretação equivocada dos ruídos como dados legítimos.
Provas
Julgue os próximos itens, referentes ao processamento de linguagem natural.
A lematização prescinde do POS tagging para que as palavras sejam reduzidas corretamente, pois todas as palavras são reduzidas ao mesmo lemma, independentemente de sua classe gramatical.
Provas
Julgue os próximos itens, referentes ao processamento de linguagem natural.
A similaridade de cosseno é uma métrica pela qual se avalia a similaridade entre dois vetores com base no ângulo entre eles em um espaço vetorial, de forma que, à medida que os vetores se aproximarem, aumentará a similaridade de cosseno.
Provas
Julgue os próximos itens, referentes ao processamento de linguagem natural.
A saída do Word2Vec consiste em vetores densos de baixa dimensão que representam palavras em um espaço contínuo, onde cada palavra é mapeada para um vetor numérico no qual cada dimensão captura uma característica da palavra.
Provas
A respeito de técnicas de redução de dimensionalidade, julgue os itens subsecutivos.
Para utilizar de forma adequada a análise de componentes principais (PCA, na sigla em inglês), é essencial normalizar os dados; se as variáveis não estiverem na mesma escala, aquelas com maior variância terão maior impacto, distorcendo o resultado da PCA.
Provas
A respeito de técnicas de redução de dimensionalidade, julgue os itens subsecutivos.
Quando da configuração dos parâmetros do autoencoder, o tamanho do espaço latente é uma informação crucial, pois determina o tamanho do espaço onde os dados de entrada serão comprimidos.
Provas
Acerca da avaliação de modelos de classificação, julgue os itens que se seguem.
Um modelo de classificação que apresenta alta revocação é útil em contextos em que seja crucial identificar a maior quantidade possível de casos positivos, mesmo que isso resulte em um número maior de falsos positivos.
Provas
A respeito de KNN (k-nearest neighbours), SVM (support vector machines), deep learning e técnicas de agrupamento, julgue os itens a seguir.
O SVM classifica os dados encontrando uma linha ou hiperplano ideal; essa linha de separação é encontrada entre duas classes distintas pela análise dos dois pontos, um de cada grupo, mais próximos da outra classe.
Provas
Caderno Container