Disciplina: TI - Ciência de Dados e BI
Banca: Consulplan
Orgão: Pref. Santa Maria Jetibá-ES
- Análise de DadosData Profiling
- Análise de DadosTécnicas de Pré-processamentoData Cleansing
- Análise de DadosTécnicas de Pré-processamentoDeduplicação
- Análise de DadosTécnicas de Pré-processamentoPareamento (Matching)
O termo “qualidade dos dados” designa as características relacionadas a dados considerados de alto padrão, assim como os procedimentos empregados para avaliar ou aprimorar tal qualidade. A qualidade dos dados é considerada elevada quando atende plenamente às expectativas e demandas dos usuários de dados. Quando essa finalidade não é atendida, ou é atendida de forma parcial, podemos classificar os dados como de baixa qualidade. Destaca-se que a qualidade dos dados está intrinsecamente vinculada ao contexto e às necessidades específicas dos consumidores de dados. As técnicas de qualidade de dados são essenciais para garantir confiabilidade, consistência e utilidade dos dados em qualquer sistema ou aplicação. Sobre as técnicas de qualidade de dados, relacione adequadamente as colunas a seguir.
1. Profiling.
2. Matching.
3. Deduplicação.
4. Data cleansing.
( ) Corrigir erros, preencher lacunas faltantes e padronizar dados para garantir consistência e exatidão.
( ) Coletar estatísticas ou resumos informativos sobre os dados coletados. Analisar e entender esses dados para identificar padrões, inconsistências e anomalias.
( ) Identificar e remover registros repetidos que representam a mesma entidade, garantindo que apenas uma instância de um registro específico seja mantida.
( ) Remove registros duplicados, simplificando o conjunto de dados e evitando redundâncias.
A sequência está correta em