Magna Concursos
4047723 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: SEFAZ-SP
Uma equipe de auditoria possui uma tabela de NF-e com mais de 1 bilhão de registros em um pyspark.sgl.DataFrame chamado df. A auditora deseja inspecionar apenas 1.000 registros localmente em seu notebook, usando funcionalidades avangadas de pandas para buscar inconsisténcias. Nesse cenário, a abordagem em PySpark mais apropriada para gerar esses registros em um pandas. DataFrame, minimizando o risco de estouro de memória no ambiente local é:
 

Provas

Questão presente nas seguintes provas