Questão 2753083

2753083 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: IF-SP
Orgão: IF-SP

Provas:

Analista de TI - Ciência de Dados
Provas ×

ProgramaçãoPythonPandas

Uma tarefa muito comum durante a etapa de pré-processamento de dados é o tratamento de valores ausentes. A linguagem Python possui uma biblioteca muito utilizada pelos cientistas de dados, denominada Pandas, que permite realizar o processo de transformação dos dados de maneira bem prática. Considere os dados exibidos pela figura abaixo:

Enunciado 3134371-1

Pela figura, é possível observar que existem diversos valores ausentes, identificados por NaN. Ao analisar essas informações, o cientista de dados decide substituir os valores ausentes em cada coluna, da seguinte forma:

• Gravidez: substituir NaN pelo valor 0;
• Pressão Sanguínea: substituir NaN pela média dos valores da coluna;
• Espessura da Pele: substituir NaN pela moda dos valores da coluna;
• IMC: substituir NaN pela mediana dos valores da coluna;
• Resultado: substituir NaN pelo valor 0.

O cientista de dados armazenou os valores dentro de um dataframe do Pandas, chamado df. Para realizar a substituição dos valores ausentes, ele decide executar o seguinte comando:

df.fillna(value=valores, inplace=True)

Observe que o argumento “value” recebe um dicionário do Python. Esse dicionário contém as instruções para atualizar os valores das colunas, tal como o cientista de dados deseja. Assinale a alternativa correta, que indica o trecho de código relacionado a esse dicionário de dados.

valores = {
Gravidez: 0,
Pressão Sanguínea: df[‘Pressão Sanguínea’].mean(),
Espessura da Pele: df[‘Espessura da Pele’].mode()[0],
IMC: df[‘IMC’].median(),
Resultado: 0
}

valores = {
‘Gravidez’: 0,
‘Pressão Sanguínea’: df[‘Pressão Sanguínea’].mean(),
‘Espessura da Pele’: df[‘Espessura da Pele’].mode(),
‘IMC’: df[‘IMC’].median(),
‘Resultado’: 0
}

valores = {
‘Gravidez’: 0,
‘Pressão Sanguínea’: df[‘Pressão Sanguínea’].mean(),
‘Espessura da Pele’: df[‘Espessura da Pele’].mean(),
‘IMC’: df[‘IMC’].mean(),
‘Resultado’: 0
}

valores = {
‘Gravidez’: 0,
‘Pressão Sanguínea’: df[‘Pressão Sanguínea’].mean(),
‘Espessura da Pele’: df[‘Espessura da Pele’].mode()[0],
‘IMC’: df[‘IMC’].median(),
‘Resultado’: 0
}

Provas

Questão presente nas seguintes provas

Analista de TI - Ciência de Dados

50 Questões

Provas

Analista de TI - Ciência de Dados

Acesse sua Conta

Crie uma Conta