Um bioinformata está utilizando um pipeline para mineração de dados para identificar genes que estão associados a um determinado tipo de câncer. O pipeline utilizado, neste estudo, consiste em cinco etapas. Em qual delas o bioinformata está mais propenso a cometer um erro que pode levar a resultados incorretos?