Facebook: Bambang Siswoyo
Data di dunia nyata cukup berantakan – penuh dengan kesalahan, gangguan, informasi parsial, dan nilai yang hilang. Ini juga tidak konsisten, seringkali dikumpulkan dari banyak sumber. Dalam data sains semakin banyak data yang dimiliki, semakin baik algoritma kecerdasan artifisial dalam melakukan data training pada data yang mempunyai kualitas baik. Para praktisi data, yang mendedikasikan sekitar 80% waktunya untuk prapemrosesan dan pengelolaan data.