Đăng ký ngay:
Khối lượng dữ liệu thô mà một doanh nghiệp thu thập trong quá trình hoạt động rất lớn, nhưng không phải dữ liệu nào cũng sử dụng được. Có những dữ liệu không mang giá trị và nguy hiểm hơn là gây nhiễu (noise). Do đó, trước khi bước vào phân tích, bộ dữ liệu cần được phân loại và “làm sạch” kỹ lưỡng. Nếu thực hiện hời hợt có thể ảnh hưởng đến tiến độ những bước xử lý về sau. Vậy, nên chuẩn bị và xử lý bước đầu dữ liệu như thế nào cho chuẩn?