#crawl #data #tiki #analyst #rin
TRÍCH XUẤT DỮ LIỆU TỪ MỘT TRANG WEB THƯƠNG MẠI ĐIỆN TỬ BẤT KỲ – TIKI 🧐
Hi mọi người 🤟
Bài trước mình có giới thiệu “LÀM THẾ NÀO ĐỂ LẤY DỮ LIỆU TỪ MỘT KÊNH YOUTUBE BẤT KỲ??? 🧐🧐🧐”
Tương tự như bài trước, mình sẽ lấy data từ bất kỳ một trang web thương mại điện tử bằng cách sử dụng thư viện request và json trong Python (nếu có sẵn API từ Web).
Tron video mình đã làm 3 phần 🤘:
👉 Phần 1: Crawl Product Id của tất cả sản phẩm trong danh mục “điện thoại máy tính bảng” sau đó xử lý và lưu thành file .csv
👉 Phần 2: Từ file .csv chứa các product_id đó, mình đọc lại và đi bước tiếp theo là Crawl Product Data từ product_id, sau đó xử lý trích xuất API và lưu thành file .csv chứa các thông tin liên quan đến từng sản phẩm cụ thể như tên sản phẩm, giá,…
👉 Phần 3: Cũng từ file .csv chứa các product_id đó, mình đọc lại và đi bước tiếp theo là Crawl Comment Data từ product_id, sau đó xử lý trích xuất API và lưu thành file .csv chứa các comments từ danh sách product_id
To be: Xây dựng trang web Recommendation System từ dữ liệu được thu thập bên trên
Mọi người có thắc mắc, góp ý hoặc có ý tưởng nào phát triển thêm từ bài này thì mình xin ghi nhận ạ!
Thanks all ❤️
Code:
Contact:
+ Zalo: +84869156147
+ Facebook:
Video hay mà cho mình hỏi có cách nào backup tài khoản Google login 1 lần , lần sau khi reset máy hay j đi chăng nữa không cần phải login lại
check ib fb em vs anh ơi
cookie, header và parameter mình lấy bằng cách nào vậy ạ? Nếu được có thể cho em xin đường link hướng dẫn với ạ.
Tuyệt vời, video hữu ích lắm anh.
amazing
like
anh thử crawl trang foody được không ạ?
Video cực hữu ích =]]
crawl 1 trang web để lấy link thì ntn vậy a ?
Có cách nào crawl 1 trang có api nhưng phải login và tiếp tục chạy các api sau đó k b?
anh cho em hỏi là phần header sao mình chỉ lấy một phần mà không lấy hết từ tab chrome, dạ em cảm ơn ạ
Code: https://drive.google.com/drive/folders/1uFsAQ43tfV6L9RDT1c9CXxAZcKgJxiAI
Có code không bác?
Video rất hay, dễ hiểu. bạn có thể làm thêm về chủ đề này đặc biệt đối với những web cần đăng nhập, rồi trường hợp đăng nhập mà có mã captcha (sử dụng token đăng nhập),….
Mình crawl comment cứ bị ít ít sao á bạn, là do chỗ range(2) phải không bạn? Với lại khi crawl thì nhiều sản phẩm có comment nhưng crawl về rỗng. Mong bạn giải đáp, cảm ơn bạn.
Rất hay ạ. Mong anh làm thêm về những trang web khác
Anh học cntt à anh
Video hay nha. Mong bạn ra nhiều video hay nữa
Cảm ơn em !
Rất hay ạ.Mong bạn làm thêm nhiều về chủ đề này♥
cảm ơn bạn, hy vọng bạn làm thêm về chủ đề này, rất hay.