Hướng Dẫn Lập Trình Crawl (Thu Thập) Dữ Liệu Web với Python
Web crawling, còn được gọi là web scraping, là quá trình tự động thu thập dữ liệu từ các trang web khác nhau. Nó bao gồm việc trích xuất thông tin từ các trang web bằng cách theo dõi các liên kết và phân tích cấu trúc HTML hoặc XML bên dưới.
Dữ liệu được crawl về thể được sử dụng cho nhiều mục đích, bao gồm nghiên cứu, phân tích để xây dựng các mô hình máy học (Machine Learning) cũng như tạo những ứng dụng dựa trên thông tin mới nhất từ web.
Trong video này, chúng mình sẽ tìm hiểu về Web Crawling với thư viện Requests và BeautifulSoup của Python để thu thập dữ liệu từ trang web.
[0:00] Giới thiệu về nội dung của video
[1:40] Hướng dẫn thiết lập môi trường ảo (virtual environment) và cài đặt thư viện
[6:00] Hướng Dẫn Lập Trình Crawl (Thu Thập) Dữ Liệu Web với Python
Tài liệu liên quan tới video:
– F1 Racing:
– Jupyter Notebook:
Theo dõi CodeXplore tại:
► Facebook fanpage:
► Tiktok:
► Github:
► Instagram:
Link để tham gia Discord Community:
#python #webcrawler #beautifulsoup
phần thẻ <body> khi dùng soup.find('body') mình <print> ra no cho ra kết quả như vậy : <body><script>document.cookie="D1N=ebf8bcb9799b521106133976232e0045"+"; expires=Fri, 31 Dec 2099 23:59:59 GMT; path=/";window.location.reload(true);</script></body>. Có cách nào khắc phục không bạn mình kẹt chổ này nên không crawl được gì luôn, hay phải dùng selenium cho những trang web dùng script như này. Cảm ơn chia sẽ của bạn
cái link invite discord hết hạn rui anh ơi, anh cho em xin lại link vào server với ạ :>
anh dạy dễ hiểu quá. a có thể recomend cho e vài khóa học nên học khi bắt đầu nhảy ngang qua code được ko ạ. E đã học được 1 chút căn bản python
Những bài học rất thú vị. Nếu có thể hy vọng CodeXplore làm 1 series về Langchain.
Làm về docker đi anh ❤
Anh cho em hỏi, sao trong jupyter notebook vscode của em nó không hiện gợi ý nhập như của anh. Có cách nào không ạ
Video rất hay a ơi, mong anh ra thêm video về cách export ra file .csv
anh làm tiếp lập trình game bằng python đi, em muốn học nhiều game mà toàn tiếng anh, mong anh hướng dẫn tạo thêm nhiều tựa game hay, cảm ơn anh 😊
video rất hay anh ơi. Mong anh có thể ra thêm nhiều video chất lượng <33
Đoạn select kernel em không xuất hiện Python Env là do đâu anh nhỉ?
hay qúa. Mong a ra nhiều hơn vì cách dạy của a rất dễ hiểu
Anh có phải là một fan F1 không anh :))
quá tuyệt quá bổ ích thank a
Rất thích cách dạy của anh. Nếu a ra các khóa học, em sẽ ủng hộ ạ. E dân trái ngành đang học data analysis, xem của a a dễ hiểu lắm ạ <3 Mong anh giữ lửa và ra thêm nhiều video hơn nữa nhé <3
Úi bữa em cũng nhận được 1 bài test cho job FrontEnd y chang video này luôn anh @@
Lô anh