Bạn đang mày mò, tìm hiểu kiến thức về Data. Tuy còn mù mờ và không chắc chắn về con đường phía trước nhưng bạn cảm thấy rất là hứng thú. Thì đây là lúc bạn nên tìm một dự án mà bản thân thích để được đắm mình trong những con số. Bạn có thể bắt đầu thu thập dữ liệu liên quan và tiến hành những bước tiếp theo của quá trình phân tích. Đó chắc chắn là những trải nghiệm vô cùng tuyệt vời.
Trong bài viết này, chúng tôi sẽ giới thiệu đến bạn 4 dự án tuyệt vời về data. Những dự án này sẽ giúp bạn học được một vài thủ thuật mới và đồng thời truyền cảm hứng cho quá trình làm việc của bạn.
1.Tìm ra giải bóng đá châu Âu cạnh tranh nhất
Chúng ta có thể sử dụng dữ liệu để biết được giải bóng đá châu Âu nào cạnh tranh nhất không? Giống như những người hâm mộ bóng đá, John Ade-Ojo thường xuyên tham gia vào những cuộc tranh luận so sánh giá trị của các giải Ngoại hạng Anh, Serie A của Ý, Bundesliga của Đức, v.v. Tuy nhiên, không giống như những người hâm mộ khác, John có thể sử dụng các kỹ năng khoa học dữ liệu của mình để giải quyết những cuộc thảo luận này.
Đây là phân tích của John Ade-Ojo để tìm ra giải bóng đá cạnh tranh nhất châu Âu.
2. Phân tích chỉ số đại diện hình ảnh người phụ nữ trên phim
Dữ liệu cho chúng ta thấy điều gì đối với sự phát triển hình ảnh người phụ nữ trong phim? Bài viết của Alison Yuhan Yao, trước hết là phần phân tích chi tiết, dựa trên dữ liệu đối với câu hỏi: phim có trở nên tốt hơn trong việc đại diện cho hình ảnh của người phụ nữ trên màn hình (on-screen) và ngoài màn hình (off-screen) không? Đây cũng là hướng dẫn toàn diện để thu thập dữ liệu qua API, phân tích và trực quan hóa dữ liệu - những kỹ năng cần thiết để phát triển những chủ đề của bạn.
Đây là bài viết so sánh các chỉ số đại diện cho nữ giới trong phim ảnh của Alison Yuhan Yao.
3. Tối ưu hóa việc bán hàng và tiếp thị qua việc chấm điểm khách hàng tiềm năng và mô hình hồi quy Binary Logistic.
Quay lại The Office để tìm hiểu về hồi quy logistic. Cho dù bạn là người hâm mộ Dunder Mifflin hay chưa xem một tập nào của The Office, hướng dẫn mới của Will Crowley cho ta thấy bất kỳ chủ đề nào cũng có thể trở nên thú vị và hấp dẫn với khung (framing) phù hợp. Ở bài này, Will sử dụng công ty giấy tưởng tượng để giải thích chi tiết về việc chấm điểm khách hàng tiềm năng (xếp hạng khả năng họ trở thành khách hàng chính thức) và mô hình hồi quy Binary Logistic.
Bạn có thể xem qua bài Saving the Scranton Branch with Lead Scoring của Will Crowley.
4. Cơ chế trò chơi xúc xắc
Tìm hiểu về Học tăng cường (Reinforcement learning) thông qua cơ chế của trò chơi xúc xắc. Như Thomas Dybdahl Ahle đã từng nói trong bài đăng đầu tiên của mình trên TDS, Liar’s dice (xúc xắc nói dối) là một trò chơi có thể xem là đơn giản. Việc cố gắng dạy AI cách chơi trò này đã thúc đẩy anh ấy nghiên cứu, khám phá ra khái niệm giảm thiểu sự hối tiếc ngược lại (counterfactual regret minimization) và những thách thức về kỹ thuật như cung cấp các mô hình PyTorch trong trình duyệt.
Đây là bài viết của Thomas Dybdahl Ahle về việc tìm hiểu Học tăng cường qua cơ chế của trò Liar’s dice.
Kết:
Trong bài viết này, chúng tôi đã giới thiệu cho bạn 4 dự án thú vị trong ngành phân tích dữ liệu kèm theo những bài viết liên quan. Điều quan trọng mà bạn cần làm hiện tại là tìm ra được dự án mà bản thân cảm thấy hứng thú. Sau đó thì tiến hành thu thập dữ liệu và thực hiện những bước tiếp theo trong quá trình phân tích. Nếu bạn đã từng có cơ hội “dấn thân” vào 1 dự án vô cùng tuyệt vời thì hãy chia sẻ điều ấy với 200Lab nhé.
Bài viết này được dịch từ đây.
Bạn có thể nhấn vào link này để tham gia vào nhóm và nhận thêm nhiều tài liệu hữu ích khác về Data nhé!
Kieu Hoa
Khi mình yêu cuộc đời, cuộc đời cũng sẽ yêu mình đắm say
Bài viết liên quan
Database (Cơ sở dữ liệu) là gì? Những loại Database phổ biến nhất hiện nay
Sep 01, 2024 • 11 min read
Python là gì? Những đặc điểm nổi bật và Ứng dụng của Python
Aug 28, 2024 • 14 min read
Ứng dụng Hypothesis Testing - Kiểm định giả thuyết trong Y học
Jul 18, 2024 • 8 min read
Google Colab là gì? Hướng dẫn sử dụng Google Colab cho người mới
Jul 02, 2024 • 10 min read
Hướng dẫn cách lấy dữ liệu Facebook Ads Tự động Mỗi ngày Miễn phí - Phần 2
Jun 24, 2024 • 6 min read
Hướng dẫn cách lấy dữ liệu Facebook Ads Tự động Mỗi ngày Miễn phí- Phần 1
Jun 24, 2024 • 11 min read