Facebook Pixel

Cohort Analysis là gì? Ứng dụng phân tích Customer Retention

22 Aug, 2023

Cohort Analysis là gì? Vì sao Cohort Analysis lại quan trọng khi phân tích dữ liệu? Cách ứng dụng Cohort Analysis vào phân tích Customer Retention ra sao?

Cohort Analysis là gì? Ứng dụng phân tích Customer Retention

Mục Lục

Cohort Analysis là gì? Vì sao Cohort Analysis lại quan trọng khi phân tích dữ liệu? Cách ứng dụng Cohort Analysis vào phân tích Customer Retention ra sao? Hãy tìm đáp án qua bài viết này nhé!

Xem Thêm Khóa Học Data

Cohort Analysis là gì?

Cohort Analysis là gì
Photo by UX Indonesia / Unsplash

Cohort analysis là phương pháp phân tích hành vi, trong đó dữ liệu trong tập dữ liệu sẽ được phân chia thành các nhóm tương quan trước khi thực hiện phân tích. Các nhóm này, thường được gọi là "cohort," chia sẻ những đặc điểm hoặc trải nghiệm tương tự trong một khoảng thời gian cụ thể. Điểm độc đáo của cohort analysis là giúp doanh nghiệp "nhìn thấy mẫu hành vi rõ ràng trong suốt quá trình sự sống của từng khách hàng (hoặc người dùng), thay vì cắt xén tất cả các khách hàng một cách đồng nhất mà không xem xét chu kỳ tự nhiên mà họ trải qua". Bằng cách theo dõi sự thay đổi này theo thời gian, doanh nghiệp có thể linh hoạt điều chỉnh dịch vụ cho từng cohort cụ thể.

Cohort analysis có ứng dụng rộng rãi trong việc phân tích dữ liệu lớn và phân tích kinh doanh. Trong nghiên cứu về cohort, dữ liệu được phân chia thành những nhóm tương tự. Có thể nói cohort analysis là một trong những nhóm kiến thức cơ bản khi bạn bắt đầu bước chân vào con đường phân tích dữ liệu. Đây là công cụ hữu ích để hiểu rõ hơn về hành vi của khách hàng và người dùng, từ đó tối ưu hóa chiến lược kinh doanh và nâng cao trải nghiệm của họ.

Cohort analysis is a kind of behavioral analytics that breaks the data in a data set into related groups before analysis. These groups, or cohorts, usually share common characteristics or experiences within a defined time-span  - Wikipedia

Mình lấy một ví dụ đơn giản đó là vùng miền, độ tuổi,... Đến phần áp dụng thực tế mình sẽ giải thích rõ hơn cho các bạn dễ nắm bắt.

Cohort Analysis được ứng dụng trong các lĩnh vực nào?

Cohort analysis là một phương pháp phân tích dữ liệu cực kỳ thú vị mà mình đã sử dụng khá nhiều trong các dự án. Đúng là một công cụ không thể thiếu trong túi toolkit của mình. Không chỉ đơn thuần để phân tích hành vi của khách hàng trong các doanh nghiệp SaaS, trò chơi hay thương mại điện tử, mình đã áp dụng cohort analysis để tối ưu hóa chiến dịch thu hút người dùng và cải thiện độ bám và giá trị của người dùng trong thời gian dài. Cơ hội mở ra từ việc áp dụng cohort analysis là vô tận, không chỉ trong ngành mình đang làm việc mà còn ở nhiều lĩnh vực khác nhau, từ big data đến phân tích kinh doanh.

Vì sao Cohort Analysis lại quan trọng?

Câu hỏi tiếp theo là Cohort Analysis mang lại những lợi ích như thế nào ? Và tại sao nhiều người lại quan tâm đến nó như vậy, cá nhân mình thấy đây là một kiến thức cực kì quan trọng không thể bỏ qua với Data Analyst (DA).

Mình có viết một bài chia sẽ liên quan đến các kỹ năng cần thiết của DA các bạn có thể xem qua tại đây:

Data Analyst - Những kỹ năng không thể thiếu cho người mới
Data Analyst (DA) được hiểu là người sử dụng các công cụ lập trình hoặc phần mềm để tìm kiếm (mine), chắt lọc những thông tin hữu ích từ dữ liệu được cung cấp. Thông thường dữ liệu này khá rời rạc và lộn xộn.

Nếu các bạn đã từng làm Report, vẽ Dashboard  rồi thì các bạn cũng quá quen thuộc với giá trị Average (trung bình) mình gọi tắt là AVG. Cũng phải vài lần gặp trường hợp là số AVG hầu như không mang lại nhiều insight và hỗ trợ ra quyết định.

Monthly Average Order Value
Monthly Average Order Value

Hình bên trên cho chúng ta biết được sự tăng giảm của AOV (Average Order Value) theo tháng, nhưng chúng ta lại không biết được sự thay đổi này đến từ chi tiêu của khách hàng cũ hay khách hàng mới. Thay vì như vậy chúng ta sẽ theo dõi bảng ở dưới đây

Overage Order Value Cohort
Overage Order Value Cohort

Cách phân chia thành các Cohort ở trên của mình dựa vào  tháng mà khách hàng có mua đơn hàng đầu tiên (khác với ngày tạo của khách hàng). Jan cohort bao gồm các khách hàng  có mua đơn hàng đầu tiên trong tháng 1, nhóm họ lại tính AOV (200k).

Sau đó theo dõi nhóm này ở tháng thứ 2 , vẫn giữ nguyên số lượng người nha các bạn, vì họ có đặt điểm chung là mua hàng lần đầu vào tháng 1 (đương nhiên là có kèm theo năm, VD: 01-2021). Như vậy AOV của họ lại giảm từ 200k xuống 150k, tương tự như vậy cho các cohort tiếp theo. Dễ nhận thấy rằng các ô màu xanh là OAV của khách hàng mới và màu cam là của khách hàng cũ => Đôi khi số OAV không thay đổi là vì khách hàng mới thì chi tiêu nhiều hơn và khách hàng cũ thì chi ít lại

Việc phân tích này cho thấy hiệu quả của team Marketing, khi họ đã nâng được số tiền chi tiêu trung bình trên mỗi đơn hàng của khách hàng mới từ 200k lên 223k. Nhưng nhìn theo một góc độ khác thì AOV của khách hàng cũ đang giảm, đối với một số công ty thì chi phí để có được một khách hàng mới rất tốn kém nên họ rất muốn giữ chân và khiến bạn chi tiêu nhiều hơn.

Tuy nhiên đó chỉ là trường hợp lí tưởng, trong bối cảnh mà công ty bạn đang muốn đẩy mạnh quảng bá thương hiệu, hạ giá thành sản phẩm để thu hút người mua thì khi không còn hạ giá nữa, một số khách hàng thích săn hàng giảm giá có thể sẽ rời bỏ bạn => Giá trị cohort sẽ giảm dần, nhưng bạn biết đây là điều tất yếu.

Ứng dụng Cohort Analysis trong phân tích Retention

Như các bạn cũng đã thấy Cohort Analysis cho ta thấy được hành vi, độ gắn kết với thương hiệu (engagement) của khách hàng qua thời gian (Retention) (ngày, tháng, năm, quý), nên mọi người thường gọi là Retention Analysis để cho dễ hiểu. Nhờ nó mà bạn biết được khách hàng có đang thích sản phẩm của mình hay không?!

Bảng phân tích dưới đây cho thấy số lượng Active Users (Khách hàng có dùng ứng dụng) qua các ngày, nếu những ai chưa hiểu thì mình sẽ giải thích nó. Vì thật sự đây là bảng cohort mà hầu như đi công ty nào mình cũng làm, nó thật sự có 100% độ hữu dụng đấy.

  • Các hàng là khung thời gian phân tích từ ngày 25/01 -> 03/02
  • Các cột là số ngày, từ  25/01 -> 03/02 là 11 ngày đó là lí do tại sao có Day 0->Day 10. Thực ra bạn cũng có thể để Jan 25 vào Day 0 nhưng để cho người nhìn có thể dễ năm bắt được thì chúng ta nên để nguyên. Vì sếp bạn sẽ hỏi là khi lauching ứng dụng thì ngày thứ 2 (Day 1) chúng ta còn khoảng bao nhiêu % user sử dụng app ?
  • Lý do tại sao không dùng số mà lại dùng phần trăm ? Nó tuỳ thuộc vào yêu cầu của sếp bạn và mục đích phân tích, theo kinh nghiệm của mình thì phần trăm giúp bạn so sánh được với công ty đối thủ. Mặc dù lượng khách hàng của bạn không nhiều nhưng số retention của bạn lại lớn thì hoàn toàn có thể khẳng định bạn đang làm khách hàng cực kì hài lòng
Active User Retention
Active User Retention

Kết luận về Cohort Analysis

Chúng ta đã nắm được khái niệm và tầm quan trọng của Retention Analysis rồi, việc còn lại là làm sao ứng dụng vào môi trường nơi mình làm việc, cũng có khả năng bạn sẽ phải loại outlier, yếu tố mùa vụ trong năm, ... để kết quả phân tích được chính xác hơn.

Với ngành data mà nói thì làm sao ứng dụng được những mô hình phân tích thống kê vào giải quyết được các bài toán cho doanh nghiệp là quan trọng nhất. Không quan trọng bạn biết rộng đến đâu, mà quan trọng là bạn nắm vững kiến thức, hiểu nó thật sâu và nhạy bén trong việc ứng dụng, thì chắc chắn bạn là người được các doanh nghiệp luôn luôn chào đón.

Chúc bạn thành công trên con đường sự nghiệp! Hãy theo dõi trang Blog về Lập trình và Công nghệ của 200Lab để thu thập thêm nhiều kiến thức hữu ích nhé!

Một vài bài viết bạn sẽ thích:

Phân tích dữ liệu trong Excel: Hướng dẫn & cập nhật mới nhất
Business Analytics là gì? Bạn có đang nhầm lẫn Business Analytics với Data Analytics?
Data Analyst là gì? Trở thành Data Analyst cần chuẩn bị gì?
Quy trình Data Analysis: 5 bước để ra quyết định tốt hơn
So sánh Data Analyst và Data Scientist
Sự khác biệt giữa Data Analytics và Data Analysis

Bài viết liên quan

Lập trình backend expressjs

xây dựng hệ thống microservices
  • Kiến trúc Hexagonal và ứng dụngal font-
  • TypeScript: OOP và nguyên lý SOLIDal font-
  • Event-Driven Architecture, Queue & PubSubal font-
  • Basic scalable System Designal font-

Đăng ký nhận thông báo

Đừng bỏ lỡ những bài viết thú vị từ 200Lab