Facebook PixelCustomer Lifetime Value (LTV): Demo Phân tích LTV cho Doanh nghiệp E-commerce | 200Lab Blog

Customer Lifetime Value (LTV): Demo Phân tích LTV cho Doanh nghiệp E-commerce

23 Mar, 2025

Customer Lifetime Value là tổng giá trị kinh tế mà một khách hàng mang lại cho doanh nghiệp trong suốt thời gian họ là khách hàng

Customer Lifetime Value (LTV): Demo Phân tích LTV cho Doanh nghiệp E-commerce

Mục Lục

Theo nghiên cứu gần đây từ Harvard Business Review, doanh nghiệp tập trung vào LTV có khả năng tăng trưởng doanh thu nhanh hơn 15% so với đối thủ cạnh tranh. Đồng thời, báo cáo từ Bain & Company khẳng định rằng việc tăng tỷ lệ giữ chân khách hàng lên chỉ 5% có thể làm tăng lợi nhuận từ 25% đến 95%.

Những con số này phản ánh tầm quan trọng chiến lược của việc hiểu và tối ưu hóa LTV trong môi trường kinh doanh cạnh tranh ngày nay. Vậy LTV là gì và nó nó được tính như thế nào, hãy cùng mình tìm hiểu trong bài viết sau đây nhé.

1. Customer Lifetime Value (LTV) là gì?

Customer Lifetime Value (LTV) là tổng giá trị kinh tế mà một khách hàng mang lại cho doanh nghiệp trong suốt thời gian họ là khách hàng của doanh nghiệp đó. Theo nghiên cứu của Gupta và cộng sự (2006) được công bố trên Journal of Marketing Research, LTV được định nghĩa chính xác là giá trị hiện tại của tất cả lợi nhuận trong tương lai từ một khách hàng trong suốt mối quan hệ của họ với công ty.

Hiểu đơn giản, LTV là tổng số tiền mà một khách hàng dự kiến sẽ chi tiêu cho sản phẩm hoặc dịch vụ của công ty trong suốt thời gian họ là khách hàng, trừ đi chi phí phục vụ khách hàng đó.

2. Vai trò của LTV đối với doanh nghiệp

Nghiên cứu của Harvard Business School (2014) đã chỉ ra rằng việc tăng tỷ lệ giữ chân khách hàng lên 5% có thể làm tăng lợi nhuận từ 25% đến 95%. LTV đóng những vai trò quan trọng sau:

  1. Tối ưu hóa ngân sách marketing: Theo nghiên cứu của Fader và Hardie (2012) đăng trên Journal of Interactive Marketing, các công ty sử dụng LTV để phân bổ ngân sách có ROI cao hơn 15-30% so với các phương pháp truyền thống.
  2. Ra quyết định về thu hút khách hàng: LTV giúp xác định mức chi tiêu hợp lý cho việc thu hút khách hàng (CAC). Khảo sát của McKinsey (2018) cho thấy các công ty sử dụng tỷ lệ LTV:CAC làm KPI chính có tỷ suất lợi nhuận cao hơn 18%.
  3. Phân khúc và ưu tiên khách hàng: Nghiên cứu từ Wharton School (2020) chỉ ra rằng 20% khách hàng có LTV cao nhất thường đóng góp tới 80% lợi nhuận của doanh nghiệp.
  4. Đo lường hiệu quả chiến lược giữ chân khách hàng: LTV giúp đánh giá tác động tài chính của các chương trình loyalty. Theo Reichheld và Schefter (2000), chi phí giữ chân khách hàng hiện tại thấp hơn 5-25 lần so với chi phí thu hút khách hàng mới.

3. Các phương pháp tính LTV

3.1 Mô hình truyền thống

Công thức đơn giản và phổ biến nhất:

Txt
LTV = (Giá trị đơn hàng trung bình × Số lượng giao dịch × Tỷ suất lợi nhuận) / Tỷ lệ churn

3.2 Mô hình xác suất

Mô hình BG/NBD (Beta-Geometric/Negative Binomial Distribution) được phát triển bởi Fader, Hardie, và Lee (2005) được áp dụng rộng rãi trong ngành bán lẻ và e-commerce. Mô hình này dự đoán hành vi mua hàng dựa trên:

  • Recency (R): Thời gian kể từ lần mua cuối
  • Frequency (F): Số lần mua hàng
  • Tenure (T): Thời gian khách hàng đã biết đến thương hiệu

3.3 Mô hình Machine Learning

Theo nghiên cứu của Chamberlain từ Uber, các mô hình machine learning như Gradient Boosting và Deep Learning giúp dự đoán LTV chính xác hơn 35% so với các phương pháp truyền thống.

4. Demo: Phân tích LTV cho doanh nghiệp E-commerce

Để minh họa cách phân tích LTV trong thực tế, chúng ta sẽ sử dụng bộ dữ liệu từ nghiên cứu thực nghiệm của Chen và cộng sự (2021). Nghiên cứu này theo dõi hành vi mua sắm của 50.000 khách hàng trên một nền tảng thương mại điện tử trong vòng 2 năm.

Tác giả đã không publish dữ liệu của họ, nhưng mình hy vọng các bạn có thể suy ra từ đoạn code bên dưới, vì đa số các dữ liệu mẫu mình tìm được trên kaggle không thực tế hoặc quá ít mẫu nên cũng không thể làm nguồn cho bài phân tích được.

Bộ dữ liệu bao gồm:

  • Lịch sử giao dịch: thông tin về ngày mua, giá trị đơn hàng và loại sản phẩm.
  • Thông tin khách hàng: thời điểm khách hàng bắt đầu sử dụng dịch vụ và kênh thu hút họ.
  • Hành vi tương tác: số lượt truy cập và thời gian khách hàng sử dụng trên nền tảng.

4.1 Chuẩn bị dữ liệu

Python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from lifetimes import BetaGeoFitter, GammaGammaFitter

# Giả định dữ liệu đã được tải lên
transactions_df = pd.read_csv('transactions.csv')

# Xác định ngày cuối cùng trong dữ liệu để tính recency
PRESENT = transactions_df['date'].max()

# Tính toán RFM
rfm = transactions_df.groupby('customer_id').agg({
    'date': lambda x: (PRESENT - x.max()).days,  # Recency
    'order_id': 'count',  # Frequency
    'value': ['sum', 'mean']  # Monetary
})

# Đổi tên cột
rfm.columns = ['recency', 'frequency', 'monetary_sum', 'monetary_mean']

# Thêm thông tin 'T' (thời gian kể từ lần mua đầu tiên)
customers_df = pd.read_csv('customers.csv')
rfm = rfm.merge(
    customers_df[['customer_id', 'first_purchase_date']],
    on='customer_id'
)
rfm['T'] = rfm.apply(
    lambda x: (PRESENT - x['first_purchase_date']).days,
    axis=1
)

4.2 Áp dụng mô hình BG/NBD và Gamma-Gamma

Python
# Chuẩn bị dữ liệu cho mô hình BG/NBD
rfm_for_model = rfm[rfm['frequency'] > 0]

# Huấn luyện mô hình BG/NBD
bgf = BetaGeoFitter(penalizer_coef=0.01)
bgf.fit(
    rfm_for_model['frequency'],
    rfm_for_model['recency'],
    rfm_for_model['T']
)

# Dự đoán số giao dịch trong 12 tháng tiếp theo
t = 365
rfm_for_model['predicted_purchases'] = bgf.predict(
    t,
    rfm_for_model['frequency'],
    rfm_for_model['recency'],
    rfm_for_model['T']
)

# Huấn luyện mô hình Gamma-Gamma để dự đoán giá trị đơn hàng
ggf = GammaGammaFitter(penalizer_coef=0.01)
ggf.fit(
    rfm_for_model['frequency'],
    rfm_for_model['monetary_mean']
)

# Tính toán Expected Average Profit
rfm_for_model['expected_avg_profit'] = ggf.conditional_expected_average_profit(
    rfm_for_model['frequency'],
    rfm_for_model['monetary_mean']
)

# Tính CLV cho 12 tháng tiếp theo
rfm_for_model['clv'] = ggf.customer_lifetime_value(
    bgf,
    rfm_for_model['frequency'],
    rfm_for_model['recency'],
    rfm_for_model['T'],
    rfm_for_model['monetary_mean'],
    time=t,
    discount_rate=0.01
)

4.3 Segment khách hàng dựa trên LTV

Python
# Phân khúc khách hàng dựa trên LTV
rfm_for_model['ltv_segment'] = pd.qcut(
    rfm_for_model['clv'],
    q=5,
    labels=['Rất thấp', 'Thấp', 'Trung bình', 'Cao', 'Rất cao']
)

# Phân tích phân khúc
segment_analysis = rfm_for_model.groupby('ltv_segment').agg({
    'clv': ['mean', 'count', 'sum'],
    'recency': 'mean',
    'frequency': 'mean',
    'monetary_mean': 'mean',
    'predicted_purchases': 'mean'
})

# Trực quan hóa đóng góp của từng phân khúc
plt.figure(figsize=(10, 6))
segment_analysis['clv']['sum'].plot(kind='pie', autopct='%1.1f%%')
plt.title('Tỷ lệ đóng góp LTV theo phân khúc')
plt.ylabel('')
plt.show()

4.4 Kết quả và Insight

Từ nghiên cứu của Chen và cộng sự (2021), phân tích LTV trên dữ liệu thực tế đã cho thấy:

  1. Phân bố LTV không đồng đều: 20% khách hàng có LTV cao nhất đóng góp 68% tổng giá trị LTV, phù hợp với nguyên tắc Pareto.
  2. Mối quan hệ giữa kênh thu hút và LTV:
    • Khách hàng đến từ kênh tìm kiếm tự nhiên (SEO) có LTV cao hơn 45% so với khách hàng từ quảng cáo trả phí
    • Khách hàng đến từ giới thiệu có LTV cao hơn 60% và tỷ lệ churn thấp hơn 25%
  3. Tác động của trải nghiệm đầu tiên: Khách hàng có trải nghiệm tích cực trong 30 ngày đầu tiên (đo bằng NPS) có LTV cao hơn 3 lần so với nhóm còn lại.
  4. Dự đoán sớm LTV: Mô hình có thể dự đoán LTV với độ chính xác 82% chỉ sau 60 ngày kể từ giao dịch đầu tiên.
Python
# Trực quan hóa mối quan hệ giữa kênh thu hút và LTV
channel_ltv = pd.merge(
    rfm_for_model,
    customers_df[['customer_id', 'acquisition_channel']],
    on='customer_id'
)

plt.figure(figsize=(12, 6))
sns.barplot(x='acquisition_channel', y='clv', data=channel_ltv)
plt.title('LTV trung bình theo kênh thu hút')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

4.5 Ứng dụng thực tiễn

Từ nghiên cứu của Chen, doanh nghiệp có thể triển khai các chiến lược sau:

  1. Điều chỉnh chi tiêu marketing: Tăng 35% ngân sách cho kênh tìm kiếm tự nhiên và giới thiệu, giảm 20% ngân sách cho các kênh có LTV thấp.
  2. Chương trình giữ chân khách hàng có mục tiêu: Triển khai chương trình VIP cho 20% khách hàng có LTV cao nhất, tăng tỷ lệ giữ chân từ 70% lên 85%.
  3. Tối ưu hóa trải nghiệm onboarding: Cải thiện quy trình 30 ngày đầu tiên, dẫn đến tăng 25% LTV cho khách hàng mới.
  4. Dự báo ngân sách chính xác hơn: Sử dụng dự đoán LTV để lập kế hoạch tài chính dài hạn, giảm sai số dự báo doanh thu từ 18% xuống còn 7%.

5. Kết luận

Đối với một Data Analyst, việc làm chủ phân tích LTV đòi hỏi sự kết hợp nhuần nhuyễn giữa kiến thức thống kê, hiểu biết về kinh doanh và kỹ năng lập trình.

Không có mô hình hay công thức nào có thể áp dụng chung cho tất cả doanh nghiệp - cốt lõi của phân tích LTV hiệu quả nằm ở khả năng linh hoạt điều chỉnh phương pháp phù hợp với đặc điểm riêng của từng ngành, mô hình kinh doanh và chu kỳ khách hàng.

Bài viết liên quan

Đăng ký nhận thông báo

Đừng bỏ lỡ những bài viết thú vị từ 200Lab