Facebook Pixel

Data Envelopment Analysis (DEA) là gì? Giải thích dễ hiểu

02 Apr, 2024

Data Envelopment Analysis hay Phân tích hiệu suất dữ liệu là một kỹ thuật đo lường hiệu suất dùng để đánh giá hiệu quả các đơn vị ra quyết định

Data Envelopment Analysis (DEA) là gì? Giải thích dễ hiểu

Mục Lục

Các tập đoàn toàn cầu nổi tiếng trong nhiều lĩnh vực chẳng hạn như gã khổng lồ trong ngành sản xuất ô tô: Toyota và Ford, tổ chức chăm sóc sức khỏe như Kaiser Permanente, tổ chức giáo dục nổi tiếng như Đại học Harvard, hay ngay cả các cơ quan chính phủ lớn, đã áp dụng DEA để hợp lý hóa hoạt động, nâng cao năng suất và tối ưu hóa hiệu suất hoạt động của họ.

Vậy DEA thật sự là gì? Lịch sử hình thành của nó ra sao, và nó hoạt động như thế nào? Các bạn cùng tìm hiểu trong bài viết dưới đây cùng 200lab nhé

1. Phân tích hiệu suất dữ liệu (DEA) là gì?

Phân tích hiệu suất dữ liệu(DEA) là một phương pháp tiếp cận phi tham số (non-parametric) để tính toán hiệu suất tướng đối của các đơn vị ra quyết định (Decision Making Unit - DMU).

Decision Making Unit (DMU) là cá nhân, tổ chức, doanh nghiệp, đơn vị sản xuất mà chúng ta muốn đánh giá hiệu suất của chúng. Bạn có thể hiểu đơn giản DMU là đối tượng mà bạn nhắm đến như đánh giá hiệu suất ví dụ  các chi nhánh trong một chuỗi ngân hàng

Hiệu suất (Efficiency) , hiệu quả hay năng suất hoặc các khái niệm tương tự như vậy, được sử dụng để tính toán, so sánh kết quả đầu ra (outputs) thu được tương ứng với đầu vào (inputs) cho trước.

Công thức 1: Hiệu suất riêng lẻ

Ví dụ: năng suất lao động có thể được tính bằng số sản phẩm/số lao động; tỉ suất lợi tức đo bằng lợi nhuận/vốn, ...

Trên thực tế một DMU thường sử dụng một tổ hợp các yếu tố đầu vào để thu được một loạt các yếu tố đầu ra, nghĩa là lúc này bạn có nhiều input đầu vào nhằm tạo ra  một kết quả đâu ra. Do đó, việc đánh giá hiệu quả của DMU đó thường phải dựa trên nhiều chỉ số hiệu quả khác nhau (đánh giá hiệu quả tổng hợp).

Nếu giả thiết một DMU sử dụng m yếu tố đầu vào x để sản xuất n yếu tố đầu ra y với cách thức phối hợp các đầu vào và đầu ra nhất định theo hai bộ trọng số tương ứng v và u , thì chỉ số hiệu quả có thể được tính như  sau:

Công thức 2: Tính hiệu quả tổng hợp

DEA tìm kiếm tổ hợp trọng số u,v của mỗi DMU sao cho giá trị của chỉ số hiệu quả đạt maximum và nhỏ hơn hoặc bằng 1. Theo đó các DMU có E = 1 được coi là hiệu quả và DMU < 1 được coi là kém hiệu quả. Điều này có thể thực hiện được bằng cách giải bài toán tối ưu hóa cho  từng DMU. Bạn có thể hiểu đơn giản là nếu bạn tốn 10đ vốn để thu được 8đ lợi nhuận thì E sẽ nhỏ hơn 1, nó phản ánh sự không hiệu quả và ngược lại.

Giả sử chúng ta đánh giá hiệu quả của z DMU theo công thức:

Công thức 3: Công thức toán học DEA cổ điển

Lưu ý: Trong trường hợp đánh giá hiệu quả với 1 input và 1 output duy nhất thì công thức tính hiệu quả tổng hợp (Công thức 2) của DMU sẽ tương ứng với công thức tính hiệu quả riêng lẻ (Công thức 1).

2.Cách tính toán  hiệu suất E ?

2.1 Lợi ích của DEA

DEA cho phép bạn tính đến tất cả các yếu tố quan trọng ảnh hưởng đến hiệu suất của mỗi DMU sau đó đưa ra đánh giá đầy đủ và toàn diện về tất cả các DMU được đưa vào phân tích. Nó thực hiện điều này bằng cách chuyển đổi tổ hợp nhiều đầu vào và đầu ra thành một thước đo duy nhất về hiệu quả sản xuất (E - theo công thức 3).

Sau khi tính toán chỉ số hiệu quả của từng DMU, DEA sẽ xác định được những đơn vị nào đang hoạt động tương đối hiệu quả (E = 1) và những đơn vị nào hoạt động kém hiệu quả (E < 1).

Với các DMU hoạt động kém hiệu quả DEA cho chúng ta biết cần phải giảm đầu vào hoặc tăng đầu ra ở mức độ nào để các DMU đó trở nên hiệu quả. Do đó, DEA giúp các nhà quản lý trả lời câu hỏi:

  • Các DMU đang hoạt động tốt như thế nào?  
  • Nó có thể cải thiện thêm được bao nhiêu?  

Mục tiêu của bài viết này là giúp các bạn không có background tech cũng có thể hiểu về DEA, nên bây giờ chúng ta sẽ minh họa DEA bằng một ví dụ đơn giản với một input và một hoặc hai output để giải thích về DEA đơn giản nhất có thể nhé!

Lưu ý: Bài viết sẽ không đi sâu vào việc chứng minh các công thức toán học, giải các bài toán tối ưu hoá, trong trường hợp các bạn muốn tìm hiểu sâu về toán thì hẹn các bạn ở những bài viết sau của 200lab nhé!

2.2 Bài toán hiệu suất với 1 input và 1 output

2.2.1 Đề bài

Ví dụ 1: Ngân hàng B có 6 chi nhánh đặt tại nhiều thành phố khác nhau ở Anh. Đối với mỗi chi nhánh, chúng ta xem xét một output duy nhất (số lượng giao dịch đã hoàn thành mỗi năm) và một input duy nhất (số lượng nhân viên).

2.2.2 Tính hiệu suất

=> Chỉ số hiệu quả của mỗi chi nhánh sẽ được tính bằng số giao dịch đã được xử lý / số nhân viên theo số liệu của bảng 1 dưới đây:

Bảng 1: Hiệu suất các chi nhánh ngân hàng B

Nhìn vào kết quả trong bảng 1 chúng ta thấy rằng Glasgow là chi nhánh có hiệu quả cao nhất bởi mỗi nhân viên xử lý được 8750 giao dịch mỗi năm và Cardiff là chi nhánh có hiệu quả thấp nhất với 3500 giao dịch được xử lý mỗi năm/ 1 nhân viên.

Tiếp theo chúng ta sẽ tính hiệu quả tương đối của các chi nhánh khác so với chi nhánh hiệu quả nhất là Glasgow theo số liệu trong bảng 2 dưới đây.

Bảng 2: Hiệu quả tương đối của các chi nhánh ngân hàng B

=> Glasgow đạt hiệu quả 100% trong việc sử dụng nguồn lực đầu vào nhất định (số nhân viên) để tạo ra đầu ra (số lượng giao dịch). Trong khi đó các chi nhánh khác hoạt động tương đói kém hiệu quả như Cardiff chỉ đạt 40% hiệu quả ...

2.2.3 Đánh giá hiệu suất và Đề xuất giải pháp

Câu hỏi đặt ra là tiếp theo chúng ta nên hành động thế nào với các chi nhánh kém hiệu quả?

DEA cung cấp cho chúng ta hai cách giải quyết:

  • Tối thiểu hoá các yếu tố đầu vào: chấp nhận mức sản lượng đầu ra của các DMU kém hiệu quả và cắt giảm các yếu tố đầu vào để đạt được mức sản lượng đầu ra tương ứng.
    Nếu Cardiff lựa chọn mục tiêu tối thiểu hoá vào và chấp nhận mức sản lượng như cũ thì cần giảm 60% số lượng nhân viên để đạt được hiệu quả hoạt động ở mức 100%. Lúc đó chỉ số hiệu quả của nó được tính bằng ((35 : 4) :8.75)*100% = 100%
  • Tối đa hoá đầu ra: giữ nguyên số lượng về các yếu tố đầu vào và đặt mục tiêu về sản lượng đầu ra tối đa.
    Ví dụ: Birmingham cần giữ nguyên số lượng nhân viên và đặt mục tiêu mỗi nhân viên cần xử lý 8750 giao dịch mỗi năm để đạt mức hiệu quả tối đa 100%.

2.3 Bài toán hiệu suất với 1 input và 2 output

2.3.1 Đề bài

Ví dụ 2: Ngân hàng B sử dụng  1 input (số lượng nhân viên), và 2 output (số giao dịch từ khu vực khách hàng các nhân và khách hàng doanh nghiệp) để đánh giá hiệu quả được thể hiện trong bảng 3 dưới đây:

Bảng 3: Số liệu của ngân hàng B với 1 input, 2 outputs

Bây giờ, chi nhánh Leeds trong một năm có 80,000 giao dịch từ khách hàng cá nhân và 52,000 giao dịch từ khách hàng doanh nghiệp và 22 nhân viên đã được tuyển dụng.

2.3.2 Tính hiệu suất

Vậy làm thế nào để đo lường hiệu suất của các chi nhánh ngân hàng B bằng cách sử dụng dữ liệu này? Trên thực tế đối với bài toán DEA với nhiều input và output, sau khi đã xác định được input vào output đầy đủ, tiếp theo chúng ta sẽ chuẩn hoá dữ liệu.

Sau đó, chúng ta sẽ giải bài toán tối ưu hoá cho từng chi nhánh theo công thức DEA cổ điển phía trên(công thức 3).

Bạn có thể sử dụng các phần mềm tính toán thông dụng cho DEA, hoặc sử dụng các package hỗ trợ tính toán DEA trong các ngôn ngữ lập trình như pyDEA, DEA của python, ... hay dea, deaR của R ... để giải các bài toán tối ưu hoá này nhé.

Trong bài viết này mình giả định là trọng số tối ưu nhất của tất cả các input và output đều là 1. Lúc này, hiệu quả của mỗi chi nhánh có thể được xác định bằng cách chia từng đầu ra cho đầu vào và xem nhánh nào có tỷ lệ cao nhất theo số liệu trong bảng 4 dưới đây:

Bảng 4: Kết quả hiệu suất riêng lẻ cho mỗi Output

=> Chúng ta có thể thấy rằng Glasgow có tỷ lệ giao dịch cá nhân trên mỗi nhân viên cao nhất, trong khi Manchester có tỷ lệ giao dịch doanh nghiệp trên mỗi nhân viên cao nhất. Còn các chi nhánh còn lại có thể coi là đang hoạt động kém hiệu quả hơn.

2.3.3 Đánh giá hiệu suất và Đề xuất giải pháp

Với ví dụ 1 chúng ta kết hợp các yếu tố đầu vào và đầu ra để đưa ra một chỉ số hiệu quả duy nhất, nhưng ở bài toán này chúng ta đang có hai chỉ số hiệu quả cho giao dịch cá nhân và giao dịch doanh nghiệp.

Nên sử dụng biện pháp nào để kết hợp đánh giá hai chỉ số hiệu quả này?

Cách đơn giản nhất là chúng ta sẽ sử dụng cách giải thích hình học, trong ví dụ này chúng ta sẽ sử dụng biểu đồ Frontier sau:

Hình 1: biểu đồ Frontier (Nguồn banxia.com)

Các điểm trên biểu đồ do Glasgow và Manchester  thể hiện thể hiện mức độ hiệu quả vượt trội so với tất cả các chi nhánh khác.

Theo nguyên lý hoạt động của DEA, thì tập hợp tất cả những điểm có hiệu quả tốt nhất tạo thành đường biên hiệu quả (PPF). Những DMU nằm trên PPF được coi là hiệu quả và nằm dưới PPF được coi là kém hiệu quả.

2.3.3.1 Khái niệm đường biên hiệu quả

Đường biên hiệu quả hay còn gọi là đường giới hạn khả năng sản xuất (Production Possibility Frontier – PPF) là đường mô tả các tổ hợp sản lượng hàng hóa tối đa mà nó có thể sản xuất ra được khi sử dụng toàn bộ các nguồn lực sẵn có.

Hình 2: Đồ thị đường biên hiệu quả

Trong ví dụ này 2 điểm hiệu quả nhất là  Glasgow và Manchester (hiệu quả tương đối là 100%), đường thẳng nối 2 điểm này, và một đường thẳng đứng từ Glasgow đến trục x và từ Manchester đến trục y  là đường biên hiệu quả.

=> Các chi nhánh tương tụ như Cardiff, Leeds ... là nhưng chi nhánh kém hiệu quả.

Lưu ý: Về mặt toán học, đường biên hiệu quả là bao lồi của dữ liệu.

2.3.3.2 Hiệu quả tương đối của mỗi chi nhánh

Lúc này chúng ta lại cần sử dụng tới đại số tuyến tính một chút =). Chúng ta cần tìm toạ độ điểm giao nhau của đường biên hiệu quả và đường thẳng nối từ gốc toạ độ đến các điểm kém hiệu quả. (Các bạn quan tâm đến công thức toán học có thể xem cách giải chi tiết về mặt toán học trong hình 2)

Hình 2: Cách tìm kết hợp hiệu quả nhất cho các DMU

Sau đó hiệu quả tương đối của chi nhánh Cardiff sẽ được tính bằng cách:

Hình 3: Cách tính hiệu quả tương đối cho các DMU

=> Cardiff hiệu suất tương đối là 41%. Tương tự, London có hiệu suất 75%, Leeds 71% và Birmingham 46%.

2.3.3.3 Đánh giá hiệu suất

Nếu Cardiff  đặt mục tiêu tối đa hoá đầu ra và giữ nguyên số lượng nhân viên  thì mỗi nhân viên cần đạt mục tiêu xử lý  5651 giao dịch cá nhân và 2942 giao dịch doanh nghiệp mỗi năm.

Nếu Cardiff lựa chọn phương án tối thiểu hoá đầu vào và giữ nguyên mức sản lượng đầu ra, thì cần giảm đi khoảng 59% nhân sự. Tương tự với các chi nhánh hoạt động kém hiệu quả khác.

Lưu ý: Trong ví dụ đơn giản trên, chúng ta chỉ có một input và hai output thì việc phân tích DEA thực hiện trên các giải thích về mặt hình học như trên sẽ dễ hiểu. Nếu chúng ta có từ 2 đầu vào và 2 đầu ra trở lên thì DEA phải được giải thích trên cơ sở toán học (Công thứ 3) thay vì đồ thị hình học.

3. Lịch sử hình thành và các biến thể của DEA.

Trong 46 năm hình thành và phát triển DEA đã có rất nhiều cải tiến để giải quyết một số hạn chế của các mô hình giai đoạn trước (Hình 4). DEA có thể chia thành những loại như:

  • Classical DEA methods   
  • Extended DEA methods
  • Multistage and multi-level DEA models
  • Stochastic and Fuzzy DEA techniques
  • Hybrid DEA models
  • AI/ML assisted DEA models
Hình 4: Quá trình phát triển của DEA model (Nguồn Springer Link)

Trong bài viết này mình sẽ nói chi tiết về các mô hình cổ điển của DEA. Còn lại 200lab sẽ giới thiệu đến các bạn trong bài viết sau nhé!

3.1 Các mô hình DEA cổ điển (Classical DEA methods)

3.1.1 Mô hình CCR (CRS)

Năm 1978 mô hình CCR của Charnes, Cooper và Rhodes ra đời. CCR xác định hiệu suất tốt nhất bằng cách so sánh mỗi đối tượng với các đối tượng tốt nhất. Theo như công thức 3.

Mô hình CCR giả định rằng hiệu quả không đổi theo quy mô (Constant Returns to Scale - CRS). Nghĩa là đầu ra thay đổi cùng tỉ lệ với thay đổi của đầu vào (Ví dụ: tăng gấp đôi tất cả đầu vào thì sản lượng đầu ra sẽ tăng gấp đôi)

3.1.2 Mô hình BCC (VRS)

Năm 1984, Banker, Charnes và Cooper cho ra đời mô hình BCC cho rằng hiệu quả thay đổi theo quy mô (Variable returns to scale - VRS). VRS phản ánh thực tế rằng công nghệ sản xuất có thể mang lại lợi nhuận tăng dần hoặc giảm dần theo quy mô.

Với BCC khi DMU đạt giới hạn hiệu quả, nếu tăng thêm yếu tố đầu vào có thể đang dư thừa nguồn lực đầu sự phân bổ nguồn lực không hiệu quả.

Công thức toán học của mô hình BCC được thể hiện trong công thứ 4 dưới đây:

Công thức 4: Công thức toán học mô hình BCC

4. Phân tích ưu điểm và hạn chế của DEA

4.1 Ưu điểm

Phương pháp tiếp cận phi tham số : khi sử dụng DEA chúng ta không cần giả định mối quan hệ hàm số  giữa các yếu tố đầu vào và yếu tố đầu ra.

Không giới hạn số lượng đầu vào/đầu ra: DEA có thể xử lý nhiều đầu vào và đầu ra, đáp ứng được độ phức tạp của các bài toán đo lường hiệu quả toàn diện trên thực tế.

No Need for Benchmarking: DEA sử dụng dữ liệu của các DMU đang được xem xét để so sánh trực tiếp với nhau mà không cần đến một đối tượng chuẩn mực đại diện cho tổng thể để làm tiêu chuẩn so sánh.

Sử dụng phép đo đầu vào đầu ra linh hoạt: DEA cho phép đầu vào đầu ra có đơn vị khác nhau.

4.2 Hạn chế

DEA không đưa ra nguyên nhân gây ra sự kém hiệu quả cho DMU: DEA tập trung vào việc so sánh hiệu quả giữa các đơn vị, nó không thể giải thích rõ ràng các yếu tố nào góp phần vào hiệu quả và các yếu tố nào gây ra hiệu quả kém.

Mô hình phụ thuộc vào số lượng input/output:

  • Ít input/output: Với quá ít đầu vào và đầu ra, mô hình DEA ​​có thể không phản ánh chính xác mức độ phức tạp trong hoạt động của DMU. Nhiều DMU chưa hiệu quả có thể bị xác định là hiệu quả do sự thiếu thông tin.
  • Nhiều input/output: Việc số lượng đầu vào và đầu ra lớn hơn nhiều so với số lượng DMU, ​​điều đó có thể dẫn đến việc đánh giá quá cao hiệu quả hoạt động của các DMU.

Kết quả mô hình rất nhạy cảm với kích thước mẫu: Khi tăng hoặc giảm số lượng DMU thì kết quả của phân tích DEA sẽ thay đổi rất nhiều.

5. Một số ứng dụng thực tế của DEA

Khả năng thích ứng linh hoạt bằng phương pháp tiếp cận phi tham số làm cho DEA trở thành công cụ đo lường hiệu quả hoạt động hữu ích trong đa dạng các lĩnh vực như ngân hàng, bệnh viện, hãng hàng không, cơ quan chính phủ và chính quyền địa phương

Nó được các nhà quản lý trong các tổ chức này sử dụng để thực hiện một số nhiệm vụ bao gồm:

  • Phân bổ nguồn lực: tái phân bổ từ nơi kém hiệu quả sang nơi hiệu quả
  • Xác định đơn vị hiệu quả nhất và kém hiệu quả hơn.
  • Xác định KPI cho các tổ chức
  • Giám sát sự thay đổi hiệu quả theo thời gian
  • Quy hoạch vị trí, địa điểm kinh doanh phù hợp ...

6. Kết luận

DEA giúp đánh giá hiệu quả hoạt động của các đơn vị sản xuất hay cung cấp dịch vụ, và cung cấp thông tin quan trọng để tăng hiệu quả sử dụng tài nguyên. Qua đó, DEA đóng vai trò quan trọng trong việc nâng cao hiệu suất và cạnh tranh của tổ chức trong môi trường kinh doanh ngày nay.

Mong rằng bài viết trên đã giúp các bạn hiểu hơn về DEA, và có thể ứng dụng nó thành công vào công việc của mình.

Các bài viết liên quan tại blog 200Lab:

Bài viết liên quan

Lập trình backend expressjs

xây dựng hệ thống microservices
  • Kiến trúc Hexagonal và ứng dụngal font-
  • TypeScript: OOP và nguyên lý SOLIDal font-
  • Event-Driven Architecture, Queue & PubSubal font-
  • Basic scalable System Designal font-

Đăng ký nhận thông báo

Đừng bỏ lỡ những bài viết thú vị từ 200Lab