Nếu bạn đang thắc mắc sự khác biệt giữa Data Analysis và Data Analytics là gì ? Vì dịch ra tiếng việt chúng đều có ý nghĩa là Phân tích dữ liệu. Ngữ cảnh sử dụng của chúng có khác nhau không ? Thì bài viết này hoàn toàn phù hợp với bạn rồi đấy. Bây giờ chúng ta cùng đi vào nội dung thôi nào.
1. Data Analysis:
Data analysis is a process of inspecting, cleansing, transforming, and modellingdata with the goal of discovering useful information, informing conclusions, and supporting decision-making.[1] Data analysis has multiple facets and approaches, encompassing diverse techniques under a variety of names, and is used in different business, science, and social science domains.[2] In today's business world, data analysis plays a role in making decisions more scientific and helping businesses operate more effectively – Wikipedia
Theo như Wikipedia định nghĩa thì Data Analysis là một quá trình kiểm tra, làm sạch, chuyển đổi, và mô hình hóa dữ liệu với mục đích tìm ra các thông tin hữu ích, đưa ra kết luận và hỗ trợ ra quyết định của doanh nghiệp.
Data Analysis có nhiều khía cạnh và cách tiếp cận, bao gồm các kỹ thuật đã dạng có nhiều tên gọi và được ứng dụng rộng rãi trong các ngành từ kinh doanh, khoa học đến các lĩnh vực khoa học xã hội. Phân tích dữ liệu giúp doanh nghiệp đưa ra các quyết định có tính khoa học hơn giúp họ hoạt động hiệu quả hơn thay vì cứ quyết định theo cảm tính
Nói nôm na bạn có thể hiểu nó là việc bạn nghiên cứu dựa trên tập dữ liệu có sẵn mà không cần phải đi thu thập nó, rút ra được những thông tin hữu ích thì quá trình này được gọi là Data Analysis
2. Data Analytics:
Data analytics, or simply “Analytics”. The science that analyze crude data to extract useful knowledge (patterns) from them.
This process can also include data collection, organization, pre-processing,
transformation, modeling and interpretation. – A Gentle Introduction to Data Analysis (2018)
Data Analytics hay gọi ngắn gọn là Analytics là khoa học phân tích dữ liệu thô để trích xuất kiến thức hữu ích (patterns: các hành vi lặp đi lặp lại) từ chúng.
Quá trình này bao gồm việc:
- Data collection: Thu thập dữ liệu
- Organization: Tổ chức dữ liệu
- Preprocessing: Tiền xử lý
- Transformation: Biến đổi dữ liệu
- Modeling: Mô hình hóa
- Interpretation: Diễn giải kết quả phân tích cho các bên liên quan
Các bạn có thể tinh ý nhận thấy rằng khi đề cập đến Data Analytics bạn sẽ không có sẵn Data mà phải tổ chức việc đi thu thập bao gồm các việc như:
- Hiểu rõ kiến thức về lĩnh vực mà bạn đang làm (domain knowledge)
- Xác định được bài toán bạn cần phải giải quyết
- Xác định cấu trúc dữ liệu: bạn cần các thông tin xyz của khách hàng, cần thêm lịch sử mua hàng, track thêm hành vi sử dụng ứng dụng của họ, ...
- Làm việc với các Team liên quan để triển khai : Data Engineer, Backend, Frontend
- Kiểm tra chất lượng dữ liệu
Khác hẳn so với Data Analysis, bạn tiến hành phân tích trên các dữ liệu đã có sẵn => Data Analysis là tập con nằm trong Data Analytics như hình ở phía bên trên.
3. Nên sử dụng sao cho đúng
Theo kinh nghiệm cá nhân của mình bạn nên sử dụng Data Analysis trong ngữ cảnh công ty đang có sẵn dữ liệu, việc của bạn là phân tích chúng tìm ra insight, hoặc thực hiện Data Mining thì cực kì phù hợp để sử dụng cách gọi này.
Trong hoàn cảnh scope công việc của bạn lớn hơn, bạn cần phải xác định metrics, định nghĩa dữ liệu thu thập, sau đó là Phân tích dữ liệu nữa, thì bạn có thể nói là mình đang làm một Data Analytics Project.
Các bạn tham khảo thêm bài viết về các kỹ năng cần thiết cho một Data Analyst ở bên dưới nhé.

Bài viết liên quan
Thống kê mô tả - Descriptive Statistics - Phần 2
Trong phần này chúng ta sẽ tìm hiểu thống kê mô tả Descriptive Statistics qua khái niệm Measures of Central Tendency và Measures of Spread...
Thống kê mô tả - Descriptive Statistics - Phần 1
Cơ bản về thống kê chia ra làm 2 nhánh là thống kê mô tả (Descriptive Statistics) và thống kê suy luận (Inferential Statistics)...
Các kỹ thuật lấy mẫu trong Thống kê
Trong bài này mình sẽ liệt kê khái niệm về các phương pháp lấy mẫu hiện có, việc chọn mẫu sẽ ảnh hưởng trực tiếp đến kết quả phân tích và những suy luận của bạn...
Kiến thức cơ bản về Thống kê cho người mới
Nếu bạn đang thắc mắc Thống kê (Statistics) là gì, các khái niệm xung quanh nó dành cho một người hoàn toàn mới, thì bạn đến đúng nơi rồi đấy, những khái niệm này không đòi hỏi bạn phải có kiến thức nền về Toán đâu. Nào chúng ta hãy cùng bắt đầu thôi...
Tìm hiểu Naive Bayes Classification - Phần 1
Bài viết này chúng ta sẽ cùng nhau tìm hiểu Supervied Learning qua các ví dụ đơn giản, dễ hiểu nhưng rất thực tế...