Facebook Pixel

Khám phá Data Visualization

16 Aug, 2022

Data Visualization hay còn gọi trực quan hóa dữ liệu là việc biểu diễn thông tin và dữ liệu dưới dạng chart, plots, infographics,...

Khám phá Data Visualization

Mục Lục

Data Visualization hay trực quan hóa dữ liệu, không chỉ là một phần không thể thiếu trong việc hiểu và phân tích dữ liệu mà còn là nghệ thuật biến những con số khô khan thành hình ảnh sống động dễ hiểu hay câu chuyện kinh doanh... Vậy Data Visualization mang lại lợi ích gì trong thế giới thông tin ngày nay? Hãy cùng 200lab đi tìm hiểu nhé!

Data Visualization là gì?

Data Visualization - trực quan hoá dữ liệu (hay còn gọi là mô hình hóa dữ liệu) là việc chúng ta mô tả một lượng lớn dữ liệu dưới dạng các hình ảnh trực quan như là bảng, biểu đồ, hay đồ thị (chart, plots, infographics) ...

Những mục tiêu chính của trực quan hóa dữ liệu  là giải thíchkhám phá

  • Giải thích: biểu diễn một khối lượng lớn dữ liệu dưới dạng hình ảnh trực quan, cung cấp thông tin liên quan cho người dùng để đáp ứng các hiểu biết cơ bản về đối tượng nghiên cứu (ví dụ: Lợi tức đầu tư hàng tháng của một quỹ đầu tư mạo hiểm)
  • Khám phá: cung cấp hiểu biết đa chiều về tập dữ liệu để người dùng khám phá, đặt câu hỏi và tìm ra thông tin chuyên sâu (ví dụ: Mức độ hiệu quả của các chi nhánh trong hệ thống ngân hàng B được đánh giá qua nhiều thông số khác nhau ROA, ROE, tỉ lệ nợ xấu, tỉ lệ giao dịch thành công ...)
Lịch sử trực hình thành quan hóa dữ liệu

Năm 1600 đặt nền móng với việc trình bày dữ liệu thống kê đơn giản, trải qua hàng trăm năm hình thành và phát triển trực quan hoá dữ liệu đã trở thành một công cụ rất quan trọng đối với hầu hết các ngành nghề chuyên môn.

Tại sao Data Visualization trở nên quan trọng?


Theo nghiên cứu khoa học của Đại học California State, đến 60% người có khả năng ghi nhớ nội dung phức tạp thông qua hình ảnh, trong khi chỉ có 10% nhớ nội dung từ bài thuyết trình bằng lời nói.

Bộ não con người xử lý hình ảnh ở tốc độ cực cao, tốt hơn rất nhiều so với các dạng trình bày khác như là kí hiệu , chữ viết hay là con số … và trực quan hóa dữ liệu chính là áp dụng lý thuyết này.

Một biểu đồ đơn giản cũng có thể biểu diễn thay thế cho rất nhiều dữ liệu. Thay vì các bạn đọc qua một rừng thống kê thì việc tìm thông tin chi tiết được tổng hợp gọn gàng theo cách trực quan hoá giúp bạn  nhanh chóng  hiểu thông điệp chính của dữ liệu.

Biểu diễn dữ liệu bằng hình ảnh giúp người dùng dễ dàng nhận biết được xu hướng, sự phân bố, cũng như là sự tương quan giữa các đặc tính của dữ liệu. từ đó đúc kết nhanh thông tin chuyên sâu và hỗ trợ trong việc ra quyết định tức thời.

Tính ưu việt của dashboard so với raw data

Làm tốt việc trực quan hóa dữ liệu là bạn loại bỏ được tình trạng dữ liệu bị nhiễu, làm nổi bật những thông tin hữu ích và nói lên câu chuyện mà bạn muốn kể bằng dữ liệu .

Khi nào cần trực quan hoá dữ liệu?

  • Khi cần trình bày thông tin 1 lượng lớn dữ liệu đến end user
  • Khi cần làm báo cáo report tổng kết, theo dõi một tiến trình nào đó có thể là campaign, doanh thu hàng ngày, hàng tháng … , so sánh kết quả, đánh giá chất lượng của thuật toán
Đánh giá chất lượng thuật toán bằng data visualization
  • Khám phá đặc tính, phát hiện bất thường của data nó là một bước quan trọng trong giai đoạn tiền xử lý dữ liệu để xây dựng một mô hình học máy hiệu quả.
Phát hiện bất thường của dữ liệu

Trong thời đại số hoá hiện nay thì  việc trực quan hoá dữ liệu ngày càng phổ biến, kéo theo đó là nhất nhiều công cụ trực quan hoá dữ liệu ra đời như:

Data Visualization được ứng dụng vào đâu?

Data visualization được ứng dụng hầu hết ở mọi ngành nghề, dưới đây là các ngành ứng dụng trực quan hóa phổ biến nhất.

Sales và marketing

Data Visualization giúp:

  • Theo dõi hiệu suất bán hàng
  • Phân tích hành vi khách hàng
  • Đánh giá hiệu quả chiến dịch quảng cáo
  • Dự báo xu hướng thị trường
  • Quản lý chuỗi cung ứng
  • Tối ưu hóa giá cả và khuyến mãi ...
Marketing Performance Monitor Dashboard

Chính trị (Politics)

Data visualize dùng để:

  • Phân Tích Xu Hướng Bầu Cử
  • Đánh Giá Chính Sách Công
  • Phân Tích Ý Kiến Công Chúng ...
Key presidential, congressional, gubernatorial and local election results

Chăm sóc sức khỏe (Healthcare)

Data Visualization giúp:

  • Theo dõi sức khỏe bệnh nhân
  • Quản lý điều phối vật tư
  • Theo dõi, phát hiện dịch bệnh
  • Phân Tích nghiên cứu lâm sàng
Dashboard theo dõi tình hình Covid-19

Các nhà khoa học (Scientists)

Trực quan khoa học, đôi khi được gọi tắt là SciVis, giúp chúng ta:

  • Phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA)
  • Phát hiện điểm bất thường (Anomaly detection)
  • Đánh giá hiệu suất model ...
EDA dashboard

Tài chính (Finance)

Bất kì chỉ số tài chính nào cũng có thể xây dựng báo cáo để theo dõi:

  • Biểu đồ xu hướng giá cổ phiếu / chứng khoán
  • Báo cáo phân tích lợi nhuận và chi phí
  • Theo dõi dòng tiền
  • Báo cáo hiệu suất đầu tư
  • Trực quan hóa rủi ro và phân bổ vốn
  • Biểu đồ sức khỏe tài chính cá nhân ...
Financial dashboard

Logistics

Data visualization trong ngành logistics giúp:

  • Theo dõi vận chuyển
  • Xây dựng dashboard quản lý kho hàng
  • Theo dõi mô hình tối ưu hóa tuyến đường
  • Phân tích tiêu thụ nhiên liệu
  • Báo cáo hiệu suất giao nhận
  • Phân tích xu hướng đặt hàng
  • Trực quan hóa mức độ ưu tiên vận chuyển
  • Báo cáo xuất nhập khẩu tổng hợp ...
Dashboard quản lý hàng tồn kho

Các loại Data Visualization

Map

Map visualization là một phương pháp phân tích và hiển thị các thông tin liên quan đến địa lý, chúng sẽ được trình bày một các chính xác trên các bản đồ.

Cách trực quan này nhằm mục đích phân phối dữ liệu theo khu vực. Vì bản đồ có thể là 2D hoặc 3D, tĩnh hoặc động, nên có rất nhiều cách kết hợp mà người ta có thể sử dụng để tạo bản đồ data visualization.

Dưới đây là những bản đồ sử dụng phổ biến nhất:

  • Bản đồ khu vực (Regional Maps): đây là bản đồ cổ điển, chúng sẽ hiển thị quốc gia, thành phố hoặc quận huyện. Chúng thường được trình bày bằng các màu sắc khác nhau ứng với các đặc điểm khác nhau.  
  • Bản đồ đường (Line Maps): thường chứa không gian và thời gian, minh họa những thay đổi theo thời gian. Trục x thường là một khoảng thời gian, trục y là số lượng.
  • Point Maps: bản đồ này sẽ phân phối dữ liệu thông tin địa lý. Chúng sẽ giúp các doanh nghiệp xác định chính xác vị trí tòa nhà của họ trong một khu vực.
  • Bản đồ nhiệt (Heat Maps): cho biết trọng lượng của một khu vực địa lý dựa trên một thuộc tính cụ thể. Ví dụ, một bản đồ nhiệt có thể phân bố độ bão hòa của những người bị nhiễm bệnh theo khu vực.

Chart

Biểu đồ trình bày dữ liệu dưới dạng graphs, diagrams và tables. Đôi khi, chúng thường bị nhầm lẫn với đồ thị. Đồ thị được xem là danh mục con của biểu đồ.

Tuy nhiên, có một sự khác biệt nhỏ: biểu đồ thể hiện mối quan hệ toán học giữa các nhóm dữ liệu và chỉ là một trong những phương pháp biểu đồ để biểu diễn dữ liệu.

Dưới đây là các chart được ứng dụng phổ biến nhất:

Bar Pie
Line Graph Scatter Plot

Bạn có thể tham khảo thêm bài viết này để hiểu hơn về cách sử dụng các chart này nha.

Data Visualization Cheat Sheet dành cho người mới
Data Visualization là một trong những kỹ năng về dữ liệu được sử dụng rộng rãi với các Data Visualization Cheat Sheet phổ biến nhất.

Tablets

Không giống như Map và Chart, Tablets hiển thị số liệu ở định dạng gần như thô. Tablets hiển thị số cụ thể mà bạn cần phải đọc hơn là trực quan.

Lời kết

Hy vọng thông qua bài viết này của 200Lab, bạn sẽ có cái nhìn tổng quát hơn về các chức năng, ưu điểm, ứng dụng trong Data Visualization nhé!

Nếu bạn có định hướng trở thành Data Analyst chuyên nghiệp thì bạn có thể tham khảo bộ khóa học toàn diện chuyên nghiệp với combo 4 khóa học trong 1 bootcamp của 200Lab tại đây.

Nếu bạn quan tâm đến cá bài viết khác về data visualization, hãy đọc thêm tại:

Bài viết liên quan

Lập trình backend expressjs

xây dựng hệ thống microservices
  • Kiến trúc Hexagonal và ứng dụngal font-
  • TypeScript: OOP và nguyên lý SOLIDal font-
  • Event-Driven Architecture, Queue & PubSubal font-
  • Basic scalable System Designal font-

Đăng ký nhận thông báo

Đừng bỏ lỡ những bài viết thú vị từ 200Lab