Trong bài viết này, chúng ta sẽ tìm hiểu về Data Visualization Cheat Sheet phổ biến nhất. Data Visualization là một trong những kỹ năng về dữ liệu được sử dụng rộng rãi nhất hiện nay.
Trong Data Visualization Cheat Sheet này, chúng ta sẽ tìm hiểu về cách sử dụng và ứng dụng chúng vào các trường hợp.
Data Visualization cho phép bạn hiển thị một xu hướng theo thời gian. Dưới đây chúng ta có các biểu đồ như:
- Biểu đồ đường (Line chart): minh họa những thay đổi theo thời gian. Trục x thường là một khoảng thời gian, trục y là số lượng.
- Multi-line chart: nắm bắt nhiều biến số theo thời gian. Nó có thể bao gồm nhiều trục cho phép so sánh các đơn vị và phạm vi khác nhau.
- Biểu đồ khu vực (Area chart): là sự điều chỉnh của biểu đồ đường trong đó khu vực dưới đường được điền vào để nhấn mạnh tầm quan trọng của nó. Màu tô cho khu vực dưới mỗi dòng nên hơi trong suốt để có thể thấy được các khu vực chồng lấp.
- Biểu đồ vùng xếp chồng (Stacked area chart): là một dạng biểu đồ phức hợp của dạng biểu đồ vùng.
- Biểu đồ spline (Spline chart): là phiên bản của biểu đồ đường, chúng khác nhau ở chỗ, dữ liệu được kết nối với các dấu chấm tạo thành đường cong để tính ra các giá trị bị thiếu, trái ngược với biểu đồ đường.
Tiếp đến, chúng ta sẽ đến với Data Visualization thể hiện mối quan hệ giữa các điểm dữ liệu. Dưới đây, chúng ta có các biểu đồ như:
- Biểu đồ thanh (Bar chart): đây được xem là một trong những biểu đồ dễ đọc nhất, giúp so sánh các dữ liệu phân loại. Một trục chứa các danh mục, trục còn lại chứa các giá trị.
- Biểu đồ cột (Column chart): được sử dụng để so sánh giữa các danh mục khác nhau hoặc có thể so sánh một danh mục theo thời gian. Bạn có thể sử dụng biểu đồ này để xem doanh thu trên mỗi trang hoặc khách hàng theo ngày.
- Biểu đồ phân tán (Scatter plot chart): là biểu đồ thường được sử dụng khi cần quan sát mối quan hệ giữa hai biến. Đây được xem là biểu đồ khá hữu ích khi nó nhanh chóng xác định mối tương quan tiềm năng giữa các điểm dữ liệu.
- Connected scatterplot: là sự kết hợp giữa biểu đồ phân tán (Scatter plot chart) và biểu đồ đường (Line chart), các dấu chấm phân tán sẽ được kết nối lại với nhau tạo thành một đường thẳng.
- Biểu đồ bong bóng (Bubble charts): là một biến thể của biểu đồ phân tán, trong đó điểm dữ liệu được thay thế bằng bong bóng và một kích thước bổ sung của dữ liệu được thể hiện bằng kích cỡ bong bóng. Biểu đồ bong bóng sẽ có 3 giá trị là giá trị x, giá trị y và giá trị z (kích cỡ).
- World cloud chart: được hiểu là một hình ảnh trực quan, thể hiện các từ phổ biến nhất xuất hiện trong văn bản. Được sử dụng để hình dung mối quan hệ giữa các từ khác nhau hoặc để nắm bắt xu hướng về các từ phổ biến nhất.
Tiếp đến, chúng ta sẽ đến với Data Visualization hiển thị các danh mục con trong một danh mục lớn.
- Biểu đồ tròn (Pie chart): là một trong những biểu đồ phổ biến nhất thể hiện một phần trong toàn bộ dữ liệu, thường được sử dụng theo tỷ lệ phần trăm.
- Biểu đồ bánh donut (Donut pie chart): là một biến thể của biểu đồ hình tròn (Pie chart), dạng này không khác gì biểu đồ tròn ngoại trừ phần rỗng bên trong.
- Bản đồ nhiệt (Heat maps): à một công cụ thể hiện dữ liệu trực quan hành vi của người dùng truy cập vào website thông qua màu sắc. Màu nóng là nơi được tương tác nhiều nhất và màu lạnh là nơi tương tác ít nhất.
- Biểu đồ cột xếp chồng (Stacked column chart): biểu thị các giá trị ở dạng cột xếp chồng. Dùng biểu đồ này khi có nhiều chuỗi dữ liệu và muốn nhấn mạnh tổng số. Để so sánh các danh mục con trong dữ liệu phân loại và cũng có thể được sử dụng để so sánh tỷ lệ phần trăm.
- Biểu đồ dạng cây (Treemap charts): đặc biệt hữu dụng khi bạn muốn so sánh tỷ lệ các phần dữ liệu trong cùng cấp bậc. Tuy vậy, biểu đồ này không thể hiện được rõ ràng các cấp bậc từ cao nhất xuống thấp nhất.
Các Data Visualization này cho phép bạn trực quan hóa một điểm dữ liệu duy nhất với các biểu đồ sau:
- Thẻ (Card): để hiển thị và theo dõi chỉ số KPI trong trang tổng quan hoặc bản trình bày.
- Biểu đồ bảng (Table chart): sử dụng trên các tập dữ liệu nhỏ, hiển thị dữ liệu trong một bảng.
- Biểu đồ đo (Gauge chart): là biểu đồ có một cung tròn và hiển thị một giá trị duy nhất đo lường giá trị so với mục tiêu hoặc chỉ số hiệu suất chính (KPI). Vạch kim trong biểu đồ thể hiện mục tiêu hoặc giá trị của mục tiêu được đề ra.
Những Data Visualization này cho phép bạn hình dung về sự phân bố của một biến
- Histograms: là một dạng biểu đồ thể hiện tần suất dạng cột, hiển thị sự phân bố của một biến. Trục x thể hiện phạm vi và trục y biểu thị tần số.
- Biểu đồ hộp (Box plot): là biểu đồ diễn tả 5 vị trí phân bố của dữ liệu: giá trị nhỏ nhất (min), tứ phân vị thứ nhất (Q1), trung vị (median), tứ phân vị thứ 3 (Q3) và giá trị lớn nhất (max).
- Biểu đồ Violin (Violin plot): tương tự như biểu đồ nến. Được sử dụng để thể hiện sự so sánh của một phân phối thay đổi (hoặc phân phối mẫu) trên các "danh mục" khác nhau.
- Biểu đồ mật độ (Density plot): tương đối giống với biểu đồ chữ nhật, khi có một đường cong trơn nối liền các đỉnh trong biểu đồ chữ nhật với nhau.
Các Data Visualization này cho phép bạn hình dung cách các điểm dữ liệu flow vào nhau.
- Biểu đồ Sankey (Sankey chart): là một loại sơ đồ dòng trong đó chiều rộng của các mũi tên tỷ lệ với tốc độ dòng chảy. Dòng chảy này có thể là bất kỳ đại lượng nào có thể đo lường được.
- Biểu đồ Chord: để trình bày các mối quan hệ hoặc luồng có trọng số giữa các nút, hữu ích khi làm nổi bật các luồng chi phối.
- Biểu đồ Network: bao gồm các nút và các cạnh liên kết với nhau. Nó minh họa các mục khác nhau có mối quan hệ với nhau như thế nào.
Bài viết được dịch tại đây.
Bạn có thể nhấn vào link này để tham gia vào nhóm và nhận thêm nhiều tài liệu hữu ích khác về Data nhé!
Pum
Life is short. Smile while you still have teeth :)
Bài viết liên quan
Tìm hiểu SQL: Hướng dẫn Prompt SQL với ChatGPT, Copilot
Dec 07, 2024 • 11 min read
Database (Cơ sở dữ liệu) là gì? Những loại Database phổ biến nhất hiện nay
Sep 01, 2024 • 11 min read
Python là gì? Những đặc điểm nổi bật và Ứng dụng của Python
Aug 28, 2024 • 14 min read
Ứng dụng Hypothesis Testing - Kiểm định giả thuyết trong Y học
Jul 18, 2024 • 8 min read
Google Colab là gì? Hướng dẫn sử dụng Google Colab cho người mới
Jul 02, 2024 • 10 min read
Hướng dẫn cách lấy dữ liệu Facebook Ads Tự động Mỗi ngày Miễn phí - Phần 2
Jun 24, 2024 • 6 min read