Data Visualization có thể khó với bạn, đặc biệt là đối với các thuật ngữ chuyên ngành. Vì thế, 200Lab đã tổng kết lại 10 thuật ngữ chính yếu nhất trong Data Visualization mà bạn cần biết.
Những thuật ngữ đó là gì, bạn hãy cùng theo dõi tiếp bài viết để biết nhé!
Format
Interactive visualisations (trực quan động) cho phép người dùng sửa đổi, thao tác và khám phá dữ liệu. Bạn có thể dễ dàng tìm thấy các interactive visualisations trên web nhưng ngày nay, bạn vẫn có thể tìm thấy chúng dễ dàng thông qua máy tính bảng hoặc điện thoại.
Ngược lại với interactive visualisations, static visualisation (trực quan tĩnh) chỉ hiển thị một màn hình dữ liệu, không có tương tác và thường được sử dụng với mục đích xem dữ liệu trên bản in cũng như trên màn hình.
Chart type
Có nhiều cách để thể hiện dữ liệu, bạn có thể sử dụng marks, shapes (bố cục) và các layouts (hình dạng) khác nhau: gọi chung chúng là biểu đồ.
Có một số biểu đồ phổ biến và thông dụng, bạn có thể biết như biểu đồ thanh (bar chart), biểu đồ tròn (pie chart) và biểu đồ đường (line chart). Bên cạnh đó có một số biểu đồ còn mới có thể bạn chưa biết như biểu đồ sankey, tree map, bản đồ choropleth.
Dataset
Dataset là một tập hợp dữ liệu. Tập dữ liệu dưới dạng tablet với các hàng (row) tương ứng với một thành viên nhất định của tập dữ liệu được đề cập và cột (column) đại diện cho một biến cụ thể và chúng thường tồn tại trong spreadsheet và database.
Data source
Data source là vị trí chính từ nơi dữ liệu đến. Nguồn dữ liệu là cơ sở dữ liệu, tập dữ liệu, bảng tính hoặc thậm chí là dữ liệu được mã hóa cứng. Khi dữ liệu được hiển thị, nó được truy xuất từ nguồn dữ liệu của nó.
Nó thường xuất hiện gần tiêu đề hoặc cuối trang. Nếu visualisation đi kèm với một bài báo, bạn sẽ tìm thấy nó trong văn bản đi kèm.
Axis
Có nhiều loại biểu đồ sẽ có trục. Trục sẽ gồm có trục hoành (X) và trục tung (Y), các trục này sẽ giúp bạn xác định được vị trí của các giá trị dữ liệu.
Scale
Thang đo cho bạn biết phạm vi giá trị của dữ liệu và thường được trình bày dưới dạng khoảng (10, 20, 30,...). Thang đo sẽ đại diện cho các đơn vị đo lường chẳng hạn như giá (prices), khoảng cách (distances), năm (years) hoặc phần trăm (percentages).
Legend
Khi bạn xem biểu đồ, bạn sẽ thấy các trực quan khác nhau như màu sắc, hình dạng, kích thước nhằm để hiển thị các giá trị khác nhau của dữ liệu. Lúc này bạn sẽ cần xem legend để được giải thích các trực quan đó là gì giúp bạn đọc được ý nghĩa của biểu đồ.
Variables
Variables là một vật chứa, mà ở đó chúng sẽ chứa các loại dữ liệu khác nhau. Ví dụ như: tên, ngày sinh, giới tính và mức lương của một nhân viên.
Có nhiều loại biến số khác nhau như: định lượng (ví dụ: tiền lương), phân loại (ví dụ: giới tính), những biến số khác (ví dụ: tên).
Biểu đồ sẽ thể hiện mối quan hệ giữa các biến. Ví dụ như biểu đồ thanh (bar chart) ở phía bên phải sẽ hiển thị số lượng nhân viên (chiều cao của thanh), hiển thị theo phòng ban (các cụm khác nhau) được chia nhỏ theo giới tính (các màu khác nhau).
Outliers
Các điểm ngoại lai là những điểm dữ liệu nằm ngoài phạm vi dữ liệu thông thường. Nhìn hình ví dụ bên dưới, bạn sẽ thấy trục X và trục Y tỷ lệ thuận với nhau, trục X tăng thì trục Y cũng sẽ tăng theo.
Đôi khi sẽ có các bit dữ liệu riêng lẻ không phù hợp với dữ liệu thông thường, như chấm màu cam rong hình, đó sẽ là những điểm ngoại lai.
Input area
Input area cho phép bạn nhập thông tin vào hình ảnh trực quan, bạn có thể tìm kiếm tên, địa điểm,... những tìm kiếm đó sẽ được sử dụng trong hình ảnh trực quan.
Lời kết
Hy vọng là sau bài viết này, bạn đã nắm được những thuật ngữ chính trong Data Visualization giúp bạn chinh phục được chúng nhé!
Nếu bạn có định hướng trở thành Data Analyst chuyên nghiệp thì bạn có thể tham khảo bộ khóa học toàn diện chuyên nghiệp với combo 4 khóa học trong 1 bootcamp của 200Lab: https://200lab.io/khoa-hoc/khoa-hoc-data-analysis
Ngoài ra, bạn có thể nhấn vào link này để tham gia vào nhóm và nhận thêm nhiều tài liệu hữu ích khác về Data nhé!
Pum
Life is short. Smile while you still have teeth :)
Bài viết liên quan
Database (Cơ sở dữ liệu) là gì? Những loại Database phổ biến nhất hiện nay
Sep 01, 2024 • 11 min read
Python là gì? Những đặc điểm nổi bật và Ứng dụng của Python
Aug 28, 2024 • 14 min read
Ứng dụng Hypothesis Testing - Kiểm định giả thuyết trong Y học
Jul 18, 2024 • 8 min read
Google Colab là gì? Hướng dẫn sử dụng Google Colab cho người mới
Jul 02, 2024 • 10 min read
Hướng dẫn cách lấy dữ liệu Facebook Ads Tự động Mỗi ngày Miễn phí - Phần 2
Jun 24, 2024 • 6 min read
Hướng dẫn cách lấy dữ liệu Facebook Ads Tự động Mỗi ngày Miễn phí- Phần 1
Jun 24, 2024 • 11 min read