, October 02, 2022

0 kết quả được tìm thấy

Hypothesis Testing là gì ? Các bước thực hiện Hypothesis Testing

  • Đăng bởi  Nga Vu
  •  Aug 19, 2022

  •   4 min reads
Hypothesis Testing là gì ? Các bước thực hiện Hypothesis Testing

Hypothesis là gì?

Hypothesis là một suy đoán (speculation), lý thuyết (theory) hay  giả định (assumption) không chắc chắn, chưa có căn cứ hoặc chứng minh đúng sai làm tiền đề cho việc nghiên cứu và kiểm nghiệm.

Ví dụ ta có giả định: Trung bình các gia đình ở Việt Nam có 2 người con.

Hypothesis Testing là gì?

Hypothesis Testing là quá trình đánh giá tính hợp lệ (đúng/sai) của một giả định bằng cách đánh giá dữ liệu mẫu (sample) từ đó đưa ra kết luận cho toàn bộ tập dữ liệu (population).

Các bước thực hiện Hypothesis Testing:

  • Bước 1: Write the hypothesis - Viết ra giả thiết
  • Bước 2: Create an analysis plan  - Tạo kế hoạch phân tích
  • Bước 3: Analyze the Data - Phân tích dữ liệu
  • Bước 4: Interpret the results - Trình bày kết quả

Bước 1: Viết ra các giả thiết

Ví dụ: Anna muốn kiểm tra giả thiết nếu mình tưới hoa bằng Soda thay vì nước bình thường thì Soda có làm cây phát triển nhanh hơn hay không. Anna đã tiến hành tưới 2 chậu cây 1 bằng Soda 1 bằng nước thông thường trong vòng 1 tháng và chứng minh rằng giả thiết của cô ấy đúng. Có 2 giả thiết mà cô ấy cần phải viết ra đó là:

  • Null Hypothesis: Loại nước tưới không có ảnh hưởng nào đến mức độ phát triển nhanh hay chậm của chậu hoa, đây là giả thiết mà Anna sẽ cố gắng bác bỏ, vì chỉ cần chứng minh Null Hypothesis thì giả thiết ban đầu của cô đã đúng. Hay nói một cách đơn giản giải thiết này cho rằng mọi chuyện chỉ là ngẫu nhiên thôi, không có mối quan hệ nào giữa loại nước và sự phát triển của cây
  • Alternative Hypothesis: Đây là giả thiết nghịch đảo của Null Hypothesis, Qua 1 tháng thì cây được tưới bằng soda sẽ phát triển nhanh hơn chậu cây tưới bằng nước thường. Giả thiết này cho rằng có mối quan hệ giữa loại nước tưới và sự phát triển của cây.

Trong quá trình kiểm định (Testing), chúng ta sẽ kết luận Null hay Alternative Hypothesis đâu mới là giả thiết đúng

Bước 2: Tạo kế hoạch phân tích

Trong bước này thì bạn sẽ chọn phương pháp Test phù hợp với giả thiết của mình: Chi-squared test, t-test, z-test, ... tính toán giá trị p-value (probability value) sau đó chọn ra vùng chấp nhận hoặc bác bỏ kết quả.

Giả sử với trường hợp tung đồng xu 6 lần, xác suất để 6 lần đầu mặt sấp là 1.56% (0.5^6), xác xuất này thật sự rất bé, nếu như gặp phải trường hợp trên để loại trừ gian lận thì ta sẽ đặt ra một ngưỡng chấp nhận Alpha α=5%, nếu như p-value <5% thì được xem như không hợp lệ

Acceptance and Rejection Region

Bước 3: Phân tích dữ liệu

Anna tiến hành apply t-test (tính giá trị trung bình) lên 2 tập dữ liệu:

  • Chiều cao trung bình của nhóm tưới bằng Soda : 5.2 cm
  • Chiều cao trung bình của nhóm tưới bằng nước thường: 4cm

Kết quả  thu được là mean(Soda) # mean(Plain Water)

Khi  tung đồng xu ta thu được xác suất 6 mặt sấp thì p-value=1.56% và alpha=5%

Bước 4: Trình bày kết quả

Do mean(Soda) # mean(Plain Water) chúng ta kết luận Null Hypothesis sẽ bị bác bỏ (sai). Khi Null Hypothesis sai thì Alternative Hypothesis sẽ đúng và ngược lại

Đối với bài toán tung đồng xu ta thu được xác suất 6 mặt sấp là p-value=1.56% <5% (alpha) kết luận Null Hypothesis cũng bị bác bỏ.

Nếu bạn có định hướng trở thành Data Analyst chuyên nghiệp thì bạn có thể tham khảo bộ khóa học toàn diện chuyên nghiệp với combo 4 khóa học trong 1 bootcamp của 200Lab tại đây.

Ngoài ra, bạn có thể nhấn vào link này để tham gia vào nhóm và nhận thêm nhiều tài liệu hữu ích khác về Data nhé!

Bài viết liên quan

Master data là gì? Sự khác nhau giữa Master data và Transaction data

Master data là tập hợp các định danh thống nhất và các thuộc tính mở rộng. Nó mô tả các thực thể cốt lõi của doanh nghiệp bao gồm khách hàng,.......

Master data là gì? Sự khác nhau giữa Master data và Transaction data
Danh mục các loại biểu đồ trong Data Visualization

Bạn có thể tìm thấy danh sách các loại biểu đồ, nó sẽ hoạt động như một hướng dẫn đầy hữu ích giúp bạn lựa chọn được biểu đồ phù hợp với nhu cầu của bản thân....

Danh mục các loại biểu đồ trong Data Visualization
Data Analysis with Excel: Analysis ToolPak

Bộ công cụ Analysis ToolPak trên Excel sẽ giúp bạn tiết kiệm thời gian và đơn giản hóa các bước phân tích dữ liệu tài chính, thống kê ....

Data Analysis with Excel: Analysis ToolPak
Data Analysis with Excel: Solver

Excel có một công cụ được gọi là solver cung cấp các lệnh và các tính năng tùy chỉnh để giải quyết các vấn đề quyết định....

Data Analysis with Excel: Solver
Data Analysis with Excel: What-If Analysis

What-If Analysis trong Excel cho phép bạn thử các giá trị (scenarios) khác nhau cho các công thức....

Data Analysis with Excel: What-If Analysis
You've successfully subscribed to 200Lab Blog
Great! Next, complete checkout for full access to 200Lab Blog
Xin chào mừng bạn đã quay trở lại
OK! Tài khoản của bạn đã kích hoạt thành công.
Success! Your billing info is updated.
Billing info update failed.
Your link has expired.