Độ tin cậy và mức ý nghĩa

1. Quyết định mức ý nghĩa thống kê

Mục đích của suy luận thống kê và việc sử dụng các bài thống kê kiểm tra là để rút ra kết luận từ dữ liệu mẫu. Suy luận thống kê được sử dụng trong kiểm tra giả thuyết dựa trên lý thuyết xác suất. Kiểm tra ý nghĩa thống kê là kiểm tra của một giả thuyết vô hiệu, sức mạnh của các bằng chứng chống lại giả thuyết vô hiệu được đánh giá bằng cách sử dụng ý tưởng xác suất (cơ hội trong quá trình ra quyết định của chúng ta). Nói một cách đơn giản, kiểm tra ý nghĩa là phương pháp đánh giá sức mạnh chống lại giả thuyết vô hiệu và sức mạnh của bằng chứng này bởi những giá trị p thu được cho các bài thống kê kiểm tra.

Bạn đang xem: Độ tin cậy và mức ý nghĩa

Bạn đang xem: độ tin cậy và mức ý nghĩa

Bất kỳ thống kê tham số cụ thể nào sẽ có một phân phối mẫu đã biết (chẳng như t-test, F-test và χ2) liên quan đến giả thuyết vô hiệu (H0), nó thường được lập thành bảng phân phối mẫu trong các sách thống kê. Khi một dữ liệu được phân tích và các kết quả đưa đến một giá trị thống kê kiểm tra cụ thể, và một xác suất quan sát liên quan, p. Xác suất quan sát này được so sánh với mức xác suất alpha được chọn trước, thường được gọi là mức ý nghĩa của một bài kiểm tra (thường là 5%, p≤0.05 hoặc 1%, p≤0.01).


*

Thông thường, nếu xác suất quan sát, p, là ≤ mức xác suất alpha đã chọn (xác suất mắc lỗi Loại I) thì giả thuyết vô hiệu bị bác bỏ và đạt được ý nghĩa thống kê. Sẽ tốt hơn nữa nếu các giá trị ước lượng và khoảng tin cậy của các tham số được báo cáo cùng giá trị p để tăng cường sức mạnh của các bằng chứng chống lại H0.

Xem thêm: Bảo Dưỡng Xe Máy Yamaha Ở Đâu Tốt, Những Đại Lý Yamaha Uy Tín Tại Tp

Các suy luận sử dụng thủ tục thống kê tham số chỉ có thể hợp lệ khi đáp ứng bốn điều kiện:

các quan sát là độc lập;chúng được lấy ngẫu nhiên từ một dân số;chúng có các mức đo lường liên tục (ít nhất là trên lý thuyết);và các sai số ngẫu nhiên liên quan đến các quan sát có một phân phối đã biết (thường là chuẩn).

Một số bài kiểm tra thống kê đòi hỏi đáp ứng các giả định bổ sung; những giả định này khác nhau về số lượng và mức độ. Ví dụ, trong số các thử nghiệm thống kê mạnh mẽ nhất là t-testF-test. Kiểm tra t-test (để kiểm tra giả thuyết về sự khác biệt giữa hai trung bình mẫu), ngoài các giả định chung, còn giả định thêm điều kiện rằng dân số mà từ đó hai mẫu được rút ra phải có phương sai tương tự (phương sai đồng nhất).

2. Xử lý các vi phạm giả định thống kê

Chúng ta phải làm gì nếu các giả định chung của mô hình tham số và/hoặc các điều kiện cụ thể của các bài thử nghiệm thống kê cụ thể không được đáp ứng?

Các bài kiểm tra phi tham số thường kém về sức mạnh hơn so với các bài kiểm tra tham số tương đương (trung bình kém hơn về sức mạnh khoảng 10–20%). Một chiến lược thay thế để sử dụng các bài kiểm tra phi tham số là biến đổi dữ liệu để làm cho nó phân phối chuẩn hơn. Các thủ tục để kiểm tra tính chuẩn của phân phối dữ liệu và các biến chuyển đổi sẽ được thảo luận trong bài phân phối chuẩn.