1. Khi nào nên sử dụng kiểm định Chi-square?
A. Để so sánh trung bình của hai nhóm độc lập
B. Để phân tích mối quan hệ giữa hai biến định tính
C. Để dự đoán giá trị của một biến phụ thuộc dựa trên một biến độc lập
D. Để so sánh phương sai của hai nhóm
2. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thể hiện điều gì?
A. Xác suất mắc lỗi loại II
B. Xác suất bác bỏ giả thuyết null khi nó đúng
C. Xác suất chấp nhận giả thuyết null khi nó sai
D. Xác suất chấp nhận giả thuyết null khi nó đúng
3. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến động của dữ liệu
B. Mức độ quan hệ tuyến tính giữa hai biến định lượng
C. Sự khác biệt giữa trung bình mẫu và trung bình tổng thể
D. Mức độ phù hợp của mô hình hồi quy
4. Trong lý thuyết đáp ứng câu hỏi (item response theory - IRT), đường cong đặc trưng câu hỏi (item characteristic curve - ICC) biểu thị điều gì?
A. Mối quan hệ giữa tổng điểm của một người và khả năng thực hiện một nhiệm vụ
B. Mối quan hệ giữa khả năng của một người và xác suất trả lời đúng một câu hỏi
C. Mối quan hệ giữa độ khó của một câu hỏi và thời gian cần thiết để trả lời
D. Mối quan hệ giữa sự phân biệt của một câu hỏi và độ tin cậy của bài kiểm tra
5. Sai số loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó đúng
B. Chấp nhận giả thuyết null khi nó đúng
C. Bác bỏ giả thuyết null khi nó sai
D. Chấp nhận giả thuyết null khi nó sai
6. Phương pháp nào sau đây được sử dụng để phân tích dữ liệu bảng (panel data)?
A. Hồi quy tuyến tính đơn
B. Hồi quy Logistic
C. Mô hình tác động cố định (Fixed effects model) hoặc mô hình tác động ngẫu nhiên (Random effects model)
D. Kiểm định t
7. Trong phân tích độ tin cậy của thang đo (scale reliability analysis), hệ số Cronbach`s alpha được sử dụng để đánh giá điều gì?
A. Độ giá trị của thang đo
B. Độ tin cậy nội tại (internal consistency) của thang đo
C. Độ ổn định của thang đo theo thời gian
D. Độ nhạy của thang đo
8. Phương pháp nào sau đây được sử dụng để phân tích dữ liệu không gian (spatial data)?
A. Hồi quy tuyến tính
B. Phân tích cụm (Cluster analysis)
C. Hệ thống thông tin địa lý (GIS) và thống kê không gian
D. Kiểm định t
9. Trong thống kê mô tả, loại biểu đồ nào thích hợp nhất để so sánh tỷ lệ phần trăm của các danh mục khác nhau?
A. Biểu đồ đường
B. Biểu đồ hộp
C. Biểu đồ tròn
D. Biểu đồ tần suất
10. Trong phân tích tồn tại (survival analysis), hàm Kaplan-Meier được sử dụng để ước tính điều gì?
A. Tỷ lệ rủi ro (hazard ratio)
B. Thời gian sống trung bình
C. Hàm sống sót (survival function)
D. Hàm mật độ xác suất
11. Phương pháp nào sau đây được sử dụng để đánh giá độ phù hợp của một mô hình với dữ liệu quan sát được?
A. Phân tích tương quan
B. Kiểm định Chi-square
C. Phân tích phương sai (ANOVA)
D. Hồi quy tuyến tính
12. Ý nghĩa của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Để loại bỏ các giá trị ngoại lệ
B. Để đưa các biến về cùng một thang đo
C. Để thay đổi phân phối của dữ liệu thành phân phối chuẩn
D. Để mã hóa dữ liệu định tính thành dữ liệu định lượng
13. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi kích thước mẫu lớn
B. Khi dữ liệu tuân theo phân phối chuẩn
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ
D. Khi phương sai của các nhóm bằng nhau
14. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại phần lớn thông tin?
A. Hồi quy tuyến tính
B. Phân tích thành phần chính (PCA)
C. Kiểm định t
D. Phân tích phương sai (ANOVA)
15. Khi nào thì nên sử dụng trung vị thay vì trung bình để đo lường xu hướng trung tâm?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi có các giá trị ngoại lệ (outliers) trong dữ liệu
C. Khi kích thước mẫu lớn
D. Khi dữ liệu là định danh
16. Phương pháp nào sau đây được sử dụng để phân tích mối quan hệ giữa một biến phụ thuộc định tính và một hoặc nhiều biến độc lập?
A. Hồi quy tuyến tính
B. Phân tích phương sai (ANOVA)
C. Hồi quy Logistic
D. Kiểm định t
17. Khi nào thì nên sử dụng kiểm định Mann-Whitney U?
A. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn
B. Để so sánh trung bình của hai nhóm phụ thuộc
C. Để so sánh trung vị của hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn
D. Để so sánh phương sai của hai nhóm
18. Đặc điểm nào sau đây là của dữ liệu định danh (nominal)?
A. Có thể sắp xếp theo thứ tự
B. Có khoảng cách bằng nhau giữa các giá trị
C. Chỉ có thể phân loại vào các nhóm khác nhau
D. Có giá trị 0 tuyệt đối
19. Trong phân tích chuỗi thời gian (time series analysis), thành phần nào sau đây biểu thị xu hướng dài hạn của dữ liệu?
A. Tính mùa vụ (seasonality)
B. Tính chu kỳ (cyclicality)
C. Xu hướng (trend)
D. Tính ngẫu nhiên (randomness)
20. Trong thống kê, `độ tin cậy` (reliability) đề cập đến điều gì?
A. Mức độ mà một bài kiểm tra đo lường những gì nó được cho là đo lường
B. Mức độ nhất quán của một phép đo
C. Mức độ mà kết quả nghiên cứu có thể được khái quát hóa cho các quần thể khác
D. Mức độ mà kết quả nghiên cứu có ý nghĩa thực tế
21. Ý nghĩa của việc sử dụng thiết kế phức tạp (complex survey design) trong thống kê là gì?
A. Để đơn giản hóa quá trình thu thập dữ liệu
B. Để đảm bảo rằng mẫu đại diện cho tổng thể khi sử dụng các phương pháp chọn mẫu không ngẫu nhiên
C. Để điều chỉnh cho các yếu tố như phân tầng, cụm, và trọng số trong quá trình phân tích
D. Để tăng kích thước mẫu mà không cần thêm chi phí
22. Giá trị nào sau đây là thước đo độ phân tán?
A. Trung bình
B. Trung vị
C. Độ lệch chuẩn
D. Mốt
23. Trong phân tích hồi quy, hệ số xác định (R-squared) cho biết điều gì?
A. Độ mạnh của mối quan hệ giữa các biến
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập
C. Mức độ ý nghĩa của mô hình hồi quy
D. Độ chính xác của các hệ số hồi quy
24. Trong phân tích phương sai (ANOVA), giá trị p cho biết điều gì?
A. Mức độ ảnh hưởng của biến độc lập lên biến phụ thuộc
B. Xác suất để có được kết quả như quan sát nếu không có sự khác biệt thực sự giữa các nhóm
C. Kích thước của hiệu ứng giữa các nhóm
D. Phương sai tổng thể của các nhóm
25. Khi nào thì nên sử dụng phương pháp bootstrapping trong thống kê?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi muốn ước tính sai số chuẩn hoặc khoảng tin cậy mà không cần giả định về phân phối
C. Khi kích thước mẫu rất lớn
D. Khi muốn giảm số lượng biến trong mô hình
26. Trong thống kê Bayes, yếu tố nào sau đây được kết hợp với dữ liệu để tạo ra phân phối hậu nghiệm?
A. Giá trị p
B. Hệ số tương quan
C. Phân phối tiên nghiệm
D. Độ lệch chuẩn
27. Phương pháp nào sau đây được sử dụng để xử lý vấn đề đa cộng tuyến (multicollinearity) trong hồi quy?
A. Hồi quy Logistic
B. Hồi quy Ridge hoặc Hồi quy Lasso
C. Phân tích phương sai (ANOVA)
D. Kiểm định t
28. Ý nghĩa của việc sử dụng trọng số trong thống kê là gì?
A. Để giảm kích thước mẫu
B. Để điều chỉnh cho sự khác biệt trong đại diện của các nhóm trong mẫu
C. Để đơn giản hóa phép tính
D. Để tăng độ chính xác của kết quả
29. Phương pháp nào sau đây được sử dụng để xác định các nhóm đối tượng có đặc điểm tương đồng trong một tập dữ liệu?
A. Phân tích hồi quy
B. Phân tích cụm (Cluster analysis)
C. Phân tích phương sai (ANOVA)
D. Phân tích tương quan
30. Trong phân tích đường dẫn (path analysis), mục đích chính là gì?
A. Để xác định mối quan hệ nhân quả giữa các biến
B. Để giảm số lượng biến trong mô hình
C. Để phân nhóm các đối tượng có đặc điểm tương đồng
D. Để dự đoán giá trị của một biến dựa trên các biến khác