1. Trong thống kê, `phân phối chuẩn` (normal distribution) còn được gọi là gì?
A. Phân phối Poisson.
B. Phân phối nhị thức.
C. Phân phối Gaussian.
D. Phân phối mũ.
2. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Khi so sánh trung bình của hai mẫu phụ thuộc.
B. Khi so sánh trung bình của hai mẫu độc lập và dữ liệu tuân theo phân phối chuẩn.
C. Khi so sánh trung bình của hai mẫu độc lập và dữ liệu không tuân theo phân phối chuẩn.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
3. Trong phân tích dữ liệu định tính, phương pháp nào thường được sử dụng để mã hóa và phân tích các chủ đề?
A. Phân tích hồi quy.
B. Phân tích phương sai.
C. Phân tích nội dung (content analysis).
D. Phân tích thành phần chính.
4. Sai số loại I (Type I error) trong kiểm định giả thuyết là gì?
A. Chấp nhận giả thuyết sai.
B. Bác bỏ giả thuyết đúng.
C. Không bác bỏ giả thuyết sai.
D. Không chấp nhận giả thuyết đúng.
5. Trong một nghiên cứu về sự hài lòng của sinh viên, thang đo Likert thường được sử dụng để thu thập dữ liệu. Loại dữ liệu này thuộc loại nào?
A. Định lượng liên tục.
B. Định lượng rời rạc.
C. Định tính thứ bậc.
D. Định tính danh nghĩa.
6. Phương pháp nào sau đây được sử dụng để kiểm tra độ tin cậy nội tại (internal consistency) của một thang đo?
A. Kiểm định t (t-test).
B. Hệ số Cronbach`s alpha.
C. Phân tích hồi quy.
D. Kiểm định Chi bình phương.
7. Mục đích chính của việc chuẩn hóa dữ liệu (data normalization) trong thống kê là gì?
A. Giảm kích thước của tập dữ liệu.
B. Loại bỏ các giá trị ngoại lệ.
C. Đưa các biến về cùng một thang đo để so sánh.
D. Tăng độ chính xác của các phép tính thống kê.
8. Phân tích hồi quy được sử dụng để làm gì trong khoa học xã hội?
A. Mô tả đặc điểm của một biến duy nhất.
B. Kiểm định sự khác biệt giữa hai nhóm.
C. Dự đoán giá trị của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập.
D. Đo lường mức độ tin cậy của dữ liệu.
9. Trong phân tích hồi quy, hệ số R bình phương (R-squared) thể hiện điều gì?
A. Mức độ tương quan giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Độ tin cậy của mô hình hồi quy.
D. Mức độ ý nghĩa thống kê của các hệ số hồi quy.
10. Loại biểu đồ nào phù hợp nhất để so sánh phân phối của một biến số giữa hai nhóm khác nhau?
A. Biểu đồ tròn (pie chart).
B. Biểu đồ đường (line chart).
C. Biểu đồ hộp (box plot).
D. Biểu đồ phân tán (scatter plot).
11. Khi thực hiện kiểm định t (t-test) cho hai mẫu độc lập, giả định quan trọng nào cần được kiểm tra?
A. Các mẫu phải có kích thước bằng nhau.
B. Phương sai của hai quần thể phải bằng nhau.
C. Dữ liệu phải tuân theo phân phối nhị thức.
D. Các biến phải độc lập với nhau.
12. Khi nào nên sử dụng kiểm định Kruskal-Wallis?
A. Khi so sánh trung bình của hai nhóm độc lập.
B. Khi so sánh trung bình của ba hoặc nhiều nhóm độc lập và dữ liệu tuân theo phân phối chuẩn.
C. Khi so sánh trung bình của ba hoặc nhiều nhóm độc lập và dữ liệu không tuân theo phân phối chuẩn.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
13. Khi thực hiện phân tích hồi quy đa biến (multiple regression), vấn đề đa cộng tuyến (multicollinearity) có thể gây ra hậu quả gì?
A. Làm tăng độ chính xác của các hệ số hồi quy.
B. Làm giảm phương sai của sai số.
C. Làm cho các hệ số hồi quy trở nên không ổn định và khó giải thích.
D. Không ảnh hưởng đến kết quả phân tích.
14. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal Component Analysis - PCA).
D. Kiểm định Chi bình phương.
15. Phương pháp nào sau đây được sử dụng để đánh giá sự phù hợp của mô hình hồi quy logistic?
A. Hệ số R bình phương.
B. Kiểm định Chi bình phương.
C. Đồ thị phân tán.
D. Độ lệch chuẩn.
16. Khi nào thì việc sử dụng thống kê phi tham số (non-parametric statistics) là phù hợp?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi cần tính toán các tham số của quần thể.
17. Trong thống kê, thuật ngữ `ngoại lệ` (outlier) được hiểu như thế nào?
A. Giá trị trung bình của dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong dữ liệu.
C. Giá trị nằm ngoài phạm vi phân phối thông thường của dữ liệu.
D. Giá trị được sử dụng để chuẩn hóa dữ liệu.
18. Trong phân tích phương sai (ANOVA), yếu tố nào được kiểm tra để xác định sự khác biệt giữa các nhóm?
A. Phương sai giữa các nhóm.
B. Phương sai trong từng nhóm.
C. Tổng phương sai.
D. Tất cả các đáp án trên.
19. Trong thống kê, `mốt` (mode) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm ở giữa tập dữ liệu khi được sắp xếp theo thứ tự.
D. Khoảng giữa giá trị lớn nhất và nhỏ nhất.
20. Trong nghiên cứu định lượng, cỡ mẫu (sample size) ảnh hưởng như thế nào đến độ tin cậy của kết quả?
A. Cỡ mẫu lớn hơn thường dẫn đến độ tin cậy thấp hơn.
B. Cỡ mẫu nhỏ hơn luôn đảm bảo độ tin cậy cao hơn.
C. Cỡ mẫu lớn hơn thường dẫn đến độ tin cậy cao hơn.
D. Cỡ mẫu không ảnh hưởng đến độ tin cậy.
21. Ý nghĩa của hệ số tương quan Pearson (Pearson correlation coefficient) là gì?
A. Đo lường sự khác biệt giữa hai trung bình.
B. Đo lường mức độ tuyến tính của mối quan hệ giữa hai biến định lượng.
C. Đo lường sự phù hợp của mô hình hồi quy.
D. Đo lường độ tin cậy của một kiểm định.
22. Trong thống kê, `trung vị` (median) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm ở giữa tập dữ liệu khi được sắp xếp theo thứ tự.
D. Khoảng giữa giá trị lớn nhất và nhỏ nhất.
23. Trong thống kê, `độ lệch chuẩn` thể hiện điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
D. Khoảng giữa giá trị lớn nhất và nhỏ nhất.
24. Sai số loại II (Type II error) trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết đúng.
B. Chấp nhận giả thuyết đúng.
C. Không bác bỏ giả thuyết sai.
D. Không chấp nhận giả thuyết đúng.
25. Khi nào nên sử dụng kiểm định Chi bình phương (Chi-square test)?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi phân tích mối quan hệ giữa hai biến định tính.
C. Khi dự đoán giá trị của một biến liên tục.
D. Khi đo lường độ tương quan giữa hai biến định lượng.
26. Trong thống kê mô tả, đại lượng nào sau đây được sử dụng để đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Phương sai
C. Mốt
D. Số trung bình
27. Khi nào nên sử dụng phân tích phương sai hai yếu tố (two-way ANOVA)?
A. Khi so sánh trung bình của hai nhóm.
B. Khi nghiên cứu ảnh hưởng của hai biến độc lập lên một biến phụ thuộc.
C. Khi phân tích mối quan hệ giữa hai biến định tính.
D. Khi dự đoán giá trị của một biến liên tục.
28. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của hai mẫu phụ thuộc và dữ liệu tuân theo phân phối chuẩn.
C. Khi so sánh trung bình của hai mẫu phụ thuộc và dữ liệu không tuân theo phân phối chuẩn.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
29. Trong thống kê, thuật ngữ `phương sai` (variance) thể hiện điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình, được tính bằng bình phương độ lệch.
C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
D. Khoảng giữa giá trị lớn nhất và nhỏ nhất.
30. Ý nghĩa của khoảng tin cậy (confidence interval) trong thống kê là gì?
A. Xác suất một tham số của quần thể nằm trong khoảng đó.
B. Khoảng giá trị mà chúng ta tin rằng tham số của quần thể nằm trong đó với một mức độ tin cậy nhất định.
C. Giá trị trung bình của mẫu.
D. Độ lệch chuẩn của mẫu.