1. Biến số nào sau đây là biến định tính?
A. Chiều cao (cm)
B. Cân nặng (kg)
C. Giới tính (Nam/Nữ)
D. Thu nhập (VND)
2. Trong phân tích dữ liệu định tính, phương pháp nào sau đây thường được sử dụng để xác định các chủ đề và mô hình quan trọng?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Phân tích nội dung.
D. Phân tích tương quan.
3. Trong phân tích hồi quy, hệ số R bình phương (R-squared) thể hiện điều gì?
A. Mức độ mạnh của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Sai số chuẩn của các ước lượng tham số.
D. Mức ý nghĩa của các biến độc lập trong mô hình.
4. Trong thống kê, `độ lệch chuẩn` được sử dụng để đo lường điều gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị xuất hiện nhiều nhất trong một tập dữ liệu.
D. Mức độ bất đối xứng của một phân phối.
5. Trong phân tích dữ liệu, outlier là gì?
A. Một giá trị xuất hiện nhiều nhất trong tập dữ liệu.
B. Một giá trị nằm gần giá trị trung bình của tập dữ liệu.
C. Một giá trị khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Một giá trị bị thiếu trong tập dữ liệu.
6. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Khi so sánh trung bình của hai nhóm độc lập mà dữ liệu tuân theo phân phối chuẩn.
B. Khi so sánh trung bình của hai nhóm độc lập mà dữ liệu không tuân theo phân phối chuẩn.
C. Khi so sánh trung bình của hai nhóm có liên quan.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
7. Trong phân tích hồi quy đa biến, điều gì xảy ra nếu có hiện tượng đa cộng tuyến (multicollinearity)?
A. Các ước lượng tham số trở nên chính xác hơn.
B. Các ước lượng tham số trở nên không ổn định và khó giải thích.
C. Mô hình hồi quy trở nên phù hợp hơn với dữ liệu.
D. Sai số chuẩn của các ước lượng tham số giảm.
8. Phương pháp nào sau đây được sử dụng để ước lượng các tham số của một mô hình hồi quy tuyến tính?
A. Kiểm định t
B. Phân tích phương sai (ANOVA)
C. Bình phương tối thiểu (OLS)
D. Kiểm định Chi-bình phương
9. Hệ số tương quan Pearson đo lường điều gì?
A. Sự khác biệt giữa trung bình của hai nhóm
B. Mức độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng
C. Mức độ phù hợp của một mô hình hồi quy
D. Sự phân tán của dữ liệu xung quanh giá trị trung bình
10. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được kiểm tra?
A. Sự khác biệt giữa trung bình của ba hoặc nhiều nhóm
B. Mối quan hệ giữa hai biến định lượng
C. Sự phân tán của dữ liệu xung quanh giá trị trung bình
D. Mức độ phù hợp của một mô hình hồi quy
11. Giả sử bạn muốn nghiên cứu xem có sự khác biệt về mức độ hài lòng công việc giữa nhân viên nam và nhân viên nữ trong một công ty. Bạn nên sử dụng kiểm định thống kê nào?
A. Kiểm định Chi-bình phương.
B. Kiểm định t cho hai mẫu độc lập.
C. Phân tích phương sai (ANOVA).
D. Phân tích tương quan.
12. Khi nào nên sử dụng kiểm định Kruskal-Wallis?
A. Khi so sánh trung bình của hai nhóm độc lập.
B. Khi so sánh trung bình của ba nhóm trở lên độc lập mà dữ liệu tuân theo phân phối chuẩn.
C. Khi so sánh trung bình của ba nhóm trở lên độc lập mà dữ liệu không tuân theo phân phối chuẩn.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
13. Trong thống kê mô tả, đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Giá trị trung vị
B. Phương sai
C. Mốt
D. Trung bình cộng
14. Khi nào nên sử dụng kiểm định Chi-bình phương?
A. Khi so sánh trung bình của hai nhóm độc lập
B. Khi phân tích mối quan hệ giữa hai biến định tính
C. Khi ước lượng tham số của một mô hình hồi quy
D. Khi kiểm tra sự khác biệt giữa phương sai của hai nhóm
15. Để kiểm tra xem một mẫu dữ liệu có tuân theo phân phối chuẩn hay không, bạn nên sử dụng kiểm định nào?
A. Kiểm định t
B. Kiểm định Chi-bình phương
C. Kiểm định Kolmogorov-Smirnov hoặc Shapiro-Wilk
D. Phân tích phương sai (ANOVA)
16. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank?
A. Khi so sánh trung bình của hai nhóm độc lập.
B. Khi so sánh trung bình của hai nhóm có liên quan mà dữ liệu tuân theo phân phối chuẩn.
C. Khi so sánh trung bình của hai nhóm có liên quan mà dữ liệu không tuân theo phân phối chuẩn.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
17. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả các đặc điểm của mẫu.
B. Thu thập dữ liệu từ tổng thể.
C. Đưa ra kết luận về tổng thể dựa trên thông tin từ mẫu.
D. Tính toán các thống kê mô tả như trung bình và độ lệch chuẩn.
18. Sai số loại I (Type I error) trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết không khi nó thực sự đúng
B. Không bác bỏ giả thuyết không khi nó thực sự sai
C. Đo lường độ lớn của hiệu ứng
D. Xác định kích thước mẫu cần thiết
19. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn, đồng thời giữ lại thông tin quan trọng nhất?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (PCA).
D. Kiểm định Chi-bình phương.
20. Loại biểu đồ nào thường được sử dụng để biểu diễn mối quan hệ giữa hai biến định lượng?
A. Biểu đồ tròn
B. Biểu đồ tần số
C. Biểu đồ hộp
D. Biểu đồ phân tán
21. Mục đích chính của việc sử dụng một mẫu ngẫu nhiên trong nghiên cứu là gì?
A. Để giảm chi phí thu thập dữ liệu.
B. Để đảm bảo rằng mẫu đại diện cho tổng thể.
C. Để tăng kích thước mẫu.
D. Để đơn giản hóa quá trình phân tích dữ liệu.
22. Khi nào thì nên sử dụng phương pháp thống kê phi tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi cỡ mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc cỡ mẫu nhỏ.
D. Khi muốn ước lượng tham số của một mô hình hồi quy.
23. Trong thống kê, `phân phối chuẩn` (normal distribution) còn được gọi là gì?
A. Phân phối Poisson
B. Phân phối nhị thức
C. Phân phối Gaussian
D. Phân phối mũ
24. Trong phân tích dữ liệu thứ cấp, điều gì là quan trọng nhất cần xem xét?
A. Kích thước mẫu của dữ liệu.
B. Nguồn gốc và chất lượng của dữ liệu.
C. Phương pháp thống kê được sử dụng để phân tích dữ liệu.
D. Tính mới của dữ liệu.
25. Khi nào thì sử dụng kiểm định t (t-test) cho hai mẫu độc lập?
A. Khi so sánh trung bình của hai nhóm có liên quan.
B. Khi so sánh trung bình của hai nhóm độc lập.
C. Khi phân tích mối quan hệ giữa hai biến định tính.
D. Khi kiểm tra sự phù hợp của dữ liệu với một phân phối lý thuyết.
26. Khoảng tin cậy 95% có nghĩa là gì?
A. Có 95% khả năng giá trị thực của tham số nằm trong khoảng đó
B. Có 5% khả năng giá trị thực của tham số nằm ngoài khoảng đó
C. Nếu lặp lại quá trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa giá trị thực của tham số
D. Tất cả các đáp án trên
27. Phương pháp nào sau đây được sử dụng để đánh giá độ tin cậy của một thang đo (scale) trong nghiên cứu?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Hệ số Cronbach`s alpha.
D. Phân tích tương quan.
28. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết không là đúng.
B. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết không là đúng.
C. Mức ý nghĩa của kiểm định.
D. Độ lớn của hiệu ứng.
29. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được sử dụng để làm gì?
A. Đo lường độ lớn của hiệu ứng
B. Xác định kích thước mẫu cần thiết
C. Quyết định ngưỡng bác bỏ giả thuyết không
D. Tính toán khoảng tin cậy
30. Sai số loại II (Type II error) trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết không khi nó thực sự đúng.
B. Không bác bỏ giả thuyết không khi nó thực sự sai.
C. Đo lường độ lớn của hiệu ứng.
D. Xác định kích thước mẫu cần thiết.