1. Phương pháp nào sau đây thường được sử dụng để kiểm định sự khác biệt giữa trung bình của hai nhóm độc lập?
A. Phân tích phương sai (ANOVA)
B. Kiểm định t (t-test)
C. Hệ số tương quan Pearson
D. Kiểm định Chi bình phương
2. Trong phân tích dữ liệu khảo sát, phương pháp nào sau đây được sử dụng để điều chỉnh trọng số của các phản hồi nhằm phản ánh chính xác hơn thành phần của quần thể mục tiêu?
A. Chuẩn hóa dữ liệu
B. Làm sạch dữ liệu
C. Trọng số hóa dữ liệu
D. Mã hóa dữ liệu
3. Trong phân tích cụm (cluster analysis), mục tiêu chính là gì?
A. Dự đoán giá trị của một biến phụ thuộc
B. Phân nhóm các đối tượng tương tự vào cùng một nhóm
C. Xác định mối quan hệ nhân quả giữa các biến
D. Đo lường mức độ tin cậy của một thang đo
4. Giá trị nào sau đây cho thấy mối quan hệ nhân quả mạnh nhất giữa hai biến?
A. Hệ số tương quan 0.8
B. Giá trị p < 0.05
C. Không có giá trị nào, vì tương quan không ngụ ý nhân quả
D. Hệ số hồi quy 0.5
5. Để so sánh tỷ lệ thành công giữa ba phương pháp điều trị khác nhau, phép kiểm định thống kê nào phù hợp nhất?
A. Kiểm định t (t-test)
B. Phân tích phương sai (ANOVA)
C. Kiểm định Chi bình phương
D. Hệ số tương quan Pearson
6. Khi nào nên sử dụng kiểm định Mann-Whitney U thay vì kiểm định t độc lập?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi cỡ mẫu lớn hơn 30
C. Khi dữ liệu không tuân theo phân phối chuẩn
D. Khi muốn so sánh phương sai của hai nhóm
7. Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết không đúng khi nó thực sự đúng
B. Chấp nhận giả thuyết không đúng khi nó thực sự sai
C. Bác bỏ giả thuyết không đúng khi nó thực sự sai
D. Chấp nhận giả thuyết không đúng khi nó thực sự đúng
8. Phương pháp nào sau đây giúp kiểm tra tính tin cậy nội tại (internal consistency) của một thang đo Likert?
A. Hệ số tương quan Pearson
B. Cronbach`s Alpha
C. Kiểm định t (t-test)
D. Phân tích phương sai (ANOVA)
9. Khi xây dựng mô hình dự báo, phương pháp nào sau đây giúp đánh giá khả năng khái quát hóa của mô hình trên dữ liệu mới?
A. Phân tích hồi quy
B. Kiểm định giả thuyết
C. Kiểm định chéo (cross-validation)
D. Phân tích phương sai
10. Trong phân tích chuỗi thời gian, thành phần nào sau đây thể hiện xu hướng dài hạn của dữ liệu?
A. Tính thời vụ
B. Chu kỳ
C. Xu hướng
D. Ngẫu nhiên
11. Trong thống kê, `phân phối chuẩn` còn được gọi là gì?
A. Phân phối Poisson
B. Phân phối Bernoulli
C. Phân phối Gaussian
D. Phân phối nhị thức
12. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi cỡ mẫu lớn
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc cỡ mẫu nhỏ
D. Khi muốn so sánh trung bình của hai nhóm
13. Trong lý thuyết xác suất, biến cố nào sau đây có xác suất xảy ra bằng 0?
A. Biến cố chắc chắn
B. Biến cố ngẫu nhiên
C. Biến cố không thể
D. Biến cố đối lập
14. Trong thiết kế nghiên cứu, phương pháp chọn mẫu ngẫu nhiên phân tầng (stratified random sampling) nhằm mục đích gì?
A. Đảm bảo mọi thành viên của quần thể đều có cơ hội được chọn
B. Giảm sai số chọn mẫu bằng cách chia quần thể thành các nhóm đồng nhất
C. Thuận tiện hơn trong việc thu thập dữ liệu
D. Tăng tính đại diện của mẫu bằng cách chọn các thành viên dễ tiếp cận
15. Trong nghiên cứu định tính, phương pháp nào thường được sử dụng để thu thập dữ liệu thông qua việc quan sát trực tiếp hành vi của đối tượng nghiên cứu trong môi trường tự nhiên của họ?
A. Phỏng vấn sâu
B. Thảo luận nhóm
C. Nghiên cứu trường hợp
D. Quan sát tham gia
16. Trong phân tích phương sai (ANOVA), đại lượng nào sau đây được sử dụng để so sánh sự biến thiên giữa các nhóm với sự biến thiên trong mỗi nhóm?
A. Giá trị t
B. Giá trị F
C. Giá trị Chi bình phương
D. Hệ số tương quan
17. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn bằng cách tạo ra các biến mới là tổ hợp tuyến tính của các biến ban đầu?
A. Phân tích hồi quy
B. Phân tích phương sai
C. Phân tích nhân tố
D. Phân tích cụm
18. Trong phân tích hồi quy tuyến tính, hệ số R bình phương (R²) biểu thị điều gì?
A. Mức độ ý nghĩa thống kê của các biến độc lập
B. Phần trăm biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập
C. Độ mạnh của mối quan hệ giữa các biến độc lập
D. Sai số chuẩn của ước lượng
19. Khi nào thì việc sử dụng phương pháp bootstrapping là phù hợp?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi cỡ mẫu lớn
C. Khi không có giả định về phân phối của dữ liệu và cỡ mẫu nhỏ
D. Khi muốn so sánh trung bình của hai nhóm
20. Giá trị nào sau đây thể hiện mối tương quan nghịch biến mạnh nhất giữa hai biến?
A. 0.8
B. 0.2
C. -0.9
D. -0.1
21. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi các biến độc lập có tương quan cao với nhau
B. Khi biến phụ thuộc không tuân theo phân phối chuẩn
C. Khi có giá trị ngoại lệ trong dữ liệu
D. Khi mô hình hồi quy không phù hợp với dữ liệu
22. Loại biểu đồ nào sau đây phù hợp nhất để so sánh phân phối của một biến số giữa hai nhóm khác nhau?
A. Biểu đồ đường
B. Biểu đồ tròn
C. Biểu đồ hộp (box plot)
D. Biểu đồ tán xạ
23. Trong nghiên cứu định lượng, cỡ mẫu (sample size) ảnh hưởng đến yếu tố nào sau đây?
A. Tính khách quan của nghiên cứu
B. Độ tin cậy của nghiên cứu
C. Tính đại diện của nghiên cứu
D. Tất cả các đáp án trên
24. Giá trị p (p-value) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất giả thuyết không đúng là đúng
B. Xác suất thu được kết quả quan sát hoặc kết quả cực đoan hơn nếu giả thuyết không đúng
C. Mức ý nghĩa thống kê của kết quả
D. Xác suất giả thuyết không đúng là sai
25. Khi nào thì việc sử dụng trung vị (median) thích hợp hơn so với trung bình (mean) để đo lường xu hướng trung tâm?
A. Khi dữ liệu có phân phối đối xứng
B. Khi dữ liệu không có giá trị ngoại lệ
C. Khi dữ liệu có giá trị ngoại lệ
D. Khi cỡ mẫu lớn
26. Thang đo nào sau đây là thang đo định tính?
A. Thang đo tỷ lệ
B. Thang đo khoảng
C. Thang đo thứ bậc
D. Thang đo định danh
27. Khi thực hiện kiểm định giả thuyết, mức ý nghĩa (alpha) thường được đặt là 0.05. Điều này có nghĩa là gì?
A. Có 5% khả năng chấp nhận giả thuyết không đúng khi nó thực sự sai.
B. Có 5% khả năng bác bỏ giả thuyết không đúng khi nó thực sự đúng.
C. Có 5% khả năng bác bỏ giả thuyết không đúng khi nó thực sự sai.
D. Có 5% khả năng chấp nhận giả thuyết không đúng khi nó thực sự đúng.
28. Trong thống kê mô tả, đại lượng nào sau đây được sử dụng để đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Độ lệch chuẩn
C. Mốt
D. Tần số
29. Phương pháp nào sau đây thích hợp để phân tích mối quan hệ giữa hai biến định tính?
A. Hệ số tương quan Pearson
B. Phân tích hồi quy tuyến tính
C. Kiểm định Chi bình phương
D. Kiểm định t (t-test)
30. Để kiểm tra xem có mối quan hệ tuyến tính giữa hai biến định lượng, nhà nghiên cứu sử dụng phương pháp nào?
A. Kiểm định Chi bình phương
B. Phân tích phương sai (ANOVA)
C. Hệ số tương quan Pearson
D. Kiểm định t (t-test)