1. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. So sánh trung bình của nhiều hơn hai nhóm.
D. Đo lường mối quan hệ giữa hai biến liên tục.
2. Trong thống kê, `độ lệch chuẩn` (standard deviation) thể hiện điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất trong tập dữ liệu.
3. Phân phối nào sau đây được sử dụng để mô hình hóa thời gian cho đến khi một sự kiện xảy ra?
A. Phân phối chuẩn
B. Phân phối Poisson
C. Phân phối nhị thức
D. Phân phối mũ
4. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại thông tin quan trọng?
A. Phân tích hồi quy
B. Phân tích phương sai
C. Phân tích thành phần chính (PCA)
D. Phân tích tương quan
5. Kiểm định nào sau đây được sử dụng để so sánh tỷ lệ của hai nhóm độc lập?
A. Kiểm định t (t-test)
B. Kiểm định Chi-square
C. Phân tích phương sai (ANOVA)
D. Phân tích hồi quy
6. Loại lỗi nào xảy ra khi chúng ta bác bỏ giả thuyết không (H0) trong khi nó thực sự đúng?
A. Lỗi loại I
B. Lỗi loại II
C. Sai số chuẩn
D. Độ lệch
7. Phương pháp nào sau đây được sử dụng để xác định xem có sự khác biệt đáng kể giữa các nhóm hay không, khi dữ liệu không tuân theo phân phối chuẩn?
A. Phân tích phương sai (ANOVA)
B. Kiểm định t (t-test)
C. Kiểm định Kruskal-Wallis
D. Phân tích hồi quy
8. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn
B. Phân phối Poisson
C. Phân phối nhị thức
D. Phân phối mũ
9. Trong thống kê, `phương sai` (variance) đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất trong tập dữ liệu.
10. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên, giả sử các yếu tố khác không đổi?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy trở nên không xác định.
11. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng.
D. Khi muốn ước lượng tham số tổng thể.
12. Phân phối nào sau đây có hình dạng đối xứng và được xác định bởi trung bình và độ lệch chuẩn?
A. Phân phối Poisson
B. Phân phối nhị thức
C. Phân phối chuẩn
D. Phân phối mũ
13. Trong phân tích hồi quy tuyến tính, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ mạnh mẽ của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của ước lượng.
14. Trong phân tích thống kê, `khoảng tin cậy` (confidence interval) là gì?
A. Một giá trị duy nhất ước tính tham số tổng thể.
B. Một khoảng giá trị mà chúng ta tin rằng tham số tổng thể nằm trong đó với một độ tin cậy nhất định.
C. Xác suất mà giả thuyết không là đúng.
D. Mức ý nghĩa của kiểm định.
15. Hệ quả nào sau đây xảy ra khi kích thước mẫu tăng lên?
A. Sai số chuẩn tăng lên.
B. Độ tin cậy giảm xuống.
C. Sai số chuẩn giảm xuống.
D. Giá trị p tăng lên.
16. Trong thống kê, `trung vị` (median) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm giữa tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
17. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết không là đúng.
B. Xác suất thu được kết quả như quan sát hoặc cực đoan hơn nếu giả thuyết không là đúng.
C. Xác suất mắc lỗi loại II.
D. Mức ý nghĩa của kiểm định.
18. Trong phân tích hồi quy, điều gì xảy ra nếu có hiện tượng đa cộng tuyến (multicollinearity)?
A. Các hệ số hồi quy trở nên ổn định hơn.
B. Sai số chuẩn của các hệ số hồi quy tăng lên.
C. Mô hình trở nên chính xác hơn trong dự đoán.
D. Giá trị R-squared giảm xuống.
19. Trong phân tích hồi quy, `sai số chuẩn của ước lượng` (standard error of the estimate) đo lường điều gì?
A. Độ chính xác của các hệ số hồi quy.
B. Mức độ phù hợp của mô hình với dữ liệu.
C. Sai số trung bình của các dự đoán từ đường hồi quy.
D. Mức độ mạnh mẽ của mối quan hệ giữa các biến.
20. Phương pháp nào sau đây được sử dụng để kiểm tra tính dừng (stationarity) của một chuỗi thời gian?
A. Phân tích hồi quy
B. Kiểm định Augmented Dickey-Fuller (ADF)
C. Phân tích phương sai (ANOVA)
D. Phân tích thành phần chính (PCA)
21. Trong thống kê mô tả, đại lượng nào sau đây được sử dụng để đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Giá trị trung vị
B. Phương sai
C. Mode
D. Trung bình cộng
22. Khi nào nên sử dụng kiểm định t (t-test) độc lập?
A. Khi so sánh trung bình của hai mẫu liên quan.
B. Khi so sánh trung bình của hai mẫu độc lập.
C. Khi so sánh phương sai của hai mẫu.
D. Khi phân tích mối quan hệ giữa hai biến.
23. Khi nào thì nên sử dụng kiểm định Chi-square?
A. Khi so sánh trung bình của hai nhóm.
B. Khi phân tích mối quan hệ giữa hai biến định tính.
C. Khi so sánh phương sai của hai nhóm.
D. Khi dự đoán giá trị của một biến liên tục.
24. Trong thống kê, `mức ý nghĩa` (significance level) thường được ký hiệu bằng α, và nó đại diện cho điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất bác bỏ giả thuyết không khi nó thực sự đúng (lỗi loại I).
C. Xác suất chấp nhận giả thuyết không khi nó thực sự sai.
D. Độ mạnh của kiểm định.
25. Phương pháp nào sau đây được sử dụng để ước lượng tham số của một tổng thể dựa trên thông tin từ một mẫu?
A. Thống kê mô tả
B. Suy luận thống kê
C. Phân tích hồi quy
D. Phân tích phương sai
26. Khi nào nên sử dụng phân tích tương quan Spearman (Spearman`s rank correlation)?
A. Khi muốn đo lường mối quan hệ tuyến tính giữa hai biến liên tục.
B. Khi muốn đo lường mối quan hệ đơn điệu (không nhất thiết tuyến tính) giữa hai biến.
C. Khi muốn so sánh trung bình của hai nhóm.
D. Khi muốn dự đoán giá trị của một biến dựa trên biến khác.
27. Khi nào thì nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của hai mẫu liên quan và dữ liệu không tuân theo phân phối chuẩn.
C. Khi phân tích mối quan hệ giữa hai biến định tính.
D. Khi so sánh phương sai của hai mẫu.
28. Trong phân tích thống kê, việc sử dụng phương pháp lấy mẫu ngẫu nhiên có mục đích chính là gì?
A. Để đảm bảo rằng mẫu có kích thước đủ lớn.
B. Để giảm sai số chuẩn của ước lượng.
C. Để đảm bảo rằng mẫu đại diện cho tổng thể.
D. Để đơn giản hóa quá trình thu thập dữ liệu.
29. Trong thống kê, `phân vị` (quantile) là gì?
A. Một giá trị chia tập dữ liệu thành hai phần bằng nhau.
B. Một giá trị chia tập dữ liệu thành bốn phần bằng nhau.
C. Một giá trị chia tập dữ liệu thành các phần có kích thước bằng nhau.
D. Giá trị trung bình của tập dữ liệu.
30. Khái niệm nào sau đây mô tả khả năng một kiểm định thống kê phát hiện ra một hiệu ứng thực sự (nếu nó tồn tại)?
A. Mức ý nghĩa
B. Độ tin cậy
C. Mạnh
D. Sai số chuẩn