1. Phân phối nào thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc địa điểm cố định?
A. Phân phối chuẩn
B. Phân phối nhị thức
C. Phân phối Poisson
D. Phân phối mũ
2. Phương pháp nào sau đây được sử dụng để xử lý dữ liệu bị thiếu (missing data)?
A. Phân tích phương sai (ANOVA)
B. Hồi quy tuyến tính
C. Điền giá trị trung bình (mean imputation), điền giá trị trung vị (median imputation), hoặc loại bỏ các trường hợp thiếu dữ liệu (listwise deletion).
D. Kiểm định Chi-bình phương
3. Biểu đồ hộp (boxplot) thường được sử dụng để làm gì?
A. Để hiển thị mối quan hệ giữa hai biến liên tục.
B. Để so sánh tỷ lệ giữa các nhóm.
C. Để hiển thị phân phối của một biến số và xác định các giá trị ngoại lệ.
D. Để hiển thị xu hướng theo thời gian.
4. Ý nghĩa của p-value trong kiểm định giả thuyết là gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất mắc lỗi loại II.
C. Xác suất quan sát được kết quả cực đoan như kết quả đã cho, hoặc cực đoan hơn, nếu giả thuyết null là đúng.
D. Xác suất bác bỏ giả thuyết null.
5. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc khi thang đo là thứ bậc (ordinal).
D. Khi cần tính toán nhanh chóng.
6. Phân phối nào thường được sử dụng làm cơ sở cho kiểm định Chi-bình phương?
A. Phân phối chuẩn
B. Phân phối t
C. Phân phối F
D. Phân phối Chi-bình phương
7. Khái niệm nào sau đây mô tả xu hướng của các thống kê mẫu (ví dụ: trung bình mẫu) để phân phối gần đúng theo phân phối chuẩn khi kích thước mẫu tăng lên, bất kể hình dạng của phân phối tổng thể?
A. Định lý Bayes
B. Định lý giới hạn trung tâm
C. Luật số lớn
D. Bất đẳng thức Chebyshev
8. Phương pháp nào thường được sử dụng để giảm số lượng biến trong một tập dữ liệu trong khi vẫn giữ lại thông tin quan trọng nhất?
A. Phân tích phương sai (ANOVA)
B. Phân tích thành phần chính (PCA)
C. Hồi quy tuyến tính
D. Kiểm định Chi-bình phương
9. Trong phân tích độ tin cậy, hệ số Cronbach`s alpha được sử dụng để đánh giá điều gì?
A. Độ giá trị của thang đo.
B. Độ ổn định của thang đo theo thời gian.
C. Độ tin cậy nội tại (internal consistency) của thang đo.
D. Độ nhạy của thang đo đối với sự thay đổi.
10. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên, giả sử tất cả các yếu tố khác không đổi?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy không thay đổi.
C. Khoảng tin cậy trở nên hẹp hơn.
D. Khoảng tin cậy trở nên không xác định.
11. Độ lệch chuẩn đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh trung bình.
B. Mức độ không đối xứng của phân phối.
C. Mức độ phân tán của dữ liệu xung quanh trung bình.
D. Mức độ tin cậy của ước lượng.
12. Trong phân tích cụm (cluster analysis), mục tiêu chính là gì?
A. Dự đoán giá trị của một biến phụ thuộc.
B. Phân nhóm các đối tượng tương tự thành các cụm dựa trên các đặc điểm của chúng.
C. Kiểm tra sự khác biệt giữa trung bình của các nhóm.
D. Đánh giá mối quan hệ giữa hai biến.
13. Mục đích chính của việc lấy mẫu ngẫu nhiên là gì?
A. Để đảm bảo mẫu có kích thước đủ lớn.
B. Để giảm chi phí thu thập dữ liệu.
C. Để đảm bảo mỗi thành viên của tổng thể có cơ hội được chọn như nhau, giảm thiểu sai lệch.
D. Để đơn giản hóa quá trình phân tích dữ liệu.
14. Trong lý thuyết xác suất, hai sự kiện được coi là độc lập nếu điều gì xảy ra?
A. Nếu chúng không thể xảy ra cùng một lúc.
B. Nếu xác suất xảy ra của một sự kiện ảnh hưởng đến xác suất xảy ra của sự kiện kia.
C. Nếu xác suất xảy ra của một sự kiện không ảnh hưởng đến xác suất xảy ra của sự kiện kia.
D. Nếu tổng xác suất của chúng bằng 1.
15. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) đại diện cho điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất chấp nhận giả thuyết null khi nó sai.
C. Xác suất bác bỏ giả thuyết null khi nó đúng (lỗi loại I).
D. Xác suất chấp nhận giả thuyết null khi nó đúng.
16. Trong phân tích sống sót (survival analysis), hàm Kaplan-Meier được sử dụng để ước tính điều gì?
A. Hàm nguy cơ (hazard function).
B. Hàm sống sót (survival function).
C. Thời gian sống sót trung bình.
D. Tỷ lệ tử vong.
17. Khi nào thì kiểm định t (t-test) phù hợp để sử dụng?
A. Khi so sánh trung bình của hai mẫu độc lập có kích thước lớn.
B. Khi so sánh phương sai của hai mẫu.
C. Khi so sánh trung bình của hai mẫu độc lập có kích thước nhỏ hoặc khi độ lệch chuẩn của tổng thể chưa biết.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
18. Trong thống kê, loại lỗi nào xảy ra khi bác bỏ một giả thuyết null đúng?
A. Lỗi loại II
B. Sai số chuẩn
C. Lỗi hệ thống
D. Lỗi loại I
19. Phương pháp nào sau đây được sử dụng để kiểm tra sự khác biệt giữa trung bình của ba nhóm trở lên?
A. Kiểm định t
B. Phân tích phương sai (ANOVA)
C. Hồi quy tuyến tính
D. Kiểm định Chi-bình phương
20. Trong phân tích chuỗi thời gian, thành phần nào đề cập đến các biến động dài hạn trong dữ liệu?
A. Biến động mùa vụ
B. Xu hướng
C. Biến động ngẫu nhiên
D. Biến động theo chu kỳ
21. Chọn khẳng định đúng về mối quan hệ giữa trung bình, trung vị và mốt trong phân phối đối xứng.
A. Trung bình > Trung vị > Mốt
B. Trung bình < Trung vị < Mốt
C. Trung bình = Trung vị = Mốt
D. Trung bình > Trung vị = Mốt
22. Điều gì phân biệt thống kê mô tả và thống kê suy luận?
A. Thống kê mô tả sử dụng dữ liệu mẫu để suy luận về tổng thể, trong khi thống kê suy luận chỉ mô tả dữ liệu mẫu.
B. Thống kê mô tả tóm tắt và trình bày dữ liệu, trong khi thống kê suy luận sử dụng dữ liệu mẫu để suy luận về tổng thể.
C. Thống kê mô tả sử dụng các phương pháp toán học phức tạp hơn thống kê suy luận.
D. Thống kê mô tả chỉ áp dụng cho dữ liệu định tính, trong khi thống kê suy luận chỉ áp dụng cho dữ liệu định lượng.
23. Trong thống kê Bayes, điều gì thể hiện xác suất tiên nghiệm (prior probability)?
A. Xác suất của dữ liệu quan sát được.
B. Xác suất của giả thuyết sau khi xem xét dữ liệu.
C. Xác suất của giả thuyết trước khi xem xét dữ liệu.
D. Xác suất của việc mắc lỗi loại I.
24. Trong thống kê, lỗi hệ thống (systematic error) đề cập đến loại sai lệch nào?
A. Sai lệch ngẫu nhiên trong quá trình đo lường.
B. Sai lệch nhất quán và có thể dự đoán được trong quá trình đo lường.
C. Sai lệch do lỗi nhập liệu.
D. Sai lệch do kích thước mẫu quá nhỏ.
25. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Độ chính xác của các hệ số hồi quy.
D. Mức ý nghĩa thống kê của mô hình.
26. Điều gì thể hiện mối quan hệ giữa phương sai và độ lệch chuẩn?
A. Phương sai là căn bậc hai của độ lệch chuẩn.
B. Độ lệch chuẩn là căn bậc hai của phương sai.
C. Phương sai và độ lệch chuẩn là hai khái niệm độc lập.
D. Phương sai luôn lớn hơn độ lệch chuẩn.
27. Khi nào thì nên sử dụng trung vị thay vì trung bình để đo lường xu hướng trung tâm?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi có các giá trị ngoại lệ (outliers) trong dữ liệu.
C. Khi cần tính toán nhanh chóng.
D. Khi dữ liệu là số nguyên.
28. Trong thống kê, hiệp phương sai đo lường điều gì?
A. Độ mạnh của mối quan hệ tuyến tính giữa hai biến.
B. Hướng của mối quan hệ tuyến tính giữa hai biến.
C. Mức độ biến động của một biến.
D. Tỷ lệ phương sai được giải thích bởi mô hình.
29. Phương pháp nào sau đây được sử dụng để kiểm tra tính dừng (stationarity) của một chuỗi thời gian?
A. Kiểm định t
B. Kiểm định Chi-bình phương
C. Kiểm định Augmented Dickey-Fuller (ADF)
D. Phân tích phương sai (ANOVA)
30. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến gì?
A. Biến liên tục.
B. Biến phân loại (categorical).
C. Biến thứ bậc (ordinal).
D. Biến đếm (count).