1. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi các giả định của kiểm định tham số không được đáp ứng
D. Khi muốn tính khoảng tin cậy
2. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là alpha (α) đại diện cho điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất chấp nhận giả thuyết H0 khi nó sai.
C. Xác suất bác bỏ giả thuyết H0 khi nó đúng (lỗi loại I).
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
3. Trong thống kê mô tả, đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu so với giá trị trung bình?
A. Trung vị
B. Giá trị lớn nhất
C. Độ lệch chuẩn
D. Tần số
4. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được kiểm tra?
A. Sự khác biệt giữa các phương sai của các mẫu
B. Sự bằng nhau của các trung bình của hai quần thể
C. Sự khác biệt giữa các trung bình của nhiều quần thể
D. Mối quan hệ giữa hai biến định lượng
5. Trong thống kê, `phân phối chuẩn` (normal distribution) còn được gọi là gì?
A. Phân phối Poisson
B. Phân phối Bernoulli
C. Phân phối Gaussian
D. Phân phối nhị thức
6. Trong thống kê suy luận, `sai số chuẩn` (standard error) là gì?
A. Độ lệch chuẩn của mẫu.
B. Ước tính độ lệch chuẩn của phân phối lấy mẫu của một thống kê.
C. Sai số lớn nhất có thể trong ước tính.
D. Sai số do nhập dữ liệu không chính xác.
7. Trong thống kê, `trung vị` (median) là gì?
A. Giá trị xuất hiện nhiều nhất trong một tập dữ liệu
B. Giá trị trung bình của một tập dữ liệu
C. Giá trị ở giữa của một tập dữ liệu đã được sắp xếp
D. Độ lệch chuẩn của một tập dữ liệu
8. Định nghĩa nào sau đây mô tả chính xác nhất về `khoảng tin cậy` (confidence interval)?
A. Một giá trị duy nhất ước tính cho tham số của quần thể.
B. Một khoảng giá trị mà trong đó chúng ta tin rằng tham số của quần thể nằm trong đó với một mức độ tin cậy nhất định.
C. Xác suất mà một tham số của quần thể nằm trong một khoảng cụ thể.
D. Độ lệch chuẩn của mẫu.
9. Điều gì xảy ra với giá trị p (p-value) khi kích thước mẫu tăng lên (giả sử hiệu ứng thực tế không đổi)?
A. Giá trị p tăng lên
B. Giá trị p giảm xuống
C. Giá trị p không đổi
D. Không thể xác định
10. Trong thống kê Bayes, định lý Bayes được sử dụng để cập nhật điều gì?
A. Kích thước mẫu.
B. Xác suất tiên nghiệm (prior probability) dựa trên dữ liệu mới.
C. Mức ý nghĩa (significance level).
D. Sai số chuẩn (standard error).
11. Giả sử bạn muốn kiểm tra xem có sự khác biệt đáng kể về điểm trung bình của một bài kiểm tra giữa ba nhóm học sinh khác nhau. Phương pháp thống kê nào phù hợp nhất để sử dụng?
A. Kiểm định t (t-test)
B. Phân tích phương sai (ANOVA)
C. Hồi quy tuyến tính (Linear regression)
D. Kiểm định Chi-bình phương (Chi-square test)
12. Trong phân tích hồi quy, hệ số xác định (R-squared) thể hiện điều gì?
A. Độ mạnh của mối quan hệ nhân quả giữa các biến
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập
C. Độ dốc của đường hồi quy
D. Sai số chuẩn của ước lượng
13. Hệ số chặn (intercept) trong mô hình hồi quy tuyến tính biểu thị điều gì?
A. Sự thay đổi trung bình trong biến phụ thuộc khi biến độc lập tăng một đơn vị.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Độ mạnh của mối quan hệ giữa các biến.
D. Sai số chuẩn của ước lượng.
14. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi H0 đúng
B. Bác bỏ giả thuyết H0 khi H0 đúng
C. Chấp nhận giả thuyết H0 khi H0 sai
D. Bác bỏ giả thuyết H0 khi H0 sai
15. Mục đích của việc lấy mẫu ngẫu nhiên là gì?
A. Để chọn những người tham gia dễ tiếp cận nhất.
B. Để đảm bảo rằng mẫu đại diện cho quần thể mà từ đó nó được lấy.
C. Để giảm chi phí nghiên cứu.
D. Để làm cho dữ liệu dễ phân tích hơn.
16. Kiểm định giả thuyết một phía (one-tailed test) được sử dụng khi nào?
A. Khi không có giả thuyết cụ thể về hướng của hiệu ứng.
B. Khi quan tâm đến việc phát hiện hiệu ứng theo một hướng cụ thể.
C. Khi muốn so sánh trung bình của hai nhóm.
D. Khi kích thước mẫu lớn.
17. Trong phân tích sống sót (survival analysis), hàm Kaplan-Meier được sử dụng để làm gì?
A. Ước tính hàm rủi ro (hazard function).
B. Ước tính hàm sống sót (survival function).
C. So sánh trung bình của hai nhóm.
D. Dự đoán thời gian sống sót trung bình.
18. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên (giả sử các yếu tố khác không đổi)?
A. Độ rộng của khoảng tin cậy tăng lên
B. Độ rộng của khoảng tin cậy giảm xuống
C. Độ rộng của khoảng tin cậy không đổi
D. Không thể xác định
19. Trong phân tích hồi quy tuyến tính, phương pháp bình phương tối thiểu (least squares method) được sử dụng để làm gì?
A. Tìm đường thẳng đi qua tất cả các điểm dữ liệu
B. Giảm thiểu tổng bình phương khoảng cách giữa các điểm dữ liệu và đường hồi quy
C. Tối đa hóa hệ số tương quan
D. Tính giá trị trung bình của các biến
20. Biến ngẫu nhiên là gì?
A. Một biến có giá trị không đổi.
B. Một hàm số gán một số thực cho mỗi kết quả trong không gian mẫu.
C. Một biến được xác định trước.
D. Một biến không thể đo lường.
21. Trong phân tích chuỗi thời gian, thành phần nào sau đây mô tả sự biến động ngắn hạn và không đều đặn trong dữ liệu?
A. Xu hướng (Trend)
B. Tính thời vụ (Seasonality)
C. Chu kỳ (Cycle)
D. Tính ngẫu nhiên (Irregularity)
22. Trong thống kê, `ngoại lệ` (outlier) là gì?
A. Một giá trị xuất hiện nhiều nhất trong tập dữ liệu.
B. Một giá trị nằm gần giá trị trung bình.
C. Một giá trị khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Một giá trị bị thiếu trong tập dữ liệu.
23. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mối quan hệ phi tuyến tính giữa hai biến
B. Mối quan hệ nhân quả giữa hai biến
C. Mức độ biến động của một biến
D. Mối quan hệ tuyến tính giữa hai biến
24. Trong thống kê, `phương sai` (variance) đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất trong tập dữ liệu.
25. Khi nào thì kiểm định Chi-bình phương (Chi-square test) được sử dụng?
A. Để so sánh trung bình của hai nhóm
B. Để kiểm tra sự độc lập giữa hai biến định tính
C. Để đo lường mối quan hệ tuyến tính giữa hai biến định lượng
D. Để ước lượng khoảng tin cậy cho trung bình của một quần thể
26. Khi nào thì nên sử dụng hồi quy logistic (logistic regression)?
A. Khi biến phụ thuộc là biến định lượng liên tục.
B. Khi biến phụ thuộc là biến định tính nhị phân (binary).
C. Khi muốn dự đoán chuỗi thời gian.
D. Khi muốn so sánh trung bình của nhiều nhóm.
27. Phương pháp nào sau đây được sử dụng để giảm chiều dữ liệu trong thống kê?
A. Phân tích hồi quy tuyến tính
B. Phân tích thành phần chính (Principal Component Analysis - PCA)
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi-bình phương
28. Khi nào thì nên sử dụng kiểm định Mann-Whitney U (Mann-Whitney U test)?
A. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai nhóm phụ thuộc.
C. Để so sánh trung vị của hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để kiểm tra sự độc lập giữa hai biến định tính.
29. Phương pháp nào sau đây thường được sử dụng để ước lượng khoảng tin cậy cho trung bình của một quần thể khi độ lệch chuẩn của quần thể không được biết?
A. Phân phối Z
B. Phân phối Chi bình phương
C. Phân phối F
D. Phân phối t
30. Trong thống kê, `phân vị` (percentile) được sử dụng để làm gì?
A. Đo lường độ lệch chuẩn của dữ liệu
B. Chia dữ liệu thành 100 phần bằng nhau
C. Tính giá trị trung bình của dữ liệu
D. Xác định giá trị lớn nhất và nhỏ nhất của dữ liệu