1. Chọn câu đúng về kiểm định t (t-test):
A. Luôn sử dụng khi kích thước mẫu lớn hơn 30.
B. Sử dụng để so sánh trung bình của hai mẫu.
C. Chỉ dùng cho dữ liệu định tính.
D. Chỉ dùng khi biết độ lệch chuẩn của quần thể.
2. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết $H_0$ khi nó đúng.
B. Chấp nhận giả thuyết $H_0$ khi nó sai.
C. Bác bỏ giả thuyết $H_0$ khi nó sai.
D. Chấp nhận giả thuyết $H_0$ khi nó đúng.
3. Trong một hộp có 5 bi đỏ và 3 bi xanh. Nếu lấy ngẫu nhiên 2 bi, xác suất để cả hai bi đều đỏ là bao nhiêu?
A. $\frac{5}{8}$
B. $\frac{25}{64}$
C. $\frac{5}{14}$
D. $\frac{10}{56}$
4. Nếu hai sự kiện A và B độc lập, thì $P(A \cap B)$ bằng:
A. $P(A) + P(B)$
B. $P(A) - P(B)$
C. $P(A) \times P(B)$
D. $P(A) / P(B)$
5. Mô tả nào sau đây là đúng về Định lý giới hạn trung tâm (Central Limit Theorem)?
A. Nó chỉ áp dụng cho các mẫu có kích thước lớn.
B. Nó nói rằng phân phối của trung bình mẫu sẽ xấp xỉ phân phối chuẩn khi kích thước mẫu đủ lớn, bất kể hình dạng của phân phối gốc.
C. Nó chỉ áp dụng cho các phân phối chuẩn.
D. Nó nói rằng phương sai của mẫu sẽ xấp xỉ phương sai của quần thể.
6. Độ lệch chuẩn (standard deviation) là gì?
A. Trung bình của các giá trị.
B. Căn bậc hai của phương sai.
C. Phương sai bình phương.
D. Một nửa phương sai.
7. Chọn phát biểu đúng về mối quan hệ giữa sai số loại I (Type I error) và mức ý nghĩa (significance level) $\alpha$:
A. $\alpha$ là xác suất mắc sai số loại II.
B. $\alpha$ là xác suất mắc sai số loại I.
C. $\alpha$ là 1 trừ xác suất mắc sai số loại I.
D. $\alpha$ là 1 trừ xác suất mắc sai số loại II.
8. Công thức nào sau đây tính phương sai mẫu?
A. $s^2 = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n}$
B. $s^2 = \frac{\sum_{i=1}^{n} (x_i - \mu)^2}{n-1}$
C. $s^2 = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1}$
D. $s^2 = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1}}$
9. Trong thống kê mô tả, trung vị (median) là gì?
A. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
B. Giá trị trung bình của tập dữ liệu.
C. Giá trị nằm giữa tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
10. Sai số chuẩn của trung bình (standard error of the mean) được tính như thế nào?
A. Độ lệch chuẩn của quần thể chia cho kích thước mẫu.
B. Độ lệch chuẩn của mẫu chia cho kích thước mẫu.
C. Độ lệch chuẩn của quần thể chia cho căn bậc hai của kích thước mẫu.
D. Độ lệch chuẩn của mẫu chia cho căn bậc hai của kích thước mẫu.
11. Điều gì sẽ xảy ra với độ rộng của khoảng tin cậy nếu bạn tăng kích thước mẫu?
A. Độ rộng tăng.
B. Độ rộng giảm.
C. Độ rộng không đổi.
D. Không thể xác định.
12. Trong một phân phối nhị thức với n phép thử và xác suất thành công p, giá trị trung bình (mean) được tính như thế nào?
A. $np(1-p)$
B. $\sqrt{np(1-p)}$
C. $np$
D. $\frac{n}{p}$
13. Khoảng tin cậy (confidence interval) là gì?
A. Một khoảng giá trị mà chúng ta chắc chắn rằng tham số của quần thể nằm trong đó.
B. Một khoảng giá trị mà chúng ta ước lượng rằng tham số của quần thể có khả năng nằm trong đó, với một mức độ tin cậy nhất định.
C. Một khoảng giá trị chứa tất cả các giá trị có thể có của mẫu.
D. Một khoảng giá trị dùng để kiểm định giả thuyết.
14. Định nghĩa nào sau đây mô tả đúng nhất về `phân phối lấy mẫu` (sampling distribution)?
A. Phân phối của tất cả các giá trị có thể có của một thống kê (ví dụ: trung bình mẫu) được tính từ các mẫu có cùng kích thước được lấy từ cùng một quần thể.
B. Phân phối của các giá trị trong một mẫu đơn lẻ.
C. Phân phối của quần thể mà từ đó mẫu được lấy.
D. Phân phối của các sai số trong mô hình hồi quy.
15. Biến ngẫu nhiên rời rạc là gì?
A. Biến có thể nhận bất kỳ giá trị nào trong một khoảng.
B. Biến chỉ có thể nhận một số hữu hạn giá trị hoặc vô hạn đếm được các giá trị.
C. Biến có giá trị luôn dương.
D. Biến có giá trị luôn âm.
16. Điều gì xảy ra với giá trị tới hạn (critical value) khi mức ý nghĩa ($\alpha$) giảm?
A. Giá trị tới hạn tăng.
B. Giá trị tới hạn giảm.
C. Giá trị tới hạn không đổi.
D. Không thể xác định.
17. Nếu hệ số tương quan Pearson giữa hai biến là -1, điều này có nghĩa là gì?
A. Có một mối tương quan dương hoàn hảo.
B. Không có mối tương quan.
C. Có một mối tương quan âm hoàn hảo.
D. Có một mối tương quan phi tuyến tính.
18. Trong phân tích hồi quy tuyến tính, hệ số xác định ($R^2$) cho biết điều gì?
A. Mức độ mạnh của mối quan hệ giữa các biến.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của ước lượng.
19. Trong phân tích chuỗi thời gian, hàm tự tương quan (ACF) được sử dụng để làm gì?
A. Đo lường mối quan hệ giữa các chuỗi thời gian khác nhau.
B. Đo lường mối quan hệ giữa các giá trị của một chuỗi thời gian tại các thời điểm khác nhau.
C. Loại bỏ xu hướng (trend) trong chuỗi thời gian.
D. Dự báo giá trị tương lai của chuỗi thời gian.
20. Giả sử bạn muốn kiểm tra xem có sự khác biệt đáng kể giữa tỷ lệ thành công của hai sản phẩm mới. Bạn nên sử dụng kiểm định nào?
A. Kiểm định t độc lập.
B. Kiểm định khi bình phương.
C. Phân tích phương sai (ANOVA).
D. Kiểm định z cho hai tỷ lệ.
21. Một đồng xu được tung 10 lần. Xác suất để có đúng 5 mặt ngửa là bao nhiêu?
A. $\frac{1}{2}$
B. $\binom{10}{5} (\frac{1}{2})^{10}$
C. $\frac{5}{10}$
D. $\binom{10}{5}$
22. Nếu một biến ngẫu nhiên X tuân theo phân phối Poisson với tham số $\lambda$, thì phương sai của X bằng:
A. $\lambda^2$
B. $\sqrt{\lambda}$
C. $\lambda$
D. $2\lambda$
23. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. So sánh trung bình của hai quần thể.
B. So sánh phương sai của hai quần thể.
C. So sánh trung bình của ba hoặc nhiều hơn các quần thể.
D. Kiểm tra sự độc lập giữa hai biến định tính.
24. Giá trị p (p-value) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất để giả thuyết null là đúng.
B. Xác suất để giả thuyết thay thế là đúng.
C. Xác suất quan sát được kết quả hoặc kết quả cực đoan hơn, giả sử giả thuyết null là đúng.
D. Mức ý nghĩa của kiểm định.
25. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
C. So sánh phương sai của hai mẫu.
D. Kiểm tra sự độc lập giữa hai biến định tính.
26. Hàm mật độ xác suất (probability density function - PDF) được sử dụng cho loại biến ngẫu nhiên nào?
A. Biến ngẫu nhiên rời rạc.
B. Biến ngẫu nhiên liên tục.
C. Cả biến ngẫu nhiên rời rạc và liên tục.
D. Không loại biến ngẫu nhiên nào.
27. Trong kiểm định khi bình phương (Chi-square test), thống kê kiểm định được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. So sánh phương sai của hai mẫu.
C. Kiểm tra sự độc lập giữa hai biến định tính.
D. Ước lượng tham số của quần thể.
28. Trong phân tích hồi quy đa biến, VIF (Variance Inflation Factor) được sử dụng để làm gì?
A. Đo lường mức độ quan trọng của mỗi biến độc lập.
B. Đánh giá sự phù hợp tổng thể của mô hình.
C. Phát hiện đa cộng tuyến (multicollinearity) giữa các biến độc lập.
D. Kiểm tra tính tuyến tính của mối quan hệ giữa biến độc lập và biến phụ thuộc.
29. Đâu là một đặc điểm của phân phối chuẩn?
A. Đối xứng và có trung bình bằng 0.
B. Không đối xứng.
C. Luôn có phương sai bằng 1.
D. Chỉ nhận giá trị dương.
30. Công thức nào sau đây được sử dụng để tính hiệp phương sai (covariance) giữa hai biến X và Y?
A. $Cov(X, Y) = \frac{\sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y})}{n}$
B. $Cov(X, Y) = \frac{\sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y})}{n-1}$
C. $Cov(X, Y) = \sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y})$
D. $Cov(X, Y) = \frac{\sum_{i=1}^{n} (X_i - \mu_X)(Y_i - \mu_Y)}{n}$