1. Một hộp có 5 bi đỏ và 3 bi xanh. Lấy ngẫu nhiên 2 bi. Tính xác suất để cả hai bi đều đỏ.
A. $\frac{5}{14}$
B. $\frac{10}{56}$
C. $\frac{10}{28}$
D. $\frac{10}{28}$
2. Cho X là biến ngẫu nhiên tuân theo phân phối đều trên đoạn [0, 1]. Tính phương sai của X.
A. $\frac{1}{2}$
B. $\frac{1}{3}$
C. $\frac{1}{4}$
D. $\frac{1}{12}$
3. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Tất cả các trung bình quần thể đều bằng nhau.
B. Ít nhất một trung bình quần thể khác với các trung bình còn lại.
C. Phương sai của tất cả các quần thể đều bằng nhau.
D. Phương sai của ít nhất một quần thể khác với các phương sai còn lại.
4. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là gì?
A. $\beta$
B. $\sigma$
C. $\alpha$
D. $\mu$
5. Công thức nào sau đây dùng để tính khoảng tin cậy cho trung bình của một quần thể khi độ lệch chuẩn của quần thể đã biết?
A. $\bar{x} \pm z_{\alpha/2} * \frac{\sigma}{\sqrt{n}}$
B. $\bar{x} \pm t_{\alpha/2, n-1} * \frac{s}{\sqrt{n}}$
C. $\bar{x} \pm z_{\alpha} * \frac{\sigma}{\sqrt{n}}$
D. $\bar{x} \pm t_{\alpha, n-1} * \frac{s}{\sqrt{n}}$
6. Chọn khẳng định đúng về trung vị (median).
A. Trung vị là giá trị xuất hiện nhiều nhất trong tập dữ liệu.
B. Trung vị là giá trị trung bình của tập dữ liệu.
C. Trung vị là giá trị ở giữa của tập dữ liệu đã được sắp xếp.
D. Trung vị là căn bậc hai của phương sai.
7. Sai số loại I (Type I error) trong kiểm định giả thuyết là gì?
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Không bác bỏ giả thuyết null khi nó đúng.
D. Bác bỏ giả thuyết null khi nó sai.
8. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu rằng:
A. Phân phối của trung bình mẫu hội tụ về phân phối nhị thức khi kích thước mẫu tăng lên.
B. Phân phối của trung bình mẫu hội tụ về phân phối Poisson khi kích thước mẫu tăng lên.
C. Phân phối của trung bình mẫu hội tụ về phân phối chuẩn khi kích thước mẫu tăng lên.
D. Phương sai của mẫu luôn bằng phương sai của quần thể.
9. Mục đích chính của việc lấy mẫu ngẫu nhiên là gì?
A. Để chọn những phần tử dễ tiếp cận nhất trong quần thể.
B. Để đảm bảo mọi phần tử trong quần thể đều có cơ hội được chọn như nhau.
C. Để chọn những phần tử đại diện nhất cho quần thể.
D. Để giảm chi phí thu thập dữ liệu.
10. Cho biến ngẫu nhiên $X$ có hàm mật độ xác suất $f(x) = \begin{cases} kx & 0 \le x \le 2 \\ 0 & \text{otherwise} \end{cases}$. Tìm giá trị của $k$.
A. $\frac{1}{4}$
B. $\frac{1}{2}$
C. 1
D. 2
11. Phương sai (variance) đo lường điều gì?
A. Độ lệch trung bình của dữ liệu so với trung vị.
B. Độ lệch trung bình của dữ liệu so với trung bình.
C. Mức độ tập trung của dữ liệu.
D. Mức độ phân tán của dữ liệu.
12. Trong thống kê suy diễn, sai số chuẩn (standard error) của trung bình mẫu ước lượng điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
D. Sai số lớn nhất có thể xảy ra khi ước lượng trung bình quần thể.
13. Trong kiểm định giả thuyết, khi nào chúng ta bác bỏ giả thuyết null?
A. Khi giá trị p lớn hơn mức ý nghĩa.
B. Khi giá trị p nhỏ hơn hoặc bằng mức ý nghĩa.
C. Khi giá trị p bằng 0.
D. Khi giá trị p bằng 1.
14. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Mức độ biến động của một biến.
B. Mức độ quan hệ tuyến tính giữa hai biến.
C. Mức độ phân tán của dữ liệu.
D. Mức độ tập trung của dữ liệu.
15. Giá trị p (p-value) là gì trong kiểm định giả thuyết?
A. Xác suất bác bỏ giả thuyết null khi nó đúng.
B. Xác suất chấp nhận giả thuyết null khi nó sai.
C. Xác suất quan sát được kết quả kiểm định (hoặc kết quả khắc nghiệt hơn) nếu giả thuyết null là đúng.
D. Xác suất giả thuyết null là đúng.
16. Giá trị trung bình mẫu (sample mean) được tính như thế nào?
A. Tổng các giá trị chia cho phương sai.
B. Tổng các giá trị nhân với số lượng giá trị.
C. Tổng các giá trị chia cho số lượng giá trị.
D. Căn bậc hai của tổng bình phương các giá trị.
17. Nếu hai biến cố A và B xung khắc thì điều gì sau đây là đúng?
A. $P(A \cap B) = P(A) * P(B)$
B. $P(A \cup B) = P(A) + P(B) - P(A \cap B)$
C. $P(A \cap B) = 0$
D. $P(A \cup B) = P(A) * P(B)$
18. Cho hai biến cố $A$ và $B$ độc lập. Biết $P(A) = 0.4$ và $P(B) = 0.6$. Tính $P(A \cup B)$.
A. 0.24
B. 0.76
C. 1
D. 0.48
19. Một người tung đồng xu 10 lần. Tính xác suất để có đúng 5 lần mặt ngửa.
A. $\frac{C_{10}^5}{2^{10}}$
B. $\frac{5}{10}$
C. $\frac{1}{2^{10}}$
D. $\frac{1}{C_{10}^5}$
20. Cho hai biến ngẫu nhiên X và Y. Khi nào thì Cov(X, Y) = 0?
A. Khi X và Y độc lập.
B. Khi X và Y có mối quan hệ tuyến tính.
C. Khi X và Y có cùng phương sai.
D. Cov(X, Y) luôn khác 0.
21. Độ lệch chuẩn (standard deviation) được tính như thế nào?
A. Bình phương của phương sai.
B. Căn bậc hai của phương sai.
C. Giá trị trung bình của phương sai.
D. Tổng của các giá trị tuyệt đối của độ lệch so với trung bình.
22. Phân phối nào sau đây có tính chất `không trí nhớ` (memoryless property)?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối Poisson.
D. Phân phối mũ.
23. Cho bảng phân phối xác suất của biến ngẫu nhiên rời rạc X như sau: X | 0 | 1 | 2, P(X) | 0.2 | 0.5 | 0.3. Tính E(X).
A. 1.0
B. 1.1
C. 1.2
D. 1.3
24. Cho hai biến ngẫu nhiên X và Y có phương sai lần lượt là $Var(X) = 4$ và $Var(Y) = 9$. Biết hệ số tương quan giữa X và Y là $\rho_{XY} = 0.5$. Tính $Var(X + Y)$.
25. Một bài kiểm tra có 20 câu hỏi trắc nghiệm, mỗi câu có 4 lựa chọn. Một sinh viên chọn ngẫu nhiên các câu trả lời. Tính kỳ vọng số câu trả lời đúng của sinh viên đó.
26. Khi nào thì sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai mẫu?
A. Khi kích thước mẫu lớn hơn 30.
B. Khi độ lệch chuẩn của quần thể đã biết.
C. Khi độ lệch chuẩn của quần thể chưa biết và kích thước mẫu nhỏ.
D. Khi các mẫu độc lập với nhau.
27. Ước lượng điểm (point estimate) là gì?
A. Một khoảng giá trị mà tham số quần thể có khả năng nằm trong đó.
B. Một giá trị duy nhất được sử dụng để ước tính tham số quần thể.
C. Một tập hợp các giá trị có thể có của tham số quần thể.
D. Độ lệch chuẩn của mẫu.
28. Trong một phân phối chuẩn, khoảng tin cậy 95% có nghĩa là gì?
A. Xác suất giá trị trung bình thực tế nằm ngoài khoảng tin cậy là 5%.
B. Xác suất giá trị trung bình mẫu nằm trong khoảng tin cậy là 95%.
C. Xác suất giá trị trung bình thực tế nằm trong khoảng tin cậy là 95%.
D. Xác suất giá trị trung bình mẫu nằm ngoài khoảng tin cậy là 5%.
29. Trong phân tích hồi quy, $R^2$ (R-squared) đại diện cho điều gì?
A. Sai số chuẩn của ước lượng.
B. Tổng bình phương sai số.
C. Phần trăm phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
D. Hệ số tương quan giữa các biến độc lập.
30. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối Poisson.
D. Phân phối mũ.