1. Khi nào thì nên sử dụng kiểm định Chi bình phương (Chi-square test)?
A. Để so sánh trung bình của hai nhóm.
B. Để kiểm tra sự độc lập giữa hai biến định tính.
C. Để ước lượng phương sai của một quần thể.
D. Để dự đoán giá trị của một biến liên tục.
2. Định nghĩa của trung vị (median) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm giữa của tập dữ liệu đã được sắp xếp.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất.
3. Trong một phân phối chuẩn, khoảng tin cậy 95% cho trung bình mẫu được tính như thế nào?
A. $\bar{x} \pm 1.96 \frac{\sigma}{\sqrt{n}}$
B. $\bar{x} \pm 1.645 \frac{\sigma}{\sqrt{n}}$
C. $\bar{x} \pm 2.576 \frac{\sigma}{\sqrt{n}}$
D. $\bar{x} \pm 2.33 \frac{\sigma}{\sqrt{n}}$
4. Cho một mẫu dữ liệu: 2, 4, 6, 8, 10. Tính phương sai mẫu.
5. Phân phối nào thường được sử dụng để kiểm định giả thuyết về phương sai của một quần thể?
A. Phân phối Z
B. Phân phối t
C. Phân phối Chi bình phương ($\chi^2$)
D. Phân phối F
6. Điều gì xảy ra với độ rộng của khoảng tin cậy khi tăng kích thước mẫu?
A. Độ rộng khoảng tin cậy tăng.
B. Độ rộng khoảng tin cậy không đổi.
C. Độ rộng khoảng tin cậy giảm.
D. Không thể xác định.
7. Trong phân phối Poisson, điều gì đại diện cho tham số $\lambda$?
A. Phương sai
B. Độ lệch chuẩn
C. Trung bình số sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định
D. Số lượng thử nghiệm
8. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) $\alpha$ đại diện cho điều gì?
A. Xác suất chấp nhận giả thuyết null khi nó đúng.
B. Xác suất bác bỏ giả thuyết null khi nó đúng (lỗi loại I).
C. Xác suất chấp nhận giả thuyết null khi nó sai (lỗi loại II).
D. Xác suất bác bỏ giả thuyết null khi nó sai.
9. Một nhà máy sản xuất bóng đèn. Xác suất để một bóng đèn bị hỏng là 0.05. Nếu chọn ngẫu nhiên 20 bóng đèn, tính xác suất để có nhiều nhất 1 bóng đèn bị hỏng.
A. 0.3585
B. 0.7358
C. 0.9841
D. 0.2642
10. Định nghĩa của phương sai (variance) là gì?
A. Căn bậc hai của độ lệch chuẩn.
B. Trung bình cộng của các giá trị.
C. Độ đo sự phân tán của dữ liệu xung quanh giá trị trung bình.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất.
11. Trong hồi quy tuyến tính, phương pháp bình phương tối thiểu (least squares) được sử dụng để làm gì?
A. Tìm đường thẳng đi qua nhiều điểm nhất.
B. Giảm thiểu tổng bình phương khoảng cách giữa các điểm dữ liệu và đường hồi quy.
C. Tối đa hóa hệ số tương quan.
D. Tìm đường thẳng song song với trục x.
12. Điều gì xảy ra với giá trị tới hạn (critical value) khi mức ý nghĩa ($\alpha$) giảm?
A. Giá trị tới hạn tăng.
B. Giá trị tới hạn giảm.
C. Giá trị tới hạn không đổi.
D. Không thể xác định.
13. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất mắc lỗi loại I.
C. Xác suất thu được kết quả kiểm định (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
D. Xác suất chấp nhận giả thuyết null.
14. Trong lý thuyết ước lượng, một ước lượng không chệch (unbiased estimator) là gì?
A. Một ước lượng luôn trả về giá trị đúng của tham số.
B. Một ước lượng có giá trị kỳ vọng bằng với giá trị thực của tham số.
C. Một ước lượng có phương sai nhỏ.
D. Một ước lượng dễ tính toán.
15. Cho hai biến cố A và B độc lập. Biết $P(A) = 0.3$ và $P(B) = 0.4$. Tính $P(A \cup B)$.
A. 0.7
B. 0.12
C. 0.58
D. 0.72
16. Trong phân tích ANOVA, đại lượng nào được so sánh để kiểm tra sự khác biệt giữa các trung bình của các nhóm?
A. Phương sai giữa các nhóm và phương sai trong mỗi nhóm.
B. Trung bình của các nhóm.
C. Độ lệch chuẩn của các nhóm.
D. Kích thước mẫu của các nhóm.
17. Một hộp chứa 5 bi đỏ và 3 bi xanh. Lấy ngẫu nhiên 2 bi. Tính xác suất để cả hai bi đều màu đỏ. (Sử dụng tổ hợp)
A. $\frac{5}{14}$
B. $\frac{10}{56}$
C. $\frac{10}{28}$
D. $\frac{15}{56}$
18. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và phương sai của quần thể chưa biết.
D. Khi muốn so sánh hai quần thể.
19. Sự khác biệt chính giữa thống kê tham số (parametric statistics) và thống kê phi tham số (non-parametric statistics) là gì?
A. Thống kê tham số yêu cầu dữ liệu phải tuân theo một phân phối cụ thể, trong khi thống kê phi tham số thì không.
B. Thống kê phi tham số yêu cầu dữ liệu phải tuân theo một phân phối cụ thể, trong khi thống kê tham số thì không.
C. Thống kê tham số chỉ sử dụng dữ liệu định tính, trong khi thống kê phi tham số sử dụng dữ liệu định lượng.
D. Thống kê tham số dễ tính toán hơn thống kê phi tham số.
20. Nếu một biến ngẫu nhiên X tuân theo phân phối chuẩn với trung bình $\mu$ và phương sai $\sigma^2$, thì biến ngẫu nhiên $Z = \frac{X - \mu}{\sigma}$ tuân theo phân phối nào?
A. Phân phối chuẩn với trung bình 0 và phương sai 1
B. Phân phối t-Student
C. Phân phối Chi bình phương
D. Phân phối F
21. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả dữ liệu mẫu.
B. Thu thập dữ liệu.
C. Đưa ra kết luận hoặc dự đoán về một quần thể dựa trên dữ liệu mẫu.
D. Tính toán các số liệu thống kê mô tả.
22. Điều gì xảy ra với sai số chuẩn của trung bình (standard error of the mean) khi kích thước mẫu tăng lên?
A. Sai số chuẩn của trung bình tăng lên.
B. Sai số chuẩn của trung bình giảm xuống.
C. Sai số chuẩn của trung bình không đổi.
D. Không thể xác định.
23. Một túi có 7 viên bi đỏ và 3 viên bi xanh. Chọn ngẫu nhiên 3 viên bi. Tính xác suất chọn được 2 viên bi đỏ và 1 viên bi xanh.
A. $\frac{21}{40}$
B. $\frac{7}{10}$
C. $\frac{1}{4}$
D. $\frac{11}{40}$
24. Hệ số tương quan (correlation coefficient) có giá trị nằm trong khoảng nào?
A. (0, 1)
B. (-∞, +∞)
C. [-1, 1]
D. [0, ∞)
25. Sự khác biệt chính giữa phân phối nhị thức (Binomial) và phân phối siêu bội (Hypergeometric) là gì?
A. Phân phối nhị thức có các thử nghiệm độc lập, trong khi phân phối siêu bội thì không.
B. Phân phối siêu bội có các thử nghiệm độc lập, trong khi phân phối nhị thức thì không.
C. Phân phối nhị thức sử dụng lấy mẫu không hoàn lại, trong khi phân phối siêu bội sử dụng lấy mẫu hoàn lại.
D. Cả hai phân phối đều giống nhau.
26. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Sự phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất trong tập dữ liệu.
27. Một đồng xu được tung 5 lần. Tính xác suất để có đúng 3 mặt ngửa.
A. $\frac{5}{32}$
B. $\frac{1}{2}$
C. $\frac{10}{32}$
D. $\frac{3}{5}$
28. Công thức nào sau đây dùng để tính khoảng tin cậy cho tỷ lệ?
A. $\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$
B. $\bar{x} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$
C. $\hat{p} \pm t_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$
D. $\bar{x} \pm t_{\alpha/2} \frac{s}{\sqrt{n}}$
29. Cho hàm mật độ xác suất $f(x) = kx$ với $0 \le x \le 2$. Tìm giá trị của k.
A. 1/2
B. 1
C. 3/4
D. 1/4
30. Trong kiểm định giả thuyết, lỗi loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó sai.
B. Chấp nhận giả thuyết null khi nó đúng.
C. Bác bỏ giả thuyết null khi nó đúng.
D. Chấp nhận giả thuyết null khi nó sai.