1. Trong thống kê, `bậc tự do` (degrees of freedom) thường liên quan đến điều gì?
A. Số lượng quan sát trong một tập dữ liệu.
B. Số lượng biến trong một mô hình.
C. Số lượng quan sát độc lập có sẵn để ước tính các tham số.
D. Mức ý nghĩa được sử dụng trong kiểm định giả thuyết.
2. Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó đúng.
B. Chấp nhận giả thuyết null khi nó đúng.
C. Bác bỏ giả thuyết null khi nó sai.
D. Chấp nhận giả thuyết null khi nó sai.
3. Trong phân tích phương sai (ANOVA), thống kê F được tính như thế nào?
A. Tỷ lệ giữa phương sai giữa các nhóm và phương sai trong mỗi nhóm.
B. Tỷ lệ giữa phương sai trong mỗi nhóm và phương sai giữa các nhóm.
C. Hiệu giữa trung bình lớn nhất và trung bình nhỏ nhất.
D. Tổng bình phương sai số.
4. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó đúng.
B. Chấp nhận giả thuyết null khi nó đúng.
C. Bác bỏ giả thuyết null khi nó sai.
D. Chấp nhận giả thuyết null khi nó sai.
5. Cho hai biến ngẫu nhiên X và Y độc lập với nhau. Biết $Var(X) = 2$ và $Var(Y) = 3$. Tính $Var(2X - Y + 1)$
6. Một hộp chứa 5 bi đỏ và 3 bi xanh. Nếu bạn lấy ngẫu nhiên 2 bi, xác suất cả hai bi đều đỏ là bao nhiêu?
A. $\frac{5}{8}$
B. $\frac{25}{64}$
C. $\frac{5}{14}$
D. $\frac{10}{56}$
7. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mức độ biến thiên của một biến.
B. Mối quan hệ nhân quả giữa hai biến.
C. Mức độ của mối quan hệ tuyến tính giữa hai biến.
D. Sự khác biệt giữa trung bình của hai biến.
8. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu điều gì?
A. Phân phối của trung bình mẫu sẽ hội tụ về phân phối Poisson khi kích thước mẫu tăng lên.
B. Phân phối của trung bình mẫu sẽ hội tụ về phân phối nhị thức khi kích thước mẫu tăng lên.
C. Phân phối của trung bình mẫu sẽ hội tụ về phân phối chuẩn khi kích thước mẫu tăng lên, bất kể hình dạng của phân phối gốc.
D. Phương sai của mẫu bằng phương sai của quần thể.
9. Giá trị kỳ vọng (Expected value) của một biến ngẫu nhiên rời rạc được tính như thế nào?
A. Tổng của tất cả các giá trị có thể của biến.
B. Giá trị xuất hiện nhiều nhất của biến.
C. Tổng của tích của mỗi giá trị với xác suất tương ứng của nó.
D. Giá trị ở giữa khi các giá trị được sắp xếp theo thứ tự.
10. Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. Đánh giá mối quan hệ tuyến tính giữa hai biến liên tục.
C. Kiểm tra sự phù hợp của dữ liệu với một phân phối lý thuyết hoặc kiểm tra tính độc lập giữa hai biến phân loại.
D. Ước tính phương sai của một quần thể.
11. Trong phân tích hồi quy tuyến tính, $R^2$ (R-squared) đại diện cho điều gì?
A. Phương sai của sai số.
B. Tổng bình phương sai số.
C. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
D. Hệ số tương quan giữa biến độc lập và biến phụ thuộc.
12. Độ lệch chuẩn (Standard deviation) là gì?
A. Bình phương của phương sai.
B. Căn bậc hai của phương sai.
C. Giá trị trung bình của các độ lệch tuyệt đối so với trung bình.
D. Khoảng cách giữa giá trị lớn nhất và giá trị nhỏ nhất.
13. Mốt (Mode) của một tập dữ liệu là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị ở giữa tập dữ liệu khi nó được sắp xếp theo thứ tự.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
14. Phân phối nào được sử dụng để mô hình hóa thời gian cho đến khi một sự kiện xảy ra?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối mũ (Exponential distribution).
D. Phân phối Poisson.
15. Trong kiểm định giả thuyết, mức ý nghĩa ($\alpha$) đại diện cho điều gì?
A. Xác suất mắc sai lầm loại II.
B. Xác suất chấp nhận giả thuyết null khi nó đúng.
C. Xác suất mắc sai lầm loại I.
D. Xác suất bác bỏ giả thuyết null khi nó sai.
16. Phân phối nào sau đây thường được sử dụng để so sánh trung bình của hai quần thể khi phương sai của chúng chưa biết và có thể không bằng nhau?
A. Phân phối Z.
B. Phân phối Chi-bình phương.
C. Phân phối F.
D. Phân phối t.
17. Ý nghĩa của giá trị p (p-value) trong kiểm định giả thuyết là gì?
A. Xác suất bác bỏ giả thuyết null khi nó đúng.
B. Xác suất chấp nhận giả thuyết null khi nó sai.
C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
D. Xác suất giả thuyết null là đúng.
18. Quy tắc 68-95-99.7 (Empirical Rule) áp dụng cho loại phân phối nào?
A. Phân phối Poisson.
B. Phân phối nhị thức.
C. Phân phối đều.
D. Phân phối chuẩn.
19. Một nhà máy sản xuất bóng đèn. Xác suất một bóng đèn bị hỏng là 0.05. Nếu chọn ngẫu nhiên 10 bóng đèn, xác suất có đúng 1 bóng đèn bị hỏng là bao nhiêu?
A. 0.000
B. 0.298
C. 0.500
D. 0.950
20. Phương sai (Variance) đo lường điều gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Độ lệch chuẩn của một tập dữ liệu.
C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong một tập dữ liệu.
21. Trong một thí nghiệm, biến độc lập là gì?
A. Biến được đo lường để xem nó có bị ảnh hưởng hay không.
B. Biến không thay đổi trong suốt thí nghiệm.
C. Biến được thao tác hoặc thay đổi bởi nhà nghiên cứu.
D. Biến được sử dụng để kiểm soát các yếu tố gây nhiễu.
22. Một mẫu ngẫu nhiên gồm 100 sản phẩm được kiểm tra và thấy có 5 sản phẩm bị lỗi. Tính ước lượng khoảng cho tỷ lệ sản phẩm bị lỗi trong toàn bộ lô hàng với độ tin cậy 95%. Giả sử $z_{0.025} = 1.96$.
A. 0.05 \pm 0.0098
B. 0.05 \pm 0.096
C. 0.05 \pm 0.0196
D. 0.05 \pm 1.96
23. Trung vị (Median) của một tập dữ liệu là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị ở giữa tập dữ liệu khi nó được sắp xếp theo thứ tự.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
24. Giả sử bạn tung một đồng xu 3 lần. Xác suất để có ít nhất 2 mặt ngửa là bao nhiêu?
A. $\frac{1}{8}$
B. $\frac{1}{3}$
C. $\frac{1}{2}$
D. $\frac{5}{8}$
25. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên?
A. Độ rộng của khoảng tin cậy không thay đổi.
B. Độ rộng của khoảng tin cậy tăng lên.
C. Độ rộng của khoảng tin cậy giảm xuống.
D. Không thể xác định.
26. Phân phối Poisson thường được sử dụng để mô hình hóa điều gì?
A. Thời gian giữa các sự kiện.
B. Xác suất thành công trong một chuỗi thử nghiệm Bernoulli.
C. Số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
D. Phân phối của trung bình mẫu.
27. Một người bắn 3 phát súng vào một mục tiêu. Xác suất bắn trúng mục tiêu trong mỗi lần bắn là 0.7. Tính xác suất người đó bắn trúng mục tiêu ít nhất một lần.
A. 0.027
B. 0.343
C. 0.657
D. 0.973
28. Trong một phân phối chuẩn, khoảng tin cậy 95% cho trung bình mẫu được tính như thế nào?
A. $\bar{x} \pm 1.645 \frac{\sigma}{\sqrt{n}}$
B. $\bar{x} \pm 2.576 \frac{\sigma}{\sqrt{n}}$
C. $\bar{x} \pm 1.96 \frac{\sigma}{\sqrt{n}}$
D. $\bar{x} \pm 2.33 \frac{\sigma}{\sqrt{n}}$
29. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi phương sai của các nhóm bằng nhau.
30. Trong một lớp học có 30 sinh viên, có 12 sinh viên thích Toán, 15 sinh viên thích Lý, và 5 sinh viên không thích cả hai môn. Có bao nhiêu sinh viên thích cả Toán và Lý?