1. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn
B. Phân phối Bernoulli
C. Phân phối Poisson
D. Phân phối nhị thức
2. Hệ số tương quan Pearson đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến.
B. Sự khác biệt giữa trung bình của hai biến.
C. Mối quan hệ tuyến tính giữa hai biến.
D. Sự biến động của một biến duy nhất.
3. Tính chất nào sau đây không phải là tính chất của ước lượng không chệch?
A. Trung bình của phân phối lấy mẫu của ước lượng bằng với tham số tổng thể.
B. Ước lượng có phương sai nhỏ nhất.
C. Ước lượng không có xu hướng đánh giá cao hoặc đánh giá thấp tham số tổng thể.
D. Giá trị kỳ vọng của ước lượng bằng tham số cần ước lượng.
4. Trong thống kê, thuật ngữ `ngoại lệ` (outlier) đề cập đến điều gì?
A. Một giá trị thường xuyên xuất hiện trong tập dữ liệu.
B. Một giá trị nằm gần trung bình của tập dữ liệu.
C. Một giá trị khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Một giá trị luôn sai.
5. Trong lý thuyết xác suất, biến ngẫu nhiên rời rạc là gì?
A. Biến nhận giá trị trong một khoảng liên tục.
B. Biến nhận một số hữu hạn giá trị hoặc vô hạn đếm được.
C. Biến luôn có giá trị dương.
D. Biến không thể xác định được giá trị.
6. Đâu là một tính chất của phương sai?
A. Phương sai luôn âm.
B. Phương sai là căn bậc hai của độ lệch chuẩn.
C. Phương sai của một hằng số bằng 0.
D. Phương sai không thể tính được.
7. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết $H_0$ là đúng.
B. Xác suất mắc lỗi loại II.
C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết $H_0$ là đúng.
D. Xác suất giả thuyết $H_1$ là đúng.
8. Chọn khẳng định đúng về độ lệch chuẩn.
A. Độ lệch chuẩn là bình phương của phương sai.
B. Độ lệch chuẩn là một số âm.
C. Độ lệch chuẩn đo lường mức độ phân tán của dữ liệu so với giá trị trung bình.
D. Độ lệch chuẩn không thể tính được.
9. Trong phân tích hồi quy tuyến tính, $R^2$ (R-squared) thể hiện điều gì?
A. Phương sai của sai số.
B. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
C. Độ dốc của đường hồi quy.
D. Giá trị chặn của đường hồi quy.
10. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên (giữ các yếu tố khác không đổi)?
A. Độ rộng khoảng tin cậy tăng lên.
B. Độ rộng khoảng tin cậy giảm xuống.
C. Độ rộng khoảng tin cậy không thay đổi.
D. Không thể xác định được.
11. Nếu tung một đồng xu công bằng 3 lần, xác suất để có đúng 2 mặt ngửa là bao nhiêu?
A. $1/8$
B. $1/3$
C. $3/8$
D. $1/2$
12. Công thức nào sau đây biểu diễn khoảng tin cậy cho trung bình tổng thể khi độ lệch chuẩn tổng thể đã biết?
A. $\bar{x} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$
B. $\bar{x} \pm t_{\alpha/2, n-1} \frac{s}{\sqrt{n}}$
C. $\bar{x} \pm z_{\alpha/2} \frac{s}{\sqrt{n}}$
D. $\bar{x} \pm t_{\alpha/2, n-1} \frac{\sigma}{\sqrt{n}}$
13. Giá trị trung vị (median) của một tập dữ liệu là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm ở giữa tập dữ liệu sau khi đã sắp xếp.
D. Tổng của tất cả các giá trị trong tập dữ liệu.
14. Điều gì xảy ra với sai số chuẩn của trung bình khi kích thước mẫu tăng lên?
A. Sai số chuẩn tăng lên.
B. Sai số chuẩn giảm xuống.
C. Sai số chuẩn không thay đổi.
D. Không thể xác định được.
15. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn.
B. Khi độ lệch chuẩn tổng thể đã biết.
C. Khi độ lệch chuẩn tổng thể chưa biết và kích thước mẫu nhỏ.
D. Khi dữ liệu không tuân theo phân phối chuẩn.
16. Trong hồi quy tuyến tính, sai số chuẩn của các hệ số hồi quy đo lường điều gì?
A. Phương sai của biến phụ thuộc.
B. Độ lệch chuẩn của biến độc lập.
C. Độ chính xác của các ước lượng hệ số hồi quy.
D. Mức độ phù hợp của mô hình hồi quy.
17. Trong phân phối chuẩn, khoảng 95% dữ liệu nằm trong khoảng bao nhiêu độ lệch chuẩn so với giá trị trung bình?
A. 1 độ lệch chuẩn
B. 1.96 độ lệch chuẩn
C. 2.58 độ lệch chuẩn
D. 3 độ lệch chuẩn
18. Chọn phát biểu đúng về phân phối nhị thức.
A. Mỗi phép thử độc lập có nhiều hơn hai kết quả.
B. Số lượng phép thử không cố định.
C. Các phép thử không độc lập với nhau.
D. Mỗi phép thử độc lập chỉ có hai kết quả có thể xảy ra.
19. Trong kiểm định giả thuyết, lỗi loại I xảy ra khi nào?
A. Bác bỏ giả thuyết $H_0$ khi nó đúng.
B. Chấp nhận giả thuyết $H_0$ khi nó sai.
C. Không đưa ra quyết định.
D. Luôn luôn đúng.
20. Khi nào thì giá trị trung bình, trung vị và mode bằng nhau?
A. Khi phân phối lệch trái.
B. Khi phân phối lệch phải.
C. Khi phân phối đối xứng.
D. Khi dữ liệu là số nguyên.
21. Độ tin cậy (confidence level) trong thống kê là gì?
A. Xác suất một kết quả là đúng.
B. Tỷ lệ mẫu có chứa tham số tổng thể.
C. Xác suất khoảng tin cậy chứa tham số tổng thể.
D. Xác suất bác bỏ giả thuyết null.
22. Trong phân tích hồi quy, một biến nhiễu là gì?
A. Một biến không liên quan đến biến phụ thuộc.
B. Một biến bị bỏ qua có ảnh hưởng đến cả biến độc lập và biến phụ thuộc.
C. Một biến chỉ ảnh hưởng đến biến độc lập.
D. Một biến chỉ ảnh hưởng đến biến phụ thuộc.
23. Sự khác biệt chính giữa thống kê mô tả và thống kê suy luận là gì?
A. Thống kê mô tả sử dụng số, thống kê suy luận sử dụng chữ.
B. Thống kê mô tả tóm tắt dữ liệu, thống kê suy luận đưa ra kết luận về tổng thể dựa trên mẫu.
C. Thống kê mô tả sử dụng mẫu, thống kê suy luận sử dụng tổng thể.
D. Thống kê mô tả khó hơn thống kê suy luận.
24. Điều gì xảy ra với mức ý nghĩa ($\alpha$) khi bạn giảm nguy cơ mắc lỗi loại II ($\beta$)?
A. $\alpha$ tăng lên.
B. $\alpha$ giảm xuống.
C. $\alpha$ không thay đổi.
D. Không thể xác định được.
25. Khi nào thì trung bình mẫu ($\bar{x}$) là một ước lượng không chệch của trung bình tổng thể ($\mu$)?
A. Luôn luôn.
B. Khi kích thước mẫu lớn.
C. Khi mẫu được chọn ngẫu nhiên.
D. Khi độ lệch chuẩn tổng thể đã biết.
26. Công thức nào sau đây dùng để tính hiệp phương sai giữa hai biến ngẫu nhiên $X$ và $Y$?
A. $Cov(X,Y) = E[(X - E[X])(Y - E[Y])]$
B. $Cov(X,Y) = E[XY] - E[X]E[Y]$
C. Cả hai công thức trên đều đúng.
D. Không công thức nào đúng.
27. Công thức nào sau đây là công thức tính kỳ vọng của biến ngẫu nhiên rời rạc $X$?
A. $E(X) = \sum x^2 P(X=x)$
B. $E(X) = \int x f(x) dx$
C. $E(X) = \sum x P(X=x)$
D. $E(X) = \frac{1}{n} \sum x_i$
28. Khi nào nên sử dụng kiểm định Chi bình phương?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để kiểm tra sự phù hợp của dữ liệu với một phân phối lý thuyết.
C. Để đo lường mối tương quan giữa hai biến liên tục.
D. Để ước tính trung bình của một tổng thể.
29. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. So sánh phương sai của hai mẫu.
B. So sánh trung bình của hai mẫu.
C. So sánh trung bình của nhiều hơn hai nhóm.
D. Đo lường mối tương quan giữa hai biến.
30. Cho hai biến ngẫu nhiên độc lập $X$ và $Y$. Khi đó, $Var(X+Y)$ bằng:
A. $Var(X) + Var(Y) + 2Cov(X,Y)$
B. $Var(X) + Var(Y) - 2Cov(X,Y)$
C. $Var(X) + Var(Y)$
D. $Var(X) - Var(Y)$