1. Độ lệch chuẩn của một mẫu được tính như thế nào?
A. Bình phương của phương sai.
B. Căn bậc hai của phương sai.
C. Trung bình của các giá trị tuyệt đối của độ lệch so với trung bình.
D. Tổng của các giá trị trong mẫu chia cho kích thước mẫu.
2. Khoảng tin cậy (Confidence Interval) cho biết điều gì?
A. Giá trị chính xác của tham số quần thể.
B. Một khoảng giá trị mà trong đó tham số quần thể có khả năng cao nằm trong đó.
C. Xác suất sai số loại I.
D. Kích thước mẫu cần thiết.
3. Phương pháp nào sau đây được sử dụng để xác định các nhóm khách hàng khác nhau dựa trên các đặc điểm chung của họ?
A. Hồi quy tuyến tính
B. Phân tích cụm (Cluster Analysis)
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi-bình phương
4. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được chọn là bao nhiêu?
A. 0.01
B. 0.05
C. 0.10
D. Bất kỳ giá trị nào tùy ý.
5. Trong phân tích rủi ro, giá trị kỳ vọng (Expected Value) được tính như thế nào?
A. Tổng của tất cả các kết quả có thể xảy ra.
B. Trung bình của các kết quả tốt nhất và xấu nhất.
C. Tổng của các kết quả có thể xảy ra nhân với xác suất tương ứng của chúng.
D. Kết quả có khả năng xảy ra cao nhất.
6. Trong thống kê mô tả, đại lượng nào cho biết giá trị nằm chính giữa của tập dữ liệu đã được sắp xếp?
A. Trung bình
B. Phương sai
C. Trung vị
D. Độ lệch chuẩn
7. Trong thống kê, bootstraping là gì?
A. Một phương pháp để ước lượng độ tin cậy bằng cách lấy mẫu lại từ dữ liệu gốc.
B. Một kỹ thuật để giảm kích thước mẫu.
C. Một phương pháp để kiểm tra tính chuẩn của dữ liệu.
D. Một loại biểu đồ thống kê.
8. Phương pháp nào sau đây được sử dụng để kiểm tra xem một mẫu dữ liệu có tuân theo một phân phối lý thuyết nhất định hay không?
A. Kiểm định t
B. Kiểm định Chi-bình phương goodness-of-fit
C. Hồi quy tuyến tính
D. Phân tích phương sai (ANOVA)
9. Trong phân tích thời gian, thành phần nào sau đây mô tả sự biến động ngắn hạn và không đều đặn của chuỗi thời gian?
A. Xu hướng (Trend)
B. Tính mùa vụ (Seasonality)
C. Tính chu kỳ (Cyclical)
D. Tính ngẫu nhiên (Irregularity)
10. Trong phân tích hồi quy logistic, biến phụ thuộc có đặc điểm gì?
A. Là biến định lượng liên tục.
B. Là biến định tính nhị phân (binary).
C. Là biến định tính đa phân (categorical).
D. Không có đặc điểm cụ thể.
11. Phương pháp nào sau đây được sử dụng để dự báo giá trị tương lai dựa trên dữ liệu quá khứ?
A. Hồi quy tuyến tính
B. Phân tích chuỗi thời gian (Time Series Analysis)
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi-bình phương
12. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả dữ liệu một cách trực quan.
B. Thu thập dữ liệu từ một mẫu.
C. Đưa ra kết luận về quần thể dựa trên thông tin từ mẫu.
D. Tính toán các thống kê mô tả.
13. Phương pháp nào sau đây thường được sử dụng để phân tích mối quan hệ giữa hai biến định lượng?
A. Kiểm định Chi-bình phương
B. Phân tích phương sai (ANOVA)
C. Hồi quy tuyến tính
D. Thống kê mô tả
14. Trong phân tích sống còn (Survival Analysis), hàm sống còn (Survival Function) thể hiện điều gì?
A. Xác suất một sự kiện xảy ra tại một thời điểm cụ thể.
B. Thời gian trung bình cho đến khi một sự kiện xảy ra.
C. Xác suất một đối tượng sống sót (không xảy ra sự kiện) sau một thời điểm nhất định.
D. Tỷ lệ đối tượng đã chết (đã xảy ra sự kiện) tại một thời điểm nhất định.
15. Trong kiểm định giả thuyết, sai lầm loại I xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó đúng.
B. Bác bỏ giả thuyết H0 khi nó sai.
C. Chấp nhận giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó đúng.
16. Đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu so với giá trị trung bình?
A. Trung vị
B. Giá trị lớn nhất
C. Độ lệch chuẩn
D. Tần số
17. Trong lý thuyết Bayes, định lý Bayes được sử dụng để làm gì?
A. Tính xác suất của một sự kiện.
B. Cập nhật xác suất của một giả thuyết dựa trên bằng chứng mới.
C. Kiểm định giả thuyết thống kê.
D. Ước lượng tham số của một quần thể.
18. Khi nào thì việc sử dụng biểu đồ hộp (boxplot) là phù hợp?
A. Để thể hiện mối quan hệ giữa hai biến định lượng.
B. Để so sánh phân phối của một biến giữa các nhóm khác nhau.
C. Để thể hiện xu hướng của dữ liệu theo thời gian.
D. Để thể hiện tỷ lệ phần trăm của các danh mục.
19. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại thông tin quan trọng nhất?
A. Hồi quy tuyến tính
B. Phân tích thành phần chính (Principal Component Analysis - PCA)
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi-bình phương
20. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lần xuất hiện của một sự kiện trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn
B. Phân phối nhị thức
C. Phân phối Poisson
D. Phân phối đều
21. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn (n > 30).
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi phương sai của quần thể đã biết.
22. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ giữa các biến.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Mức ý nghĩa của mô hình.
D. Sai số chuẩn của ước lượng.
23. Trong một phân phối chuẩn, khoảng bao nhiêu phần trăm dữ liệu nằm trong khoảng một độ lệch chuẩn so với giá trị trung bình?
A. 50%
B. 68%
C. 95%
D. 99.7%
24. Khi nào thì việc sử dụng trung vị (median) thích hợp hơn so với trung bình (mean) để đo lường xu hướng trung tâm?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi dữ liệu có các giá trị ngoại lệ (outliers).
C. Khi kích thước mẫu lớn (n > 30).
D. Khi cần tính toán nhanh chóng.
25. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Mức ý nghĩa của kiểm định.
C. Xác suất quan sát được kết quả như hiện tại (hoặc kết quả cực đoan hơn) nếu giả thuyết H0 là đúng.
D. Sai số loại II.
26. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai mẫu?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và phương sai của quần thể chưa biết.
D. Khi dữ liệu tuân theo phân phối chuẩn.
27. Sai số loại II (Type II error) trong kiểm định giả thuyết còn được gọi là gì?
A. Mức ý nghĩa.
B. Độ mạnh của kiểm định (Power).
C. Xác suất bác bỏ giả thuyết H0 khi nó đúng.
D. Xác suất chấp nhận giả thuyết H0 khi nó sai.
28. Phương pháp nào sau đây được sử dụng để đánh giá mối quan hệ giữa một biến định tính và một biến định lượng?
A. Kiểm định Chi-bình phương
B. Hồi quy tuyến tính
C. Phân tích phương sai (ANOVA)
D. Hệ số tương quan Pearson
29. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. So sánh phương sai của hai mẫu.
B. So sánh trung bình của hai hay nhiều nhóm.
C. Đo lường mối quan hệ giữa hai biến.
D. Ước lượng tham số của một quần thể.
30. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự khác biệt giữa trung bình của hai nhóm.
D. Mức độ phù hợp của mô hình hồi quy.