1. Trong phân tích chuỗi thời gian, thành phần nào thể hiện xu hướng dài hạn của dữ liệu?
A. Tính mùa vụ (seasonality)
B. Tính chu kỳ (cyclicality)
C. Xu hướng (trend)
D. Tính ngẫu nhiên (randomness)
2. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng
B. Chấp nhận giả thuyết null khi nó thực sự sai
C. Không bác bỏ giả thuyết null khi nó thực sự đúng
D. Bác bỏ giả thuyết thay thế khi nó thực sự đúng
3. Hệ số tương quan (correlation coefficient) có giá trị nằm trong khoảng nào?
A. Từ 0 đến 1
B. Từ -1 đến 1
C. Từ -∞ đến +∞
D. Từ 0 đến ∞
4. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi cỡ mẫu lớn
C. Khi các giả định của kiểm định tham số không được đáp ứng
D. Khi muốn so sánh trung bình của hai nhóm
5. Trong phân tích hồi quy logistic, biến phụ thuộc có đặc điểm gì?
A. Là biến định lượng liên tục
B. Là biến định tính có hai giá trị (nhị phân)
C. Là biến định tính có nhiều hơn hai giá trị
D. Là biến thứ hạng
6. Trong phân tích chuỗi thời gian, phương pháp nào được sử dụng để làm mịn dữ liệu và loại bỏ nhiễu?
A. Phân tích hồi quy
B. Trung bình động (moving average)
C. Kiểm định Chi-bình phương
D. Phân tích phương sai
7. Mục đích chính của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Tăng độ chính xác của dữ liệu
B. Đưa dữ liệu về cùng một thang đo để so sánh và phân tích dễ dàng hơn
C. Giảm kích thước của dữ liệu
D. Loại bỏ các giá trị ngoại lệ
8. Sai số chuẩn (standard error) đo lường điều gì?
A. Độ lệch chuẩn của mẫu
B. Độ lệch chuẩn của quần thể
C. Độ lệch chuẩn của phân phối lấy mẫu của một thống kê
D. Sai số do đo lường không chính xác
9. Trong thống kê ứng dụng, `confidence interval` (khoảng tin cậy) cho biết điều gì?
A. Giá trị trung bình của mẫu
B. Một khoảng giá trị mà trong đó chúng ta tin rằng giá trị thực của tham số quần thể nằm trong đó với một mức độ tin cậy nhất định
C. Sai số chuẩn của ước lượng
D. Xác suất của việc giả thuyết null là đúng
10. Độ lệch chuẩn (standard deviation) đo lường điều gì trong một tập dữ liệu?
A. Giá trị trung bình của dữ liệu
B. Mức độ phân tán của dữ liệu so với giá trị trung bình
C. Giá trị lớn nhất trong dữ liệu
D. Giá trị nhỏ nhất trong dữ liệu
11. Khi nào nên sử dụng kiểm định Chi-bình phương (Chi-square test)?
A. Để so sánh trung bình của hai nhóm độc lập
B. Để kiểm tra sự phù hợp của dữ liệu với một phân phối lý thuyết
C. Để đo lường mối quan hệ giữa hai biến định lượng
D. Để ước lượng giá trị trung bình của một quần thể
12. Phân phối chuẩn (normal distribution) còn được gọi là gì?
A. Phân phối Poisson
B. Phân phối Bernoulli
C. Phân phối Gaussian
D. Phân phối nhị thức
13. Trong thống kê ứng dụng, `p-value` đại diện cho điều gì?
A. Xác suất của việc giả thuyết null là đúng
B. Xác suất quan sát được kết quả như hiện tại (hoặc cực đoan hơn) nếu giả thuyết null là đúng
C. Mức độ tin cậy của kết quả nghiên cứu
D. Sai số chuẩn của ước lượng
14. Trong phân tích hồi quy, hệ số xác định (R-squared) cho biết điều gì?
A. Độ mạnh của mối quan hệ giữa các biến
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập
C. Mức độ ý nghĩa thống kê của các biến độc lập
D. Hướng của mối quan hệ giữa các biến
15. Khi nào nên sử dụng kiểm định Mann-Whitney U test?
A. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn
B. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn
C. Để so sánh phương sai của hai nhóm độc lập
D. Để so sánh trung bình của ba nhóm trở lên
16. Trong phân tích độ tin cậy, hệ số Cronbach`s alpha đo lường điều gì?
A. Độ giá trị của thang đo
B. Độ tin cậy nội tại của thang đo
C. Độ ổn định của thang đo theo thời gian
D. Độ nhạy của thang đo
17. Trong thống kê ứng dụng, `bootstrap` là gì?
A. Một phương pháp kiểm định giả thuyết
B. Một kỹ thuật lấy mẫu lại từ dữ liệu hiện có để ước lượng phân phối lấy mẫu của một thống kê
C. Một phương pháp giảm chiều dữ liệu
D. Một kỹ thuật làm sạch dữ liệu
18. Phương pháp nào thường được sử dụng để dự báo giá trị trong tương lai dựa trên dữ liệu chuỗi thời gian?
A. Phân tích hồi quy tuyến tính
B. Mô hình ARIMA
C. Kiểm định t
D. Phân tích phương sai
19. Trong phân tích phương sai (ANOVA) hai yếu tố, điều gì được kiểm tra?
A. Ảnh hưởng của một yếu tố độc lập lên biến phụ thuộc
B. Ảnh hưởng của hai yếu tố độc lập lên biến phụ thuộc và tương tác giữa chúng
C. Mối quan hệ giữa hai biến định lượng
D. Sự khác biệt giữa hai nhóm
20. Trong thống kê ứng dụng, phương pháp nào được sử dụng để ước lượng giá trị của một biến phụ thuộc dựa trên giá trị của một hoặc nhiều biến độc lập?
A. Phân tích phương sai (ANOVA)
B. Phân tích hồi quy
C. Kiểm định giả thuyết
D. Thống kê mô tả
21. Khi nào nên sử dụng kiểm định t (t-test)?
A. Để so sánh trung bình của ba nhóm trở lên
B. Để so sánh trung bình của hai nhóm độc lập
C. Để kiểm tra sự phù hợp của dữ liệu với phân phối chuẩn
D. Để đo lường mối quan hệ giữa hai biến định tính
22. Trong phân tích phương sai (ANOVA), yếu tố nào được sử dụng để so sánh sự khác biệt giữa các nhóm?
A. Giá trị trung bình
B. Phương sai
C. Độ lệch chuẩn
D. Trung vị
23. Trong thống kê ứng dụng, chỉ số nào đo lường sự bất đối xứng của phân phối dữ liệu?
A. Độ lệch chuẩn
B. Phương sai
C. Độ xiên (skewness)
D. Độ nhọn (kurtosis)
24. Khi phân tích dữ liệu khảo sát, phương pháp nào thường được sử dụng để xác định các nhóm người có đặc điểm tương đồng?
A. Phân tích hồi quy
B. Phân tích cụm (cluster analysis)
C. Kiểm định t
D. Phân tích phương sai
25. Trong thống kê ứng dụng, thuật ngữ `outlier` dùng để chỉ điều gì?
A. Giá trị trung bình của tập dữ liệu
B. Giá trị lớn nhất trong tập dữ liệu
C. Một giá trị cực kỳ khác biệt so với các giá trị còn lại trong tập dữ liệu
D. Giá trị xuất hiện nhiều nhất trong tập dữ liệu
26. Khi phân tích dữ liệu định tính, phương pháp nào thường được sử dụng để mã hóa và phân loại các chủ đề chính?
A. Phân tích phương sai
B. Phân tích nội dung
C. Hồi quy tuyến tính
D. Phân tích chuỗi thời gian
27. Trong phân tích dữ liệu, kỹ thuật nào được sử dụng để giảm số lượng biến bằng cách tạo ra các biến mới là tổ hợp tuyến tính của các biến ban đầu?
A. Phân tích hồi quy
B. Phân tích phương sai
C. Phân tích thành phần chính (PCA)
D. Phân tích tương quan
28. Trong thống kê mô tả, đại lượng nào đo lường vị trí trung tâm của dữ liệu?
A. Độ lệch chuẩn
B. Phương sai
C. Giá trị trung bình
D. Phạm vi
29. Khi nào nên sử dụng phương pháp lấy mẫu phân tầng (stratified sampling)?
A. Khi muốn đảm bảo tính đại diện của các nhóm khác nhau trong quần thể
B. Khi không có thông tin về kích thước quần thể
C. Khi muốn tiết kiệm chi phí và thời gian thu thập dữ liệu
D. Khi muốn loại bỏ các yếu tố gây nhiễu trong quá trình thu thập dữ liệu
30. Độ nhọn (kurtosis) đo lường điều gì trong phân phối dữ liệu?
A. Sự bất đối xứng của phân phối
B. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình
C. Độ phân tán của dữ liệu
D. Giá trị lớn nhất và nhỏ nhất của dữ liệu