1. Phân phối Poisson được sử dụng để mô hình hóa điều gì?
A. Xác suất của các sự kiện liên tục.
B. Số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
C. Mối quan hệ giữa hai biến liên tục.
D. Tỷ lệ thành công trong một chuỗi các thử nghiệm độc lập.
2. Sai số chuẩn (Standard error) là gì?
A. Độ lệch chuẩn của mẫu.
B. Ước tính độ lệch chuẩn của phân phối lấy mẫu của một thống kê.
C. Sai số loại I.
D. Sai số loại II.
3. Độ tin cậy (Reliability) trong thống kê đo lường điều gì?
A. Mức độ mà một phương pháp đo lường đo lường những gì nó được cho là đo lường.
B. Sự nhất quán và ổn định của kết quả đo lường.
C. Khả năng suy rộng kết quả từ mẫu sang quần thể.
D. Mức độ mà kết quả có ý nghĩa thực tế.
4. Khi nào nên sử dụng kiểm định phi tham số (Non-parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc có kích thước mẫu nhỏ.
D. Khi muốn so sánh trung bình của hai nhóm.
5. Phân phối chuẩn (Normal distribution) có đặc điểm gì?
A. Dữ liệu tập trung ở hai đầu.
B. Hình dạng bất kỳ.
C. Đối xứng và có hình chuông.
D. Luôn luôn lệch phải.
6. Giá trị ngoại lệ (Outlier) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị nằm giữa của tập dữ liệu đã được sắp xếp.
C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
D. Giá trị cực kỳ khác biệt so với các giá trị khác trong tập dữ liệu.
7. Phân tích hồi quy được sử dụng để làm gì?
A. Đo lường mức độ phân tán của dữ liệu.
B. Ước lượng mối quan hệ giữa một biến phụ thuộc và một hoặc nhiều biến độc lập.
C. So sánh trung bình của hai hoặc nhiều nhóm.
D. Phân loại dữ liệu thành các nhóm khác nhau.
8. Giá trị trung vị (Median) là gì?
A. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
B. Giá trị trung bình của tập dữ liệu.
C. Giá trị nằm giữa của tập dữ liệu đã được sắp xếp.
D. Độ lệch chuẩn của tập dữ liệu.
9. Tần suất (Frequency) là gì?
A. Tổng số quan sát trong một tập dữ liệu.
B. Số lần một giá trị cụ thể xuất hiện trong một tập dữ liệu.
C. Giá trị trung bình của tập dữ liệu.
D. Độ lệch chuẩn của tập dữ liệu.
10. Chọn mẫu ngẫu nhiên (Random sampling) nhằm mục đích gì?
A. Đảm bảo mẫu có kích thước lớn nhất có thể.
B. Giảm chi phí thu thập dữ liệu.
C. Đảm bảo mẫu đại diện cho quần thể và giảm thiểu sai lệch.
D. Làm cho dữ liệu dễ phân tích hơn.
11. Độ lệch chuẩn (Standard deviation) là gì?
A. Căn bậc hai của phương sai.
B. Trung bình cộng của các giá trị.
C. Giá trị lớn nhất trừ giá trị nhỏ nhất.
D. Số trung vị của dữ liệu.
12. Đâu là giả định quan trọng của phân tích hồi quy tuyến tính?
A. Các biến độc lập phải có phân phối chuẩn.
B. Sai số phải có phương sai không đổi (homoscedasticity).
C. Biến phụ thuộc phải là biến định tính.
D. Không có mối tương quan giữa các biến độc lập.
13. Phân tích thời gian (Time series analysis) được sử dụng để làm gì?
A. Phân tích dữ liệu tại một thời điểm cố định.
B. Phân tích dữ liệu được thu thập theo thời gian để tìm ra xu hướng và mô hình.
C. Phân tích mối quan hệ giữa hai biến độc lập.
D. Phân tích dữ liệu không có thứ tự thời gian.
14. Mục đích của việc kiểm tra đa cộng tuyến (multicollinearity) trong phân tích hồi quy là gì?
A. Kiểm tra xem dữ liệu có tuân theo phân phối chuẩn hay không.
B. Kiểm tra xem có mối tương quan cao giữa các biến độc lập hay không.
C. Kiểm tra xem sai số có phương sai không đổi hay không.
D. Kiểm tra xem có giá trị ngoại lệ trong dữ liệu hay không.
15. Phương sai (Variance) đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Độ lệch chuẩn của tập dữ liệu.
C. Mức độ phân tán của dữ liệu so với giá trị trung bình.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong tập dữ liệu.
16. Thống kê nào sau đây nhạy cảm nhất với các giá trị ngoại lệ?
A. Trung bình (Mean).
B. Trung vị (Median).
C. Mốt (Mode).
D. Khoảng tứ phân vị (Interquartile range).
17. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên?
A. Độ rộng tăng lên.
B. Độ rộng giảm xuống.
C. Độ rộng không thay đổi.
D. Không thể xác định.
18. Mục đích của việc chuẩn hóa dữ liệu (Data normalization) là gì?
A. Loại bỏ các giá trị ngoại lệ.
B. Chuyển đổi dữ liệu về một thang đo chung để so sánh và phân tích dễ dàng hơn.
C. Thay đổi phân phối của dữ liệu thành phân phối chuẩn.
D. Tăng kích thước mẫu.
19. Khoảng tin cậy (Confidence interval) là gì?
A. Một giá trị duy nhất ước tính cho tham số quần thể.
B. Một khoảng giá trị mà ta tin rằng tham số quần thể nằm trong đó với một độ tin cậy nhất định.
C. Xác suất mà giả thuyết null là đúng.
D. Sai số chuẩn của trung bình.
20. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Mức ý nghĩa thống kê được chọn trước.
C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
D. Sai số loại II.
21. Trong phân tích thống kê, thuật ngữ `bậc tự do` (degrees of freedom) thường liên quan đến điều gì?
A. Số lượng biến trong một mô hình.
B. Số lượng quan sát trong một mẫu.
C. Số lượng thông tin độc lập có sẵn để ước tính một tham số.
D. Mức ý nghĩa thống kê.
22. Sai số loại I (Type I error) trong kiểm định giả thuyết là gì?
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Không bác bỏ giả thuyết null khi nó sai.
D. Bác bỏ giả thuyết null khi nó đúng.
23. Thống kê suy luận (Inferential statistics) được sử dụng để làm gì?
A. Mô tả các đặc điểm của mẫu.
B. Đưa ra kết luận về quần thể dựa trên thông tin từ mẫu.
C. Tính toán các giá trị trung bình và độ lệch chuẩn.
D. Sắp xếp dữ liệu theo thứ tự.
24. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. So sánh phương sai của hai mẫu.
B. So sánh trung bình của hai hay nhiều nhóm.
C. Đo lường mối quan hệ giữa hai biến.
D. Phân loại dữ liệu vào các nhóm.
25. Phân tích sống sót (Survival analysis) được sử dụng để làm gì?
A. Phân tích dữ liệu về thời gian cho đến khi một sự kiện xảy ra.
B. Phân tích dữ liệu về mối quan hệ giữa hai biến liên tục.
C. Phân tích dữ liệu về sự khác biệt giữa các nhóm.
D. Phân tích dữ liệu về phân phối chuẩn.
26. Hệ số tương quan (Correlation coefficient) đo lường điều gì?
A. Mức độ biến thiên của dữ liệu.
B. Sự phụ thuộc giữa hai biến định tính.
C. Mức độ tuyến tính của mối quan hệ giữa hai biến định lượng.
D. Giá trị trung bình của hai biến.
27. Trong kiểm định Chi-bình phương (Chi-square test), ta kiểm định điều gì?
A. Sự khác biệt giữa hai trung bình.
B. Sự độc lập giữa hai biến định tính.
C. Mối quan hệ tuyến tính giữa hai biến định lượng.
D. Phương sai của một quần thể.
28. Giá trị mốt (Mode) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm giữa của tập dữ liệu đã được sắp xếp.
D. Độ lệch chuẩn của tập dữ liệu.
29. Đâu là mục đích chính của việc sử dụng thống kê mô tả?
A. Đưa ra dự đoán về các quần thể lớn hơn dựa trên mẫu.
B. Tóm tắt và trình bày dữ liệu một cách có ý nghĩa.
C. Kiểm định các giả thuyết về mối quan hệ giữa các biến.
D. Xây dựng mô hình toán học để mô phỏng các hiện tượng phức tạp.
30. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi biết độ lệch chuẩn của quần thể.
C. Khi kích thước mẫu nhỏ (n < 30) và không biết độ lệch chuẩn của quần thể.
D. Khi dữ liệu tuân theo phân phối chuẩn.