Đề 3 – Đề thi, câu hỏi trắc nghiệm online Thống kê ứng dụng

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Thống kê ứng dụng

Đề 3 - Đề thi, câu hỏi trắc nghiệm online Thống kê ứng dụng

1. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?

A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi cần tính toán giá trị trung bình.

2. Phương pháp nào sau đây được sử dụng để so sánh trung bình của ba nhóm trở lên?

A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi bình phương (Chi-square test).
D. Hồi quy tuyến tính (Linear regression).

3. Độ lệch chuẩn (standard deviation) đo lường điều gì?

A. Giá trị trung bình của một tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Mức độ tập trung của dữ liệu xung quanh giá trị trung vị.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong tập dữ liệu.

4. Phương pháp lấy mẫu ngẫu nhiên đơn giản (simple random sampling) là gì?

A. Chọn mẫu dựa trên sự thuận tiện.
B. Chia dân số thành các nhóm và chọn một số nhóm để lấy mẫu.
C. Mỗi thành viên của dân số có cơ hội được chọn vào mẫu như nhau.
D. Chọn mẫu theo một quy tắc nhất định.

5. Trong thiết kế thử nghiệm (design of experiments), `factor` (nhân tố) là gì?

A. Biến phụ thuộc cần được đo lường.
B. Biến độc lập được kiểm soát hoặc thay đổi trong thử nghiệm.
C. Một yếu tố ngẫu nhiên ảnh hưởng đến kết quả.
D. Một phương pháp phân tích dữ liệu.

6. Giá trị p (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?

A. Xác suất giả thuyết không là đúng.
B. Mức ý nghĩa thống kê được chọn trước.
C. Xác suất thu được kết quả quan sát được (hoặc kết quả cực đoan hơn) nếu giả thuyết không là đúng.
D. Kích thước của mẫu.

7. Hệ số Cronbach`s alpha được sử dụng để đánh giá điều gì?

A. Độ tin cậy của một kiểm định giả thuyết.
B. Độ giá trị của một công cụ đo lường.
C. Độ tin cậy nội tại (internal consistency) của một thang đo.
D. Độ ổn định của một thang đo theo thời gian.

8. Phân tích hồi quy logistic (logistic regression) được sử dụng khi nào?

A. Khi biến phụ thuộc là biến định lượng liên tục.
B. Khi biến phụ thuộc là biến định tính nhị phân (binary).
C. Khi biến phụ thuộc là biến định tính đa phân (multi-category).
D. Khi không có biến phụ thuộc.

9. Phân phối chuẩn (normal distribution) có những đặc điểm nào?

A. Bất đối xứng và có hai đỉnh.
B. Đối xứng, có một đỉnh và tuân theo quy tắc 68-95-99.7.
C. Phẳng và không có đỉnh.
D. Luôn nằm trên trục hoành.

10. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?

A. Độ lệch chuẩn của dân số.
B. Độ lệch chuẩn của mẫu.
C. Mức độ biến động của trung bình mẫu từ mẫu này sang mẫu khác.
D. Giá trị trung bình của các sai số.

11. Khi nào nên sử dụng kiểm định Kolmogorov-Smirnov?

A. Để so sánh trung bình của hai mẫu.
B. Để kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
C. Để so sánh phương sai của hai mẫu.
D. Để kiểm tra tính độc lập giữa hai biến định tính.

12. Kỹ thuật `cross-validation` (kiểm định chéo) được sử dụng để làm gì trong học máy (machine learning)?

A. Để tăng kích thước của tập dữ liệu huấn luyện.
B. Để ước lượng hiệu suất của mô hình trên dữ liệu chưa thấy.
C. Để đơn giản hóa mô hình.
D. Để trực quan hóa dữ liệu.

13. Kiểm định Chi bình phương (Chi-square test) thường được sử dụng để làm gì?

A. So sánh trung bình của hai nhóm.
B. Đánh giá mối quan hệ giữa hai biến định lượng.
C. Đánh giá sự phù hợp của một phân phối lý thuyết với dữ liệu thực tế.
D. Ước lượng hệ số hồi quy.

14. Trong kiểm định giả thuyết thống kê, sai lầm loại II (Type II error) xảy ra khi nào?

A. Bác bỏ giả thuyết không khi nó thực sự đúng.
B. Không bác bỏ giả thuyết không khi nó thực sự sai.
C. Bác bỏ giả thuyết không khi nó thực sự sai.
D. Không bác bỏ giả thuyết không khi nó thực sự đúng.

15. Ma trận tương quan (correlation matrix) hiển thị điều gì?

A. Hiệp phương sai giữa các biến.
B. Tương quan giữa tất cả các cặp biến trong một tập dữ liệu.
C. Giá trị trung bình của các biến.
D. Độ lệch chuẩn của các biến.

16. Trong phân tích hồi quy, hệ số R bình phương (R-squared) thể hiện điều gì?

A. Độ mạnh của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Sai số chuẩn của ước lượng.
D. Giá trị p của mô hình.

17. Trong phân tích chuỗi thời gian (time series analysis), thành phần xu hướng (trend) thể hiện điều gì?

A. Sự biến động ngẫu nhiên.
B. Sự biến động theo mùa.
C. Sự biến động dài hạn và ổn định.
D. Sự biến động theo chu kỳ kinh tế.

18. Trong phân tích tồn tại (survival analysis), hàm sống sót (survival function) thể hiện điều gì?

A. Xác suất một sự kiện xảy ra tại một thời điểm cụ thể.
B. Xác suất một sự kiện không xảy ra trước một thời điểm cụ thể.
C. Thời gian trung bình cho đến khi một sự kiện xảy ra.
D. Tỷ lệ các sự kiện xảy ra trong một khoảng thời gian nhất định.

19. Trong phân tích hồi quy tuyến tính, ý nghĩa của hệ số chặn (intercept) là gì?

A. Giá trị của biến độc lập khi biến phụ thuộc bằng 0.
B. Sự thay đổi trung bình của biến phụ thuộc khi biến độc lập tăng lên 1 đơn vị.
C. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
D. Sai số chuẩn của ước lượng.

20. Phương pháp Monte Carlo được sử dụng để làm gì?

A. Để tối ưu hóa hàm mục tiêu.
B. Để mô phỏng các hệ thống phức tạp bằng cách sử dụng các số ngẫu nhiên.
C. Để kiểm định giả thuyết về trung bình dân số.
D. Để phân tích phương sai.

21. Hệ số tương quan (correlation coefficient) Pearson đo lường điều gì?

A. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định tính.
B. Độ mạnh và hướng của mối quan hệ phi tuyến tính giữa hai biến định lượng.
C. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
D. Sự khác biệt giữa giá trị trung bình của hai biến.

22. Trong thống kê, `median` (trung vị) là gì?

A. Giá trị trung bình của một tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong một tập dữ liệu.
C. Giá trị nằm ở giữa của một tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.

23. Phương pháp `bootstrap` trong thống kê là gì?

A. Một phương pháp để ước lượng tham số dân số bằng cách lấy mẫu lặp lại từ dữ liệu mẫu ban đầu.
B. Một phương pháp để kiểm định giả thuyết về trung bình dân số.
C. Một phương pháp để loại bỏ các giá trị ngoại lệ.
D. Một phương pháp để tăng kích thước mẫu.

24. Phân tích cụm (cluster analysis) nhằm mục đích gì?

A. Dự đoán giá trị của một biến phụ thuộc.
B. Phân loại các đối tượng thành các nhóm dựa trên sự tương đồng của chúng.
C. Đánh giá mối quan hệ giữa hai biến.
D. Kiểm định giả thuyết về trung bình dân số.

25. Khi nào nên sử dụng kiểm định t ghép cặp (paired t-test)?

A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của hai mẫu có liên quan (ví dụ: trước và sau can thiệp).
C. Để so sánh phương sai của hai mẫu.
D. Để so sánh tỷ lệ của hai mẫu.

26. Trong phân tích dữ liệu, `outlier` (giá trị ngoại lệ) là gì?

A. Một giá trị xuất hiện thường xuyên nhất trong tập dữ liệu.
B. Một giá trị nằm gần giá trị trung bình.
C. Một giá trị khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Một giá trị bằng 0.

27. Trong phân tích dữ liệu lớn (big data), kỹ thuật `sampling` (lấy mẫu) được sử dụng để làm gì?

A. Tăng kích thước của tập dữ liệu.
B. Giảm kích thước của tập dữ liệu để phân tích hiệu quả hơn.
C. Loại bỏ các giá trị ngoại lệ.
D. Cải thiện chất lượng dữ liệu.

28. Biến số định tính (categorical variable) là gì?

A. Biến số có giá trị là số thực.
B. Biến số có giá trị là số nguyên.
C. Biến số có giá trị là các danh mục hoặc nhãn.
D. Biến số không thể đo lường được.

29. Phân tích phương sai hai yếu tố (two-way ANOVA) được sử dụng khi nào?

A. Khi có một biến độc lập và một biến phụ thuộc.
B. Khi có hai biến độc lập và một biến phụ thuộc.
C. Khi có một biến độc lập và hai biến phụ thuộc.
D. Khi có hai biến độc lập và hai biến phụ thuộc.

30. Khoảng tin cậy (confidence interval) là gì?

A. Một ước lượng điểm cho một tham số dân số.
B. Một phạm vi giá trị mà chúng ta tin rằng tham số dân số nằm trong đó với một mức độ tin cậy nhất định.
C. Một kiểm định giả thuyết về một tham số dân số.
D. Độ lệch chuẩn của mẫu.

1 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

1. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?

2 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

2. Phương pháp nào sau đây được sử dụng để so sánh trung bình của ba nhóm trở lên?

3 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

3. Độ lệch chuẩn (standard deviation) đo lường điều gì?

4 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

4. Phương pháp lấy mẫu ngẫu nhiên đơn giản (simple random sampling) là gì?

5 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

5. Trong thiết kế thử nghiệm (design of experiments), 'factor' (nhân tố) là gì?

6 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

6. Giá trị p (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?

7 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

7. Hệ số Cronbach's alpha được sử dụng để đánh giá điều gì?

8 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

8. Phân tích hồi quy logistic (logistic regression) được sử dụng khi nào?

9 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

9. Phân phối chuẩn (normal distribution) có những đặc điểm nào?

10 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

10. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?

11 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

11. Khi nào nên sử dụng kiểm định Kolmogorov-Smirnov?

12 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

12. Kỹ thuật 'cross-validation' (kiểm định chéo) được sử dụng để làm gì trong học máy (machine learning)?

13 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

13. Kiểm định Chi bình phương (Chi-square test) thường được sử dụng để làm gì?

14 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

14. Trong kiểm định giả thuyết thống kê, sai lầm loại II (Type II error) xảy ra khi nào?

15 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

15. Ma trận tương quan (correlation matrix) hiển thị điều gì?

16 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

16. Trong phân tích hồi quy, hệ số R bình phương (R-squared) thể hiện điều gì?

17 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

17. Trong phân tích chuỗi thời gian (time series analysis), thành phần xu hướng (trend) thể hiện điều gì?

18 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

18. Trong phân tích tồn tại (survival analysis), hàm sống sót (survival function) thể hiện điều gì?

19 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

19. Trong phân tích hồi quy tuyến tính, ý nghĩa của hệ số chặn (intercept) là gì?

20 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

20. Phương pháp Monte Carlo được sử dụng để làm gì?

21 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

21. Hệ số tương quan (correlation coefficient) Pearson đo lường điều gì?

22 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

22. Trong thống kê, 'median' (trung vị) là gì?

23 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

23. Phương pháp 'bootstrap' trong thống kê là gì?

24 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

24. Phân tích cụm (cluster analysis) nhằm mục đích gì?

25 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

25. Khi nào nên sử dụng kiểm định t ghép cặp (paired t-test)?

26 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

26. Trong phân tích dữ liệu, 'outlier' (giá trị ngoại lệ) là gì?

27 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

27. Trong phân tích dữ liệu lớn (big data), kỹ thuật 'sampling' (lấy mẫu) được sử dụng để làm gì?

28 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

28. Biến số định tính (categorical variable) là gì?

29 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

29. Phân tích phương sai hai yếu tố (two-way ANOVA) được sử dụng khi nào?

30 / 30

Category: Thống kê ứng dụng

Tags: Bộ đề 3

30. Khoảng tin cậy (confidence interval) là gì?