Đề 1 – Đề thi, câu hỏi trắc nghiệm online Khai phá dữ liệu

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Khai phá dữ liệu

Đề 1 - Đề thi, câu hỏi trắc nghiệm online Khai phá dữ liệu

1. Trong khai phá dữ liệu, thuật ngữ `support` (độ hỗ trợ) trong khai phá luật kết hợp đề cập đến điều gì?

A. Độ chính xác của luật.
B. Tần suất xuất hiện của một tập hợp các mục trong tập dữ liệu.
C. Độ tin cậy của luật.
D. Mức độ quan trọng của luật.

2. Đâu là một thách thức chính trong việc khai phá dữ liệu từ các nguồn dữ liệu lớn (Big Data)?

A. Sự thiếu hụt các thuật toán khai phá dữ liệu.
B. Khả năng mở rộng của các thuật toán và cơ sở hạ tầng.
C. Chi phí thấp của việc lưu trữ dữ liệu.
D. Dễ dàng thu thập dữ liệu.

3. Trong khai phá dữ liệu, mục đích của việc `feature engineering` (thiết kế thuộc tính) là gì?

A. Để giảm số lượng thuộc tính trong tập dữ liệu.
B. Để tạo ra các thuộc tính mới từ các thuộc tính hiện có để cải thiện hiệu suất mô hình.
C. Để làm sạch dữ liệu bằng cách loại bỏ các giá trị thiếu.
D. Để chuyển đổi các thuộc tính liên tục thành các thuộc tính rời rạc.

4. Trong khai phá dữ liệu, thuật ngữ `curse of dimensionality` (lời nguyền chiều) đề cập đến vấn đề gì?

A. Sự khó khăn trong việc trực quan hóa dữ liệu.
B. Sự gia tăng đáng kể về độ phức tạp tính toán và yêu cầu dữ liệu khi số lượng thuộc tính tăng lên.
C. Sự thiếu hụt các thuật toán khai phá dữ liệu phù hợp.
D. Sự khó khăn trong việc thu thập dữ liệu.

5. Trong khai phá dữ liệu, mục đích của việc sử dụng `cross-validation` (kiểm định chéo) là gì?

A. Để làm sạch dữ liệu.
B. Để giảm số lượng thuộc tính trong tập dữ liệu.
C. Để đánh giá hiệu suất của mô hình một cách khách quan và ổn định hơn.
D. Để tăng kích thước của tập dữ liệu.

6. Kỹ thuật nào trong khai phá dữ liệu được sử dụng để chia một tập dữ liệu thành các nhóm (cluster) dựa trên sự tương đồng giữa các đối tượng?

A. Phân loại (Classification)
B. Hồi quy (Regression)
C. Phân cụm (Clustering)
D. Dự đoán (Prediction)

7. Trong khai phá dữ liệu, `outlier detection` (phát hiện ngoại lệ) được sử dụng để làm gì?

A. Tìm kiếm các mối quan hệ giữa các biến số.
B. Xác định các đối tượng khác biệt đáng kể so với phần lớn dữ liệu.
C. Phân nhóm các đối tượng dựa trên sự tương đồng.
D. Dự đoán giá trị của một biến số liên tục.

8. Thuật ngữ nào mô tả quá trình biến đổi dữ liệu thô thành một định dạng phù hợp để phân tích trong khai phá dữ liệu?

A. Trực quan hóa dữ liệu
B. Làm sạch dữ liệu
C. Tiền xử lý dữ liệu
D. Mô hình hóa dữ liệu

9. Kỹ thuật nào trong khai phá dữ liệu được sử dụng để dự đoán giá trị của một biến số liên tục dựa trên các biến số khác?

A. Phân loại (Classification).
B. Hồi quy (Regression).
C. Phân cụm (Clustering).
D. Khai phá luật kết hợp (Association rule mining).

10. Trong khai phá dữ liệu, mục đích của việc `feature selection` (lựa chọn thuộc tính) là gì?

A. Tăng số lượng thuộc tính trong tập dữ liệu.
B. Chọn một tập hợp con các thuộc tính quan trọng nhất để sử dụng trong mô hình hóa.
C. Chuyển đổi các thuộc tính liên tục thành các thuộc tính rời rạc.
D. Làm sạch dữ liệu bằng cách loại bỏ các giá trị thiếu.

11. Kỹ thuật nào sau đây được sử dụng để giảm nhiễu trong dữ liệu trước khi khai phá?

A. Lấy mẫu dữ liệu.
B. Làm sạch dữ liệu.
C. Giảm chiều dữ liệu.
D. Rời rạc hóa dữ liệu.

12. Phương pháp nào sau đây được sử dụng để giảm số lượng bản ghi trong một tập dữ liệu lớn?

A. Lấy mẫu dữ liệu.
B. Chuẩn hóa dữ liệu.
C. Rời rạc hóa dữ liệu.
D. Mã hóa dữ liệu.

13. Đâu là một ví dụ về ứng dụng của khai phá dữ liệu trong lĩnh vực bán lẻ?

A. Dự đoán động đất.
B. Phân tích thành phần hóa học của đất.
C. Tối ưu hóa chiến dịch marketing.
D. Phát hiện các hành tinh mới.

14. Trong khai phá dữ liệu, thuật ngữ `confidence` (độ tin cậy) trong khai phá luật kết hợp đề cập đến điều gì?

A. Tần suất xuất hiện của một tập hợp các mục trong tập dữ liệu.
B. Xác suất mà một mục sẽ xuất hiện trong một giao dịch nếu một mục khác đã xuất hiện.
C. Độ chính xác của luật.
D. Mức độ quan trọng của luật.

15. Đâu là một thách thức trong việc khai phá dữ liệu từ dữ liệu văn bản?

A. Sự thiếu hụt dữ liệu văn bản.
B. Tính chất phi cấu trúc và mơ hồ của ngôn ngữ tự nhiên.
C. Chi phí cao của việc lưu trữ dữ liệu văn bản.
D. Khả năng mở rộng của các thuật toán khai phá dữ liệu.

16. Kỹ thuật nào sau đây được sử dụng để chuyển đổi các biến số liên tục thành các biến số rời rạc?

A. Chuẩn hóa dữ liệu.
B. Rời rạc hóa dữ liệu.
C. Giảm chiều dữ liệu.
D. Làm sạch dữ liệu.

17. Phương pháp nào sau đây được sử dụng để đánh giá hiệu quả của một mô hình phân cụm?

A. Độ chính xác (Accuracy).
B. Độ đo F1 (F1-score).
C. Chỉ số Silhouette (Silhouette coefficient).
D. Độ đo AUC (AUC score).

18. Phương pháp khai phá dữ liệu nào thường được sử dụng để tìm các mối quan hệ giữa các mục trong một tập dữ liệu, ví dụ như các sản phẩm thường được mua cùng nhau trong siêu thị?

A. Phân tích hồi quy
B. Phân tích tương quan
C. Phân tích chuỗi thời gian
D. Phân tích giỏ hàng (Market Basket Analysis)

19. Đâu là một ví dụ về ứng dụng của khai phá dữ liệu trong lĩnh vực tài chính?

A. Dự đoán thời tiết.
B. Phân tích cảm xúc trên mạng xã hội.
C. Phát hiện gian lận thẻ tín dụng.
D. Tối ưu hóa lộ trình giao thông.

20. Trong khai phá dữ liệu, kỹ thuật nào được sử dụng để giảm số lượng thuộc tính trong một tập dữ liệu trong khi vẫn giữ lại thông tin quan trọng?

A. Phân cụm (Clustering)
B. Giảm chiều (Dimensionality reduction)
C. Phân loại (Classification)
D. Hồi quy (Regression)

21. Trong ngữ cảnh của khai phá dữ liệu, `overfitting` (quá khớp) xảy ra khi nào?

A. Mô hình hoạt động kém trên dữ liệu huấn luyện.
B. Mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra.
C. Mô hình quá đơn giản để nắm bắt các mẫu trong dữ liệu.
D. Mô hình được huấn luyện quá nhanh.

22. Đâu là một ví dụ về ứng dụng của khai phá dữ liệu trong lĩnh vực giao thông vận tải?

A. Dự đoán giá nhà.
B. Phân tích tâm lý người dùng.
C. Tối ưu hóa lộ trình giao thông.
D. Phát hiện gian lận bảo hiểm.

23. Trong khai phá dữ liệu, mục đích của việc `data integration` (tích hợp dữ liệu) là gì?

A. Để làm sạch dữ liệu.
B. Để kết hợp dữ liệu từ nhiều nguồn khác nhau thành một tập dữ liệu thống nhất.
C. Để giảm số lượng thuộc tính trong tập dữ liệu.
D. Để chuyển đổi các thuộc tính liên tục thành các thuộc tính rời rạc.

24. Đâu là một ví dụ về ứng dụng của khai phá dữ liệu trong lĩnh vực y tế?

A. Dự đoán giá cổ phiếu.
B. Phát hiện gian lận thẻ tín dụng.
C. Xác định các yếu tố rủi ro bệnh tật.
D. Tối ưu hóa chuỗi cung ứng.

25. Trong khai phá dữ liệu, thuật ngữ `association rule mining` (khai phá luật kết hợp) đề cập đến điều gì?

A. Việc xây dựng mô hình dự đoán giá trị của một biến số liên tục.
B. Việc tìm kiếm các mối quan hệ giữa các biến số trong một tập dữ liệu.
C. Việc phân nhóm các đối tượng dựa trên sự tương đồng.
D. Việc giảm số lượng thuộc tính trong một tập dữ liệu.

26. Kỹ thuật nào được sử dụng để xử lý dữ liệu bị thiếu trong quá trình tiền xử lý dữ liệu?

A. Chuẩn hóa dữ liệu.
B. Rời rạc hóa dữ liệu.
C. Điền giá trị thiếu hoặc loại bỏ các bản ghi chứa giá trị thiếu.
D. Giảm chiều dữ liệu.

27. Phương pháp nào sau đây giúp đánh giá tầm quan trọng của các thuộc tính trong một mô hình phân loại?

A. Phân tích phương sai (ANOVA).
B. Phân tích thành phần chính (PCA).
C. Độ lợi thông tin (Information gain).
D. Phân tích hồi quy tuyến tính.

28. Kỹ thuật nào sau đây được sử dụng để xác định mối quan hệ giữa các biến số trong một tập dữ liệu?

A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Phân tích tương quan.
D. Phân tích thành phần chính (PCA).

29. Trong khai phá dữ liệu, kỹ thuật nào được sử dụng để tìm các chuỗi sự kiện xảy ra theo một thứ tự nhất định?

A. Phân tích hồi quy.
B. Phân tích chuỗi thời gian.
C. Phân tích luật kết hợp.
D. Phân tích phân cụm.

30. Trong khai phá dữ liệu, mục đích của việc sử dụng `holdout set` (tập giữ lại) là gì?

A. Huấn luyện mô hình.
B. Đánh giá hiệu suất của mô hình trên dữ liệu chưa thấy.
C. Chọn các thuộc tính quan trọng nhất.
D. Làm sạch dữ liệu.

1 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

1. Trong khai phá dữ liệu, thuật ngữ 'support' (độ hỗ trợ) trong khai phá luật kết hợp đề cập đến điều gì?

2 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

2. Đâu là một thách thức chính trong việc khai phá dữ liệu từ các nguồn dữ liệu lớn (Big Data)?

3 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

3. Trong khai phá dữ liệu, mục đích của việc 'feature engineering' (thiết kế thuộc tính) là gì?

4 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

4. Trong khai phá dữ liệu, thuật ngữ 'curse of dimensionality' (lời nguyền chiều) đề cập đến vấn đề gì?

5 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

5. Trong khai phá dữ liệu, mục đích của việc sử dụng 'cross-validation' (kiểm định chéo) là gì?

6 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

6. Kỹ thuật nào trong khai phá dữ liệu được sử dụng để chia một tập dữ liệu thành các nhóm (cluster) dựa trên sự tương đồng giữa các đối tượng?

7 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

7. Trong khai phá dữ liệu, 'outlier detection' (phát hiện ngoại lệ) được sử dụng để làm gì?

8 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

8. Thuật ngữ nào mô tả quá trình biến đổi dữ liệu thô thành một định dạng phù hợp để phân tích trong khai phá dữ liệu?

9 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

9. Kỹ thuật nào trong khai phá dữ liệu được sử dụng để dự đoán giá trị của một biến số liên tục dựa trên các biến số khác?

10 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

10. Trong khai phá dữ liệu, mục đích của việc 'feature selection' (lựa chọn thuộc tính) là gì?

11 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

11. Kỹ thuật nào sau đây được sử dụng để giảm nhiễu trong dữ liệu trước khi khai phá?

12 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

12. Phương pháp nào sau đây được sử dụng để giảm số lượng bản ghi trong một tập dữ liệu lớn?

13 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

13. Đâu là một ví dụ về ứng dụng của khai phá dữ liệu trong lĩnh vực bán lẻ?

14 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

14. Trong khai phá dữ liệu, thuật ngữ 'confidence' (độ tin cậy) trong khai phá luật kết hợp đề cập đến điều gì?

15 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

15. Đâu là một thách thức trong việc khai phá dữ liệu từ dữ liệu văn bản?

16 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

16. Kỹ thuật nào sau đây được sử dụng để chuyển đổi các biến số liên tục thành các biến số rời rạc?

17 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

17. Phương pháp nào sau đây được sử dụng để đánh giá hiệu quả của một mô hình phân cụm?

18 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

18. Phương pháp khai phá dữ liệu nào thường được sử dụng để tìm các mối quan hệ giữa các mục trong một tập dữ liệu, ví dụ như các sản phẩm thường được mua cùng nhau trong siêu thị?

19 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

19. Đâu là một ví dụ về ứng dụng của khai phá dữ liệu trong lĩnh vực tài chính?

20 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

20. Trong khai phá dữ liệu, kỹ thuật nào được sử dụng để giảm số lượng thuộc tính trong một tập dữ liệu trong khi vẫn giữ lại thông tin quan trọng?

21 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

21. Trong ngữ cảnh của khai phá dữ liệu, 'overfitting' (quá khớp) xảy ra khi nào?

22 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

22. Đâu là một ví dụ về ứng dụng của khai phá dữ liệu trong lĩnh vực giao thông vận tải?

23 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

23. Trong khai phá dữ liệu, mục đích của việc 'data integration' (tích hợp dữ liệu) là gì?

24 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

24. Đâu là một ví dụ về ứng dụng của khai phá dữ liệu trong lĩnh vực y tế?

25 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

25. Trong khai phá dữ liệu, thuật ngữ 'association rule mining' (khai phá luật kết hợp) đề cập đến điều gì?

26 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

26. Kỹ thuật nào được sử dụng để xử lý dữ liệu bị thiếu trong quá trình tiền xử lý dữ liệu?

27 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

27. Phương pháp nào sau đây giúp đánh giá tầm quan trọng của các thuộc tính trong một mô hình phân loại?

28 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

28. Kỹ thuật nào sau đây được sử dụng để xác định mối quan hệ giữa các biến số trong một tập dữ liệu?

29 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

29. Trong khai phá dữ liệu, kỹ thuật nào được sử dụng để tìm các chuỗi sự kiện xảy ra theo một thứ tự nhất định?

30 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 1

30. Trong khai phá dữ liệu, mục đích của việc sử dụng 'holdout set' (tập giữ lại) là gì?