Đề 7 – Đề thi, câu hỏi trắc nghiệm online Học máy

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Học máy

Đề 7 - Đề thi, câu hỏi trắc nghiệm online Học máy

1. Dropout là gì và nó được sử dụng để giải quyết vấn đề gì trong mạng nơ-ron?

A. Một lớp trong mạng nơ-ron được sử dụng để giảm số lượng tham số.
B. Một kỹ thuật regularization giúp ngăn chặn overfitting bằng cách loại bỏ ngẫu nhiên các nơ-ron trong quá trình huấn luyện.
C. Một phương pháp để tăng tốc độ huấn luyện của mạng.
D. Một hàm kích hoạt được sử dụng để giới thiệu tính phi tuyến.

2. Hàm mất mát (loss function) trong học máy được sử dụng để làm gì?

A. Đánh giá hiệu suất của mô hình trên dữ liệu mới.
B. Đo lường sự khác biệt giữa dự đoán của mô hình và giá trị thực tế.
C. Chọn các đặc trưng quan trọng nhất trong dữ liệu.
D. Tăng tốc quá trình huấn luyện mô hình.

3. Trong học máy, `curse of dimensionality` (lời nguyền chiều) đề cập đến vấn đề gì?

A. Sự gia tăng độ phức tạp tính toán và yêu cầu dữ liệu khi số lượng đặc trưng tăng lên.
B. Việc khó khăn trong việc tìm các tham số tối ưu cho mô hình.
C. Hiện tượng overfitting trên dữ liệu huấn luyện.
D. Sự giảm độ chính xác của mô hình khi số lượng dữ liệu tăng lên.

4. Trong cây quyết định (decision tree), tiêu chí Gini impurity được sử dụng để làm gì?

A. Đo lường mức độ thuần khiết của một nút.
B. Xác định độ sâu tối đa của cây.
C. Tính toán độ quan trọng của các đặc trưng.
D. Ngăn chặn overfitting.

5. Khi nào nên sử dụng thuật toán Random Forest thay vì Decision Tree?

A. Khi cần một mô hình dễ diễn giải và không quan tâm đến độ chính xác.
B. Khi muốn giảm overfitting và cải thiện độ chính xác trên dữ liệu mới.
C. Khi dữ liệu có ít đặc trưng và số lượng mẫu nhỏ.
D. Khi cần huấn luyện mô hình nhanh chóng với độ chính xác chấp nhận được.

6. ROC (Receiver Operating Characteristic) curve được sử dụng để đánh giá hiệu suất của mô hình nào?

A. Mô hình hồi quy (regression models).
B. Mô hình phân loại (classification models).
C. Mô hình phân cụm (clustering models).
D. Mô hình giảm chiều (dimensionality reduction models).

7. Mục đích chính của việc sử dụng regularizaton (L1 hoặc L2) trong các mô hình học máy là gì?

A. Tăng độ chính xác của mô hình trên dữ liệu huấn luyện.
B. Giảm độ phức tạp của mô hình và ngăn chặn overfitting.
C. Tăng tốc độ huấn luyện mô hình.
D. Cải thiện khả năng diễn giải của mô hình.

8. Trong học máy, kỹ thuật nào thường được sử dụng để giảm số lượng chiều của dữ liệu trong khi vẫn giữ lại thông tin quan trọng?

A. Chuẩn hóa dữ liệu (Data normalization)
B. Phân tích thành phần chính (Principal Component Analysis - PCA)
C. Tăng cường dữ liệu (Data augmentation)
D. Xáo trộn dữ liệu (Data shuffling)

9. Gradient descent là gì và nó được sử dụng như thế nào trong huấn luyện mô hình học máy?

A. Một thuật toán để tìm giá trị nhỏ nhất của hàm mất mát bằng cách di chuyển theo hướng ngược lại với gradient.
B. Một phương pháp để tăng tốc độ huấn luyện mô hình.
C. Một kỹ thuật để chuẩn hóa dữ liệu đầu vào.
D. Một thuật toán để chọn các đặc trưng quan trọng nhất.

10. Autoencoder là gì và nó được sử dụng để làm gì?

A. Một loại mạng nơ-ron dùng để mã hóa dữ liệu đầu vào thành một biểu diễn nén và sau đó giải mã lại.
B. Một thuật toán để tự động chọn các đặc trưng quan trọng nhất.
C. Một phương pháp để tự động điều chỉnh các tham số của mô hình.
D. Một công cụ để tự động tạo ra dữ liệu huấn luyện mới.

11. Hiện tượng `overfitting` xảy ra khi nào?

A. Mô hình học quá tốt trên dữ liệu huấn luyện và kém hiệu quả trên dữ liệu mới.
B. Mô hình không đủ phức tạp để học được các mẫu trong dữ liệu.
C. Dữ liệu huấn luyện chứa quá nhiều nhiễu.
D. Tốc độ học (learning rate) được đặt quá cao.

12. Recurrent Neural Networks (RNNs) phù hợp nhất cho loại dữ liệu nào?

A. Dữ liệu ảnh tĩnh.
B. Dữ liệu dạng bảng.
C. Dữ liệu chuỗi thời gian hoặc dữ liệu có tính tuần tự.
D. Dữ liệu không có cấu trúc.

13. Trong học máy không giám sát, thuật toán nào được sử dụng để phân nhóm dữ liệu thành các cụm dựa trên sự tương đồng?

A. Linear Regression
B. K-Nearest Neighbors (KNN)
C. K-means clustering
D. Support Vector Machines (SVM)

14. Precision và Recall là gì, và chúng đo lường điều gì?

A. Precision đo lường tỷ lệ dự đoán đúng trên tổng số dự đoán, trong khi Recall đo lường tỷ lệ dự đoán đúng trên tổng số thực tế là đúng.
B. Precision đo lường tỷ lệ dự đoán sai trên tổng số dự đoán, trong khi Recall đo lường tỷ lệ dự đoán sai trên tổng số thực tế là sai.
C. Precision và Recall là hai tên gọi khác nhau của cùng một độ đo.
D. Precision đo lường độ chính xác của mô hình trên dữ liệu huấn luyện, trong khi Recall đo lường độ chính xác trên dữ liệu kiểm tra.

15. Trong ngữ cảnh của mạng nơ-ron (neural networks), hàm kích hoạt (activation function) có vai trò gì?

A. Tính toán độ chính xác của mô hình.
B. Giới thiệu tính phi tuyến vào mạng.
C. Giảm số lượng tham số trong mạng.
D. Chuẩn hóa dữ liệu đầu vào.

16. Phương pháp nào sau đây thuộc về học tăng cường (Reinforcement Learning)?

A. K-means clustering
B. Support Vector Machines (SVM)
C. Q-learning
D. Linear Regression

17. Độ đo F1-score là gì và nó được tính như thế nào?

A. Trung bình cộng của precision và recall.
B. Trung bình điều hòa của precision và recall.
C. Tỷ lệ giữa true positives và false negatives.
D. Tỷ lệ giữa true negatives và false positives.

18. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu bị thiếu (missing data)?

A. Sử dụng thuật toán K-Nearest Neighbors (KNN) để dự đoán các giá trị bị thiếu.
B. Loại bỏ tất cả các đặc trưng chứa giá trị bị thiếu.
C. Thay thế các giá trị bị thiếu bằng giá trị trung bình hoặc trung vị của cột.
D. Cả A và C đều đúng.

19. Trong học sâu (deep learning), kiến trúc mạng nơ-ron nào thường được sử dụng cho các tác vụ xử lý ảnh?

A. Recurrent Neural Networks (RNNs)
B. Convolutional Neural Networks (CNNs)
C. Generative Adversarial Networks (GANs)
D. Autoencoders

20. Khi nào thì nên sử dụng Naive Bayes Classifier?

A. Khi các đặc trưng có mối tương quan mạnh mẽ với nhau.
B. Khi dữ liệu có số lượng lớn các đặc trưng liên tục.
C. Khi giả định về tính độc lập giữa các đặc trưng gần đúng với thực tế.
D. Khi cần một mô hình phức tạp để nắm bắt các mối quan hệ phi tuyến tính.

21. Word embeddings (ví dụ: Word2Vec, GloVe) được sử dụng để làm gì trong xử lý ngôn ngữ tự nhiên (NLP)?

A. Chuyển đổi văn bản thành giọng nói.
B. Biểu diễn từ ngữ dưới dạng các vector số học.
C. Phân tích cú pháp của câu.
D. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.

22. Mục tiêu của Feature Engineering trong học máy là gì?

A. Tự động lựa chọn các thuật toán học máy phù hợp nhất.
B. Cải thiện hiệu suất của mô hình bằng cách tạo ra các đặc trưng mới hoặc biến đổi các đặc trưng hiện có.
C. Giảm kích thước của tập dữ liệu.
D. Tăng tốc độ huấn luyện của mô hình.

23. Tại sao cần chuẩn hóa (normalize) dữ liệu trước khi huấn luyện mô hình học máy?

A. Để tất cả các đặc trưng có cùng đơn vị đo lường.
B. Để tăng tốc độ huấn luyện của các thuật toán dựa trên gradient và cải thiện hiệu suất của các thuật toán dựa trên khoảng cách.
C. Để giảm số lượng đặc trưng trong dữ liệu.
D. Để loại bỏ các giá trị ngoại lệ (outliers) trong dữ liệu.

24. GAN (Generative Adversarial Network) bao gồm những thành phần nào?

A. Generator và Discriminator.
B. Encoder và Decoder.
C. Actor và Critic.
D. Input và Output layers.

25. Ensemble learning là gì và tại sao nó thường hiệu quả hơn so với việc sử dụng một mô hình duy nhất?

A. Ensemble learning kết hợp dự đoán của nhiều mô hình khác nhau để cải thiện độ chính xác và độ ổn định.
B. Ensemble learning chỉ đơn giản là huấn luyện một mô hình lớn hơn trên nhiều dữ liệu hơn.
C. Ensemble learning là một kỹ thuật để giảm số lượng tham số trong mô hình.
D. Ensemble learning chỉ hiệu quả khi các mô hình thành phần đều có độ chính xác cao.

26. Bagging và Boosting là gì, và chúng khác nhau như thế nào?

A. Bagging tạo nhiều mô hình song song từ các mẫu dữ liệu khác nhau, trong khi Boosting tạo mô hình tuần tự, tập trung vào các mẫu bị phân loại sai.
B. Bagging tạo một mô hình duy nhất từ toàn bộ dữ liệu, trong khi Boosting tạo nhiều mô hình nhỏ.
C. Bagging sử dụng phương pháp lấy mẫu không thay thế, trong khi Boosting sử dụng phương pháp lấy mẫu có thay thế.
D. Bagging và Boosting là hai tên gọi khác nhau của cùng một phương pháp.

27. Transfer learning là gì và tại sao nó hữu ích?

A. Việc sử dụng kiến thức học được từ một tác vụ để cải thiện hiệu suất trên một tác vụ khác liên quan.
B. Việc chuyển dữ liệu từ một định dạng sang một định dạng khác.
C. Việc chuyển mô hình từ một ngôn ngữ lập trình sang một ngôn ngữ lập trình khác.
D. Việc chuyển dữ liệu từ một máy tính sang một máy tính khác.

28. Backpropagation là gì và nó được sử dụng như thế nào trong mạng nơ-ron?

A. Một phương pháp để tính toán đạo hàm của hàm mất mát theo các trọng số của mạng.
B. Một kỹ thuật để tăng cường dữ liệu huấn luyện.
C. Một thuật toán để giảm số lượng nơ-ron trong mạng.
D. Một phương pháp để trực quan hóa cấu trúc của mạng.

29. Mục đích của việc sử dụng Batch Normalization trong mạng nơ-ron là gì?

A. Để tăng cường dữ liệu huấn luyện.
B. Để giảm hiện tượng vanishing gradient và cho phép sử dụng learning rate cao hơn.
C. Để giảm số lượng tham số trong mạng.
D. Để trực quan hóa các lớp trung gian của mạng.

30. Cross-validation (kiểm định chéo) được sử dụng để làm gì?

A. Đánh giá hiệu suất của mô hình trên dữ liệu chưa thấy và chọn mô hình tốt nhất.
B. Tăng kích thước của dữ liệu huấn luyện.
C. Giảm số lượng đặc trưng trong dữ liệu.
D. Tìm các tham số tối ưu cho mô hình.

1 / 30

Category: Học máy

Tags: Bộ đề 8

1. Dropout là gì và nó được sử dụng để giải quyết vấn đề gì trong mạng nơ-ron?

2 / 30

Category: Học máy

Tags: Bộ đề 8

2. Hàm mất mát (loss function) trong học máy được sử dụng để làm gì?

3 / 30

Category: Học máy

Tags: Bộ đề 8

3. Trong học máy, 'curse of dimensionality' (lời nguyền chiều) đề cập đến vấn đề gì?

4 / 30

Category: Học máy

Tags: Bộ đề 8

4. Trong cây quyết định (decision tree), tiêu chí Gini impurity được sử dụng để làm gì?

5 / 30

Category: Học máy

Tags: Bộ đề 8

5. Khi nào nên sử dụng thuật toán Random Forest thay vì Decision Tree?

6 / 30

Category: Học máy

Tags: Bộ đề 8

6. ROC (Receiver Operating Characteristic) curve được sử dụng để đánh giá hiệu suất của mô hình nào?

7 / 30

Category: Học máy

Tags: Bộ đề 8

7. Mục đích chính của việc sử dụng regularizaton (L1 hoặc L2) trong các mô hình học máy là gì?

8 / 30

Category: Học máy

Tags: Bộ đề 8

8. Trong học máy, kỹ thuật nào thường được sử dụng để giảm số lượng chiều của dữ liệu trong khi vẫn giữ lại thông tin quan trọng?

9 / 30

Category: Học máy

Tags: Bộ đề 8

9. Gradient descent là gì và nó được sử dụng như thế nào trong huấn luyện mô hình học máy?

10 / 30

Category: Học máy

Tags: Bộ đề 8

10. Autoencoder là gì và nó được sử dụng để làm gì?

11 / 30

Category: Học máy

Tags: Bộ đề 8

11. Hiện tượng 'overfitting' xảy ra khi nào?

12 / 30

Category: Học máy

Tags: Bộ đề 8

12. Recurrent Neural Networks (RNNs) phù hợp nhất cho loại dữ liệu nào?

13 / 30

Category: Học máy

Tags: Bộ đề 8

13. Trong học máy không giám sát, thuật toán nào được sử dụng để phân nhóm dữ liệu thành các cụm dựa trên sự tương đồng?

14 / 30

Category: Học máy

Tags: Bộ đề 8

14. Precision và Recall là gì, và chúng đo lường điều gì?

15 / 30

Category: Học máy

Tags: Bộ đề 8

15. Trong ngữ cảnh của mạng nơ-ron (neural networks), hàm kích hoạt (activation function) có vai trò gì?

16 / 30

Category: Học máy

Tags: Bộ đề 8

16. Phương pháp nào sau đây thuộc về học tăng cường (Reinforcement Learning)?

17 / 30

Category: Học máy

Tags: Bộ đề 8

17. Độ đo F1-score là gì và nó được tính như thế nào?

18 / 30

Category: Học máy

Tags: Bộ đề 8

18. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu bị thiếu (missing data)?

19 / 30

Category: Học máy

Tags: Bộ đề 8

19. Trong học sâu (deep learning), kiến trúc mạng nơ-ron nào thường được sử dụng cho các tác vụ xử lý ảnh?

20 / 30

Category: Học máy

Tags: Bộ đề 8

20. Khi nào thì nên sử dụng Naive Bayes Classifier?

21 / 30

Category: Học máy

Tags: Bộ đề 8

21. Word embeddings (ví dụ: Word2Vec, GloVe) được sử dụng để làm gì trong xử lý ngôn ngữ tự nhiên (NLP)?

22 / 30

Category: Học máy

Tags: Bộ đề 8

22. Mục tiêu của Feature Engineering trong học máy là gì?

23 / 30

Category: Học máy

Tags: Bộ đề 8

23. Tại sao cần chuẩn hóa (normalize) dữ liệu trước khi huấn luyện mô hình học máy?

24 / 30

Category: Học máy

Tags: Bộ đề 8

24. GAN (Generative Adversarial Network) bao gồm những thành phần nào?

25 / 30

Category: Học máy

Tags: Bộ đề 8

25. Ensemble learning là gì và tại sao nó thường hiệu quả hơn so với việc sử dụng một mô hình duy nhất?

26 / 30

Category: Học máy

Tags: Bộ đề 8

26. Bagging và Boosting là gì, và chúng khác nhau như thế nào?

27 / 30

Category: Học máy

Tags: Bộ đề 8

27. Transfer learning là gì và tại sao nó hữu ích?

28 / 30

Category: Học máy

Tags: Bộ đề 8

28. Backpropagation là gì và nó được sử dụng như thế nào trong mạng nơ-ron?

29 / 30

Category: Học máy

Tags: Bộ đề 8

29. Mục đích của việc sử dụng Batch Normalization trong mạng nơ-ron là gì?

30 / 30

Category: Học máy

Tags: Bộ đề 8

30. Cross-validation (kiểm định chéo) được sử dụng để làm gì?