Đề 1 – Đề thi, câu hỏi trắc nghiệm online Học máy

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Học máy

Đề 1 - Đề thi, câu hỏi trắc nghiệm online Học máy

1. Trong học máy, ROC curve (Receiver Operating Characteristic curve) được sử dụng để làm gì?

A. Để trực quan hóa dữ liệu đầu vào
B. Để đánh giá hiệu suất của mô hình phân loại nhị phân
C. Để chọn các đặc trưng quan trọng nhất
D. Để giảm số chiều của dữ liệu

2. Trong học máy, khi nào thì nên sử dụng thuật toán `Random Forest`?

A. Khi dữ liệu có mối quan hệ tuyến tính rõ ràng
B. Khi cần một mô hình đơn giản và dễ giải thích
C. Khi cần một mô hình có độ chính xác cao và có khả năng xử lý dữ liệu phức tạp
D. Khi dữ liệu có số lượng đặc trưng rất ít

3. Kỹ thuật nào được sử dụng để ngăn chặn overfitting bằng cách thêm một khoản phạt vào hàm mất mát (loss function) dựa trên độ lớn của các trọng số?

A. Gradient boosting
B. Regularization
C. Cross-validation
D. Data augmentation

4. Lợi ích chính của việc sử dụng minibatch trong thuật toán Gradient Descent là gì?

A. Đảm bảo hội tụ toàn cục.
B. Tăng tốc độ tính toán và giảm biến động trong quá trình hội tụ.
C. Loại bỏ nhu cầu về hàm kích hoạt.
D. Đơn giản hóa kiến trúc mô hình.

5. Phương pháp nào được sử dụng để tìm các quy luật kết hợp (association rules) giữa các mục trong một tập dữ liệu, ví dụ như các sản phẩm thường được mua cùng nhau trong siêu thị?

A. K-means clustering
B. Apriori algorithm
C. Principal component analysis
D. Linear regression

6. Trong ngữ cảnh của mạng nơ-ron, hàm kích hoạt (activation function) có vai trò gì?

A. Tính toán độ lỗi của mô hình
B. Giới thiệu tính phi tuyến vào mạng
C. Cập nhật trọng số của các kết nối
D. Chuẩn hóa dữ liệu đầu vào

7. Trong các thuật toán học máy, thuật toán nào phù hợp nhất khi dữ liệu có nhiều chiều và có mối quan hệ phi tuyến tính phức tạp?

A. Hồi quy tuyến tính (Linear Regression)
B. Máy vectơ hỗ trợ (Support Vector Machine) với kernel phi tuyến
C. Hồi quy Logistic (Logistic Regression)
D. Naive Bayes

8. Trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP), Word Embedding (Ví dụ: Word2Vec, GloVe) được sử dụng với mục đích gì?

A. Để mã hóa văn bản thành định dạng không thể đọc được.
B. Để biểu diễn các từ dưới dạng vector số, nắm bắt mối quan hệ ngữ nghĩa giữa chúng.
C. Để loại bỏ các từ dừng (stop words) khỏi văn bản.
D. Để dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.

9. Trong học máy, ma trận nhầm lẫn (confusion matrix) được sử dụng để làm gì?

A. Để trực quan hóa dữ liệu đầu vào
B. Để đánh giá hiệu suất của mô hình phân loại
C. Để chọn các đặc trưng quan trọng nhất
D. Để giảm số chiều của dữ liệu

10. Trong học máy không giám sát, thuật toán nào được sử dụng để phân nhóm dữ liệu thành các cụm dựa trên sự tương đồng giữa các điểm dữ liệu?

A. K-nearest neighbors (KNN)
B. Support vector machine (SVM)
C. K-means clustering
D. Linear regression

11. Trong học máy, thuật ngữ `one-hot encoding` được sử dụng để làm gì?

A. Để mã hóa các biến số liên tục thành các biến số rời rạc
B. Để mã hóa các biến số phân loại thành các vectơ nhị phân
C. Để giảm số chiều của dữ liệu
D. Để chuẩn hóa dữ liệu đầu vào

12. Trong Học máy tăng cường (Reinforcement Learning), thành phần nào chịu trách nhiệm quyết định hành động nào nên được thực hiện trong một trạng thái nhất định?

A. Môi trường (Environment)
B. Tác nhân (Agent)
C. Phần thưởng (Reward)
D. Chính sách (Policy)

13. Phương pháp nào kết hợp dự đoán từ nhiều mô hình học máy khác nhau để tạo ra một dự đoán cuối cùng tốt hơn?

A. Regularization
B. Ensemble learning
C. Normalization
D. Standardization

14. Trong học máy, thuật ngữ `gradient descent` (hạ gradient) được sử dụng để làm gì?

A. Để tìm giá trị lớn nhất của hàm mất mát
B. Để tìm giá trị nhỏ nhất của hàm mất mát
C. Để chuẩn hóa dữ liệu đầu vào
D. Để giảm số chiều của dữ liệu

15. Kỹ thuật nào sau đây được sử dụng để xử lý dữ liệu không cân bằng (imbalanced data) trong bài toán phân loại?

A. Principal Component Analysis (PCA).
B. K-Means Clustering.
C. Support Vector Machines (SVM).
D. Synthetic Minority Oversampling Technique (SMOTE).

16. Trong học máy, quá trình `feature scaling` (tỉ lệ hóa đặc trưng) nhằm mục đích gì?

A. Giảm số lượng đặc trưng trong dữ liệu
B. Đảm bảo rằng tất cả các đặc trưng có cùng một khoảng giá trị
C. Loại bỏ các đặc trưng không liên quan
D. Tăng độ phức tạp của mô hình

17. Trong học máy, thuật ngữ `bias` (độ chệch) đề cập đến điều gì?

A. Sai số ngẫu nhiên trong dữ liệu
B. Xu hướng của mô hình luôn dự đoán một giá trị nhất định
C. Khả năng mô hình khái quát hóa tốt trên dữ liệu mới
D. Mức độ phức tạp của mô hình

18. Khi nào thì nên sử dụng giải thuật Naive Bayes?

A. Khi các thuộc tính có sự tương quan cao.
B. Khi cần một mô hình phức tạp để nắm bắt các mối quan hệ phi tuyến.
C. Khi các thuộc tính độc lập với nhau và dữ liệu có dung lượng lớn.
D. Khi cần giảm số lượng chiều dữ liệu.

19. Phương pháp nào được sử dụng để tạo thêm dữ liệu huấn luyện bằng cách biến đổi dữ liệu hiện có (ví dụ: xoay ảnh, thêm nhiễu)?

A. Data augmentation
B. Feature selection
C. Dimensionality reduction
D. Model ensembling

20. Trong học máy, F1-score là gì?

A. Trung bình cộng của precision và recall
B. Trung bình nhân của precision và recall
C. Trung bình điều hòa của precision và recall
D. Độ lệch chuẩn của precision và recall

21. Trong học máy, `precision` (độ chính xác) được định nghĩa là gì?

A. Tỷ lệ các trường hợp dự đoán dương tính đúng trên tổng số trường hợp thực tế là dương tính
B. Tỷ lệ các trường hợp dự đoán dương tính đúng trên tổng số trường hợp được dự đoán là dương tính
C. Tỷ lệ các trường hợp dự đoán âm tính đúng trên tổng số trường hợp thực tế là âm tính
D. Tỷ lệ các trường hợp dự đoán đúng trên tổng số các trường hợp

22. Thuật ngữ nào mô tả việc mô hình học máy hoạt động tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới?

A. Underfitting
B. Overfitting
C. Regularization
D. Gradient Descent

23. Phương pháp đánh giá mô hình nào chia dữ liệu thành nhiều phần, huấn luyện mô hình trên một số phần và đánh giá trên phần còn lại, lặp lại quá trình này nhiều lần và lấy trung bình kết quả?

A. Regularization
B. Cross-validation
C. Gradient descent
D. Principal component analysis

24. Trong học máy, `recall` (độ phủ) được định nghĩa là gì?

A. Tỷ lệ các trường hợp dự đoán dương tính đúng trên tổng số trường hợp thực tế là dương tính
B. Tỷ lệ các trường hợp dự đoán dương tính đúng trên tổng số trường hợp được dự đoán là dương tính
C. Tỷ lệ các trường hợp dự đoán âm tính đúng trên tổng số trường hợp thực tế là âm tính
D. Tỷ lệ các trường hợp dự đoán đúng trên tổng số các trường hợp

25. Trong học máy, thuật ngữ `variance` (phương sai) đề cập đến điều gì?

A. Sai số ngẫu nhiên trong dữ liệu
B. Mức độ thay đổi của dự đoán mô hình khi dữ liệu huấn luyện thay đổi
C. Khả năng mô hình khái quát hóa tốt trên dữ liệu mới
D. Độ phức tạp của mô hình

26. Trong học máy, phương pháp nào thường được sử dụng để giảm số lượng chiều dữ liệu trong khi vẫn giữ lại phần lớn thông tin quan trọng?

A. Phân tích thành phần chính (PCA)
B. Hồi quy tuyến tính
C. Cây quyết định
D. K-means clustering

27. Trong học sâu, thuật ngữ `backpropagation` (lan truyền ngược) đề cập đến điều gì?

A. Quá trình lan truyền dữ liệu đầu vào qua mạng nơ-ron
B. Quá trình lan truyền lỗi ngược từ lớp đầu ra đến các lớp trước đó để cập nhật trọng số
C. Quá trình giảm số chiều của dữ liệu
D. Quá trình chuẩn hóa dữ liệu đầu vào

28. Trong học máy, thuật ngữ `transfer learning` (học chuyển giao) đề cập đến điều gì?

A. Quá trình chuyển dữ liệu từ một định dạng sang một định dạng khác
B. Quá trình sử dụng kiến thức đã học được từ một nhiệm vụ để giải quyết một nhiệm vụ khác
C. Quá trình giảm số chiều của dữ liệu
D. Quá trình chuẩn hóa dữ liệu đầu vào

29. Trong học sâu, kiến trúc mạng nơ-ron nào thường được sử dụng để xử lý dữ liệu chuỗi, ví dụ như văn bản hoặc chuỗi thời gian?

A. Convolutional neural network (CNN)
B. Recurrent neural network (RNN)
C. Deep belief network (DBN)
D. Generative adversarial network (GAN)

30. Thuật toán nào tìm đường đi ngắn nhất để đạt được mục tiêu trong một môi trường xác định bằng cách học thông qua thử và sai?

A. Q-learning
B. Linear Regression
C. Decision Tree
D. K-means

1 / 30

Category: Học máy

Tags: Bộ đề 1

1. Trong học máy, ROC curve (Receiver Operating Characteristic curve) được sử dụng để làm gì?

2 / 30

Category: Học máy

Tags: Bộ đề 1

2. Trong học máy, khi nào thì nên sử dụng thuật toán 'Random Forest'?

3 / 30

Category: Học máy

Tags: Bộ đề 1

3. Kỹ thuật nào được sử dụng để ngăn chặn overfitting bằng cách thêm một khoản phạt vào hàm mất mát (loss function) dựa trên độ lớn của các trọng số?

4 / 30

Category: Học máy

Tags: Bộ đề 1

4. Lợi ích chính của việc sử dụng minibatch trong thuật toán Gradient Descent là gì?

5 / 30

Category: Học máy

Tags: Bộ đề 1

5. Phương pháp nào được sử dụng để tìm các quy luật kết hợp (association rules) giữa các mục trong một tập dữ liệu, ví dụ như các sản phẩm thường được mua cùng nhau trong siêu thị?

6 / 30

Category: Học máy

Tags: Bộ đề 1

6. Trong ngữ cảnh của mạng nơ-ron, hàm kích hoạt (activation function) có vai trò gì?

7 / 30

Category: Học máy

Tags: Bộ đề 1

7. Trong các thuật toán học máy, thuật toán nào phù hợp nhất khi dữ liệu có nhiều chiều và có mối quan hệ phi tuyến tính phức tạp?

8 / 30

Category: Học máy

Tags: Bộ đề 1

8. Trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP), Word Embedding (Ví dụ: Word2Vec, GloVe) được sử dụng với mục đích gì?

9 / 30

Category: Học máy

Tags: Bộ đề 1

9. Trong học máy, ma trận nhầm lẫn (confusion matrix) được sử dụng để làm gì?

10 / 30

Category: Học máy

Tags: Bộ đề 1

10. Trong học máy không giám sát, thuật toán nào được sử dụng để phân nhóm dữ liệu thành các cụm dựa trên sự tương đồng giữa các điểm dữ liệu?

11 / 30

Category: Học máy

Tags: Bộ đề 1

11. Trong học máy, thuật ngữ 'one-hot encoding' được sử dụng để làm gì?

12 / 30

Category: Học máy

Tags: Bộ đề 1

12. Trong Học máy tăng cường (Reinforcement Learning), thành phần nào chịu trách nhiệm quyết định hành động nào nên được thực hiện trong một trạng thái nhất định?

13 / 30

Category: Học máy

Tags: Bộ đề 1

13. Phương pháp nào kết hợp dự đoán từ nhiều mô hình học máy khác nhau để tạo ra một dự đoán cuối cùng tốt hơn?

14 / 30

Category: Học máy

Tags: Bộ đề 1

14. Trong học máy, thuật ngữ 'gradient descent' (hạ gradient) được sử dụng để làm gì?

15 / 30

Category: Học máy

Tags: Bộ đề 1

15. Kỹ thuật nào sau đây được sử dụng để xử lý dữ liệu không cân bằng (imbalanced data) trong bài toán phân loại?

16 / 30

Category: Học máy

Tags: Bộ đề 1

16. Trong học máy, quá trình 'feature scaling' (tỉ lệ hóa đặc trưng) nhằm mục đích gì?

17 / 30

Category: Học máy

Tags: Bộ đề 1

17. Trong học máy, thuật ngữ 'bias' (độ chệch) đề cập đến điều gì?

18 / 30

Category: Học máy

Tags: Bộ đề 1

18. Khi nào thì nên sử dụng giải thuật Naive Bayes?

19 / 30

Category: Học máy

Tags: Bộ đề 1

19. Phương pháp nào được sử dụng để tạo thêm dữ liệu huấn luyện bằng cách biến đổi dữ liệu hiện có (ví dụ: xoay ảnh, thêm nhiễu)?

20 / 30

Category: Học máy

Tags: Bộ đề 1

20. Trong học máy, F1-score là gì?

21 / 30

Category: Học máy

Tags: Bộ đề 1

21. Trong học máy, 'precision' (độ chính xác) được định nghĩa là gì?

22 / 30

Category: Học máy

Tags: Bộ đề 1

22. Thuật ngữ nào mô tả việc mô hình học máy hoạt động tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới?

23 / 30

Category: Học máy

Tags: Bộ đề 1

23. Phương pháp đánh giá mô hình nào chia dữ liệu thành nhiều phần, huấn luyện mô hình trên một số phần và đánh giá trên phần còn lại, lặp lại quá trình này nhiều lần và lấy trung bình kết quả?

24 / 30

Category: Học máy

Tags: Bộ đề 1

24. Trong học máy, 'recall' (độ phủ) được định nghĩa là gì?

25 / 30

Category: Học máy

Tags: Bộ đề 1

25. Trong học máy, thuật ngữ 'variance' (phương sai) đề cập đến điều gì?

26 / 30

Category: Học máy

Tags: Bộ đề 1

26. Trong học máy, phương pháp nào thường được sử dụng để giảm số lượng chiều dữ liệu trong khi vẫn giữ lại phần lớn thông tin quan trọng?

27 / 30

Category: Học máy

Tags: Bộ đề 1

27. Trong học sâu, thuật ngữ 'backpropagation' (lan truyền ngược) đề cập đến điều gì?

28 / 30

Category: Học máy

Tags: Bộ đề 1

28. Trong học máy, thuật ngữ 'transfer learning' (học chuyển giao) đề cập đến điều gì?

29 / 30

Category: Học máy

Tags: Bộ đề 1

29. Trong học sâu, kiến trúc mạng nơ-ron nào thường được sử dụng để xử lý dữ liệu chuỗi, ví dụ như văn bản hoặc chuỗi thời gian?

30 / 30

Category: Học máy

Tags: Bộ đề 1

30. Thuật toán nào tìm đường đi ngắn nhất để đạt được mục tiêu trong một môi trường xác định bằng cách học thông qua thử và sai?