1. Trong học máy, thuật ngữ overfitting (quá khớp) mô tả hiện tượng nào?
A. Mô hình học tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu mới.
B. Mô hình học kém trên cả dữ liệu huấn luyện và dữ liệu mới.
C. Mô hình cần nhiều dữ liệu hơn để huấn luyện hiệu quả.
D. Mô hình có khả năng khái quát hóa tốt trên mọi loại dữ liệu.
2. Trong học máy, ensemble learning (học kết hợp) là kỹ thuật gì?
A. Kết hợp nhiều mô hình học máy yếu để tạo thành một mô hình mạnh hơn.
B. Xây dựng một mô hình duy nhất với nhiều lớp lồng nhau.
C. Chia nhỏ dữ liệu để huấn luyện trên nhiều máy.
D. Sử dụng một mô hình để dự đoán và mô hình khác để kiểm tra.
3. Thuật toán Support Vector Machine (SVM) tìm kiếm gì để phân tách dữ liệu trong bài toán phân loại?
A. Siêu phẳng (hyperplane) phân tách tối ưu với biên độ (margin) lớn nhất.
B. Đường thẳng đi qua tâm của các cụm dữ liệu.
C. Các điểm dữ liệu gần nhất với điểm mới.
D. Cây quyết định với các nhánh tối ưu.
4. Thuật toán Random Forest (Rừng ngẫu nhiên) là một tập hợp của nhiều thuật toán nào?
A. Cây quyết định (Decision Trees).
B. Máy học vector hỗ trợ (SVM).
C. Hồi quy tuyến tính (Linear Regression).
D. Mạng nơ-ron.
5. Đâu là mục tiêu chính của quá trình feature engineering trong học máy?
A. Chọn lọc, biến đổi và tạo ra các đặc trưng (features) phù hợp để cải thiện hiệu suất mô hình.
B. Giảm số lượng mẫu dữ liệu huấn luyện để tăng tốc độ đào tạo.
C. Xây dựng kiến trúc mạng nơ-ron sâu hơn cho các bài toán phức tạp.
D. Đánh giá hiệu suất của mô hình bằng các chỉ số thống kê.
6. Trong học máy, hyperparameter tuning (tinh chỉnh siêu tham số) là quá trình:
A. Tìm kiếm tập hợp các siêu tham số tốt nhất cho mô hình để tối ưu hóa hiệu suất trên dữ liệu chưa thấy.
B. Điều chỉnh các tham số của mô hình trong quá trình huấn luyện.
C. Lựa chọn thuật toán học máy phù hợp nhất cho bài toán.
D. Trích xuất các đặc trưng quan trọng từ dữ liệu.
7. Thuật toán Principal Component Analysis (PCA) chủ yếu được sử dụng cho mục đích gì?
A. Giảm chiều dữ liệu (dimensionality reduction) bằng cách tìm các thành phần chính có phương sai lớn nhất.
B. Phân loại dữ liệu vào các nhóm.
C. Dự đoán giá trị liên tục.
D. Xây dựng các hệ thống khuyến nghị.
8. Khái niệm regularization (chính quy hóa) trong học máy thường được sử dụng để:
A. Ngăn chặn hiện tượng quá khớp (overfitting) bằng cách thêm một hình phạt vào hàm mất mát.
B. Tăng tốc độ hội tụ của thuật toán huấn luyện.
C. Cải thiện khả năng diễn giải của mô hình.
D. Giảm yêu cầu về bộ nhớ của mô hình.
9. Khi sử dụng thuật toán K-Nearest Neighbors (KNN), tham số k đại diện cho điều gì?
A. Số lượng hàng xóm gần nhất được xem xét để đưa ra dự đoán.
B. Khoảng cách tối đa cho phép giữa các điểm dữ liệu.
C. Số lượng cụm cần phân chia dữ liệu.
D. Trọng số của mỗi đặc trưng trong tính toán khoảng cách.
10. Thuật toán nào thường được sử dụng để phân loại văn bản hoặc hình ảnh?
A. Máy học vector hỗ trợ (Support Vector Machine - SVM).
B. Thuật toán K-Means.
C. Phân tích thành phần chính (Principal Component Analysis - PCA).
D. Mạng nơ-ron hồi quy (Recurrent Neural Network - RNN) trong các tác vụ tuần tự.
11. Trong học có giám sát, loại bài toán nào liên quan đến việc dự đoán một giá trị liên tục (ví dụ: giá nhà, nhiệt độ)?
A. Hồi quy (Regression).
B. Phân loại (Classification).
C. Phân cụm (Clustering).
D. Giảm chiều dữ liệu (Dimensionality Reduction).
12. Trong các mạng nơ-ron, activation function (hàm kích hoạt) có vai trò gì?
A. Giới thiệu tính phi tuyến vào mô hình, cho phép học các mối quan hệ phức tạp.
B. Chuẩn hóa đầu vào của các lớp trước khi đưa vào lớp tiếp theo.
C. Tính toán trọng số giữa các nơ-ron trong cùng một lớp.
D. Loại bỏ các đặc trưng không liên quan khỏi dữ liệu đầu vào.
13. Khi gặp vấn đề underfitting (dưới khớp) trong học máy, giải pháp nào sau đây thường KHÔNG hiệu quả?
A. Tăng cường chính quy hóa (regularization).
B. Giảm số lượng đặc trưng (features).
C. Tăng độ phức tạp của mô hình (ví dụ: thêm nhiều lớp/nơ-ron).
D. Huấn luyện mô hình trong thời gian dài hơn.
14. Khái niệm bias-variance tradeoff trong học máy đề cập đến sự cân bằng giữa:
A. Sai số do giả định sai của mô hình (bias) và sai số do độ nhạy cảm với biến động dữ liệu huấn luyện (variance).
B. Hiệu suất trên dữ liệu huấn luyện và hiệu suất trên dữ liệu kiểm tra.
C. Thời gian huấn luyện và thời gian dự đoán của mô hình.
D. Độ phức tạp của mô hình và số lượng tham số.
15. Thuật toán K-Means thuộc loại hình học máy nào?
A. Học không giám sát (Unsupervised Learning).
B. Học có giám sát (Supervised Learning).
C. Học tăng cường (Reinforcement Learning).
D. Học bán giám sát (Semi-supervised Learning).
16. Thuật toán Decision Tree (Cây quyết định) hoạt động dựa trên nguyên tắc nào?
A. Chia tách dữ liệu dựa trên các câu hỏi về đặc trưng để tạo ra các nhánh quyết định.
B. Tìm kiếm các điểm dữ liệu gần nhất trong không gian đặc trưng.
C. Tạo ra một siêu phẳng để phân tách các lớp dữ liệu.
D. Huấn luyện mô hình bằng cách lan truyền ngược sai số qua mạng.
17. Trong học máy, cross-validation (kiểm định chéo) có vai trò gì?
A. Đánh giá độ tin cậy và khả năng tổng quát hóa của mô hình bằng cách chia dữ liệu thành nhiều phần và huấn luyện/kiểm tra nhiều lần.
B. Tăng tốc độ huấn luyện mô hình bằng cách sử dụng song song.
C. Loại bỏ các đặc trưng không liên quan.
D. Tìm kiếm các siêu tham số tối ưu.
18. Trong học tăng cường (Reinforcement Learning), agent (tác nhân) là gì?
A. Thực thể học cách ra quyết định bằng cách tương tác với môi trường để tối đa hóa phần thưởng.
B. Môi trường mà tác nhân tương tác.
C. Phần thưởng mà tác nhân nhận được khi thực hiện hành động.
D. Trạng thái hiện tại của môi trường.
19. Thuật toán Naive Bayes dựa trên định lý nào của xác suất?
A. Định lý Bayes.
B. Định lý Central Limit Theorem.
C. Định lý Markov.
D. Định lý Chebyshev.
20. Khi đánh giá một mô hình học máy, chỉ số precision (độ chính xác) đo lường điều gì?
A. Tỷ lệ các dự đoán đúng lớp dương trên tổng số các dự đoán là lớp dương.
B. Tỷ lệ các trường hợp dương tính thực sự được mô hình phát hiện đúng.
C. Tỷ lệ các dự đoán đúng trên tổng số các dự đoán.
D. Khả năng mô hình phân biệt giữa các lớp khác nhau.
21. Thuật toán Gradient Descent được sử dụng để làm gì trong học máy?
A. Tìm kiếm các tham số (trọng số) của mô hình sao cho hàm mất mát (loss function) đạt giá trị cực tiểu.
B. Giảm số chiều của dữ liệu đầu vào.
C. Phân cụm dữ liệu thành các nhóm.
D. Đánh giá độ chính xác của mô hình trên tập dữ liệu kiểm tra.
22. Chỉ số recall (độ phủ) trong đánh giá mô hình phân loại đo lường:
A. Tỷ lệ các trường hợp dương tính thực sự được mô hình phát hiện đúng trên tổng số các trường hợp dương tính thực sự.
B. Tỷ lệ các dự đoán đúng lớp dương trên tổng số các dự đoán là lớp dương.
C. Tỷ lệ các dự đoán đúng trên tổng số các dự đoán.
D. Khả năng mô hình phân biệt giữa các lớp khác nhau.
23. Trong xử lý ngôn ngữ tự nhiên (NLP), thuật toán Word Embeddings (nhúng từ) có chức năng gì?
A. Biểu diễn các từ dưới dạng các vector số học, nắm bắt ngữ nghĩa và mối quan hệ giữa các từ.
B. Mã hóa văn bản thành các chuỗi ký tự không đổi.
C. Xây dựng cây cú pháp cho câu.
D. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.
24. Thuật toán học máy nào phù hợp nhất để xử lý các chuỗi dữ liệu tuần tự, ví dụ như dự đoán từ tiếp theo trong một câu?
A. Mạng nơ-ron hồi quy (Recurrent Neural Network - RNN).
B. Máy học vector hỗ trợ (SVM).
C. Cây quyết định (Decision Tree).
D. K-Means.
25. Đâu là một ví dụ về data leakage (rò rỉ dữ liệu) trong quy trình xây dựng mô hình học máy?
A. Sử dụng thông tin từ tập dữ liệu kiểm tra (test set) để lựa chọn mô hình hoặc tinh chỉnh siêu tham số.
B. Áp dụng chuẩn hóa (normalization) cho tất cả các đặc trưng trước khi huấn luyện.
C. Tách biệt dữ liệu huấn luyện và dữ liệu kiểm tra một cách ngẫu nhiên.
D. Huấn luyện mô hình trên một tập dữ liệu lớn và đa dạng.