1. Phương pháp đánh giá mô hình học máy nào chia dữ liệu thành k phần, huấn luyện trên k-1 phần và kiểm tra trên phần còn lại, lặp lại k lần?
A. Hold-out validation
B. Cross-validation
C. Bootstrap
D. Leave-one-out validation
2. Phương pháp nào sau đây được sử dụng để giải quyết bài toán phân loại?
A. Linear Regression
B. K-means Clustering
C. Support Vector Machine (SVM)
D. Principal Component Analysis (PCA)
3. Trong học máy, phương pháp nào thường được sử dụng để giảm số lượng chiều dữ liệu trong khi vẫn giữ lại thông tin quan trọng nhất?
A. Regularization
B. Principal Component Analysis (PCA)
C. Cross-validation
D. Gradient Descent
4. Sự khác biệt chính giữa `supervised learning` và `unsupervised learning` là gì?
A. Supervised learning sử dụng dữ liệu đã được gán nhãn, trong khi unsupervised learning sử dụng dữ liệu chưa được gán nhãn.
B. Supervised learning chỉ được sử dụng cho các bài toán phân loại, trong khi unsupervised learning chỉ được sử dụng cho các bài toán hồi quy.
C. Supervised learning nhanh hơn unsupervised learning.
D. Không có sự khác biệt giữa hai phương pháp này.
5. Gradient Descent là gì trong học máy?
A. Một thuật toán để giảm số lượng chiều của dữ liệu.
B. Một phương pháp để tìm giá trị nhỏ nhất của hàm mất mát.
C. Một kỹ thuật để ngăn chặn overfitting.
D. Một thuật toán để phân cụm dữ liệu.
6. Trong mạng nơ-ron, `backpropagation` là gì?
A. Một thuật toán để giảm chiều dữ liệu.
B. Một phương pháp để lan truyền dữ liệu đầu vào qua mạng nơ-ron.
C. Một thuật toán để tính toán gradient của hàm mất mát và cập nhật trọng số của mạng.
D. Một kỹ thuật để ngăn chặn overfitting.
7. Trong học máy, `precision` và `recall` là gì?
A. Hai phương pháp để giảm chiều dữ liệu.
B. Hai độ đo hiệu suất thường được sử dụng trong bài toán phân loại.
C. Hai kỹ thuật để ngăn chặn overfitting.
D. Hai thuật toán để phân cụm dữ liệu.
8. Kỹ thuật nào sau đây giúp ngăn chặn hiện tượng overfitting trong mô hình học máy?
A. Feature Engineering
B. Regularization
C. Data Augmentation
D. Ensemble Learning
9. Trong học máy, `early stopping` là gì?
A. Một phương pháp để dừng quá trình huấn luyện khi mô hình đạt được độ chính xác hoàn hảo.
B. Một kỹ thuật để dừng quá trình huấn luyện khi hiệu suất của mô hình trên tập kiểm tra không còn cải thiện nữa.
C. Một phương pháp để dừng quá trình tiền xử lý dữ liệu.
D. Một kỹ thuật để dừng quá trình đánh giá mô hình.
10. Kỹ thuật nào sau đây được sử dụng để cải thiện hiệu suất của mô hình bằng cách tạo ra các phiên bản mới của dữ liệu huấn luyện?
A. Feature scaling
B. Data augmentation
C. Regularization
D. Dimensionality reduction
11. Khi nào thì nên sử dụng `L1 regularization` thay vì `L2 regularization`?
A. Khi cần một mô hình có độ chính xác cao trên dữ liệu huấn luyện.
B. Khi muốn giảm số lượng đặc trưng bằng cách loại bỏ các đặc trưng ít quan trọng.
C. Khi cần một mô hình đơn giản và dễ giải thích.
D. Khi dữ liệu có ít đặc trưng.
12. Trong học máy không giám sát, thuật toán nào thường được sử dụng để phân nhóm dữ liệu thành các cụm?
A. Linear Regression
B. K-means Clustering
C. Decision Tree
D. Support Vector Machine
13. Trong học máy, mục đích của việc sử dụng hàm sigmoid là gì?
A. Để biến đổi giá trị đầu vào thành một giá trị nằm trong khoảng từ 0 đến 1.
B. Để tăng tốc độ huấn luyện của mô hình.
C. Để giảm chiều dữ liệu.
D. Để ngăn chặn overfitting.
14. Trong học máy, `bias` và `variance` đề cập đến điều gì?
A. Hai phương pháp để giảm chiều dữ liệu.
B. Hai loại sai số khác nhau mà mô hình có thể mắc phải.
C. Hai kỹ thuật để ngăn chặn overfitting.
D. Hai thuật toán để phân cụm dữ liệu.
15. Trong học máy, `recall` đặc biệt quan trọng trong trường hợp nào?
A. Khi chi phí của false positive rất cao.
B. Khi chi phí của false negative rất cao.
C. Khi cần độ chính xác cao.
D. Khi cần một mô hình đơn giản.
16. Trong học máy, mục đích của việc sử dụng `cross-entropy` làm hàm mất mát là gì?
A. Đo lường sự khác biệt giữa hai phân phối xác suất.
B. Đo lường khoảng cách giữa hai điểm dữ liệu.
C. Giảm chiều dữ liệu.
D. Ngăn chặn overfitting.
17. Khi nào thì nên sử dụng `Random Forest` thay vì `Decision Tree`?
A. Khi cần một mô hình đơn giản và dễ giải thích.
B. Khi dữ liệu có nhiều chiều và có nguy cơ overfitting.
C. Khi cần một mô hình có độ chính xác cao trên dữ liệu huấn luyện.
D. Khi dữ liệu có ít đặc trưng.
18. Trong học máy, `ROC curve` và `AUC` được sử dụng để làm gì?
A. Đánh giá hiệu suất của mô hình phân loại nhị phân.
B. Đo lường sự khác biệt giữa hai phân phối xác suất.
C. Giảm chiều dữ liệu.
D. Ngăn chặn overfitting.
19. Trong học máy, `GAN` là viết tắt của cụm từ nào?
A. General Adjective Networks
B. Generative Adversarial Networks
C. Global Adaptive Networks
D. Gradient Ascent Networks
20. Sự khác biệt chính giữa `batch gradient descent` và `stochastic gradient descent` là gì?
A. Batch gradient descent sử dụng toàn bộ tập dữ liệu để tính toán gradient trong mỗi lần cập nhật, trong khi stochastic gradient descent sử dụng một mẫu duy nhất.
B. Batch gradient descent chỉ được sử dụng cho các bài toán hồi quy, trong khi stochastic gradient descent chỉ được sử dụng cho các bài toán phân loại.
C. Batch gradient descent nhanh hơn stochastic gradient descent.
D. Không có sự khác biệt giữa hai phương pháp này.
21. Mục tiêu chính của việc sử dụng `ensemble methods` trong học máy là gì?
A. Tăng tốc độ huấn luyện mô hình.
B. Giảm độ phức tạp của mô hình.
C. Cải thiện độ chính xác và độ ổn định của mô hình.
D. Đơn giản hóa quá trình tiền xử lý dữ liệu.
22. Hàm mất mát (loss function) trong học máy được sử dụng để làm gì?
A. Đánh giá hiệu suất của mô hình trên dữ liệu mới.
B. Đo lường sự khác biệt giữa dự đoán của mô hình và giá trị thực tế.
C. Điều chỉnh các siêu tham số của mô hình.
D. Chuẩn hóa dữ liệu đầu vào.
23. Trong ngữ cảnh của mạng nơ-ron, hàm kích hoạt (activation function) có vai trò gì?
A. Tính toán sai số giữa giá trị dự đoán và giá trị thực tế.
B. Quyết định xem một nơ-ron có nên được kích hoạt hay không dựa trên đầu vào của nó.
C. Điều chỉnh trọng số của các kết nối giữa các nơ-ron.
D. Chuẩn hóa dữ liệu đầu vào cho mạng nơ-ron.
24. Trong học máy, `transfer learning` là gì?
A. Một phương pháp để chuyển đổi dữ liệu từ định dạng này sang định dạng khác.
B. Một kỹ thuật để sử dụng kiến thức đã học được từ một bài toán để giải quyết một bài toán khác.
C. Một phương pháp để chuyển giao dữ liệu giữa các máy tính.
D. Một kỹ thuật để chuyển đổi mô hình từ supervised learning sang unsupervised learning.
25. Trong học máy, thuật ngữ `label encoding` và `one-hot encoding` đề cập đến điều gì?
A. Hai phương pháp để giảm chiều dữ liệu.
B. Hai kỹ thuật để mã hóa các biến phân loại.
C. Hai phương pháp để chuẩn hóa dữ liệu.
D. Hai thuật toán để phân cụm dữ liệu.
26. Trong học máy, thuật ngữ `feature engineering` đề cập đến điều gì?
A. Quá trình lựa chọn thuật toán học máy phù hợp nhất cho một bài toán.
B. Quá trình tạo ra các đặc trưng (features) mới từ dữ liệu hiện có để cải thiện hiệu suất của mô hình.
C. Quá trình tối ưu hóa các siêu tham số của mô hình.
D. Quá trình thu thập dữ liệu từ nhiều nguồn khác nhau.
27. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu bị thiếu (missing data)?
A. Feature scaling
B. Imputation
C. Regularization
D. Dimensionality reduction
28. Thuật toán nào sau đây thường được sử dụng để tìm các quy luật kết hợp (association rules) trong dữ liệu?
A. Linear Regression
B. K-means Clustering
C. Apriori algorithm
D. Support Vector Machine (SVM)
29. Khi nào thì nên sử dụng `Naive Bayes`?
A. Khi cần một mô hình có độ chính xác cao trên dữ liệu huấn luyện.
B. Khi cần một mô hình đơn giản, nhanh chóng và dễ triển khai.
C. Khi dữ liệu có nhiều chiều và có nguy cơ overfitting.
D. Khi cần một mô hình có khả năng xử lý dữ liệu phi tuyến tính.
30. Thuật toán nào sau đây thuộc loại học máy có giám sát?
A. K-means clustering
B. Principal Component Analysis (PCA)
C. Linear Regression
D. Apriori algorithm