Đề 10 – Đề thi, câu hỏi trắc nghiệm online Học máy

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Học máy

Đề 10 - Đề thi, câu hỏi trắc nghiệm online Học máy

1. Trong học máy, `precision` và `recall` là gì?

A. Hai phương pháp tiền xử lý dữ liệu.
B. Hai độ đo đánh giá hiệu suất của mô hình phân loại.
C. Hai thuật toán để giảm chiều dữ liệu.
D. Hai kỹ thuật để tránh overfitting.

2. Trong học máy, thuật ngữ `regularization` thường được sử dụng để chỉ điều gì?

A. Một phương pháp để làm sạch dữ liệu.
B. Một kỹ thuật để giảm overfitting.
C. Một thuật toán để tìm kiếm các tham số tối ưu.
D. Một cách để tăng tốc độ huấn luyện.

3. Trong học máy, `one-hot encoding` được sử dụng để làm gì?

A. Chuẩn hóa dữ liệu số.
B. Chuyển đổi dữ liệu hạng mục (categorical data) thành dạng số.
C. Giảm chiều dữ liệu.
D. Tăng cường dữ liệu.

4. Trong học máy, mục đích chính của việc sử dụng `batch normalization` trong mạng nơ-ron là gì?

A. Giảm số lượng tham số trong mạng.
B. Tăng tốc độ huấn luyện và cải thiện độ ổn định của quá trình huấn luyện.
C. Giảm overfitting.
D. Tăng độ chính xác trên dữ liệu huấn luyện.

5. Trong lĩnh vực học tăng cường (Reinforcement Learning), thành phần nào chịu trách nhiệm quyết định hành động nào nên được thực hiện trong một trạng thái nhất định?

A. Environment
B. Agent
C. Reward function
D. State

6. Ưu điểm chính của việc sử dụng cây quyết định (decision tree) trong học máy là gì?

A. Khả năng xử lý dữ liệu phi tuyến tính tốt hơn so với các mô hình tuyến tính.
B. Dễ dàng giải thích và trực quan hóa.
C. Luôn cho kết quả chính xác cao.
D. Không yêu cầu tiền xử lý dữ liệu.

7. Trong học máy, mục đích của việc sử dụng `dropout` trong mạng nơ-ron là gì?

A. Tăng tốc độ huấn luyện.
B. Giảm overfitting.
C. Tăng độ chính xác trên dữ liệu huấn luyện.
D. Giảm số lượng tham số trong mạng.

8. Trong học máy, `ROC curve` được sử dụng để làm gì?

A. Đánh giá hiệu suất của mô hình hồi quy.
B. Đánh giá hiệu suất của mô hình phân cụm.
C. Đánh giá hiệu suất của mô hình phân loại ở các ngưỡng khác nhau.
D. Đánh giá hiệu suất của mô hình giảm chiều dữ liệu.

9. Sự khác biệt chính giữa học có giám sát (supervised learning) và học không giám sát (unsupervised learning) là gì?

A. Học có giám sát sử dụng dữ liệu có nhãn, trong khi học không giám sát sử dụng dữ liệu không có nhãn.
B. Học có giám sát luôn cho kết quả chính xác hơn học không giám sát.
C. Học không giám sát yêu cầu nhiều tài nguyên tính toán hơn học có giám sát.
D. Học có giám sát chỉ có thể được sử dụng cho các bài toán phân loại.

10. Trong học máy, kỹ thuật nào sau đây thường được sử dụng để xử lý dữ liệu bị thiếu (missing data)?

A. One-hot encoding
B. Imputation
C. Principal Component Analysis (PCA)
D. Regularization

11. Mô hình học máy nào sau đây thường được sử dụng cho các bài toán phân loại (classification)?

A. K-means clustering
B. Hồi quy tuyến tính (Linear Regression)
C. Máy vector hỗ trợ (Support Vector Machine - SVM)
D. Phân tích thành phần chính (PCA)

12. Trong học máy, `recall` đo lường điều gì?

A. Tỷ lệ các trường hợp dự đoán đúng trên tổng số các trường hợp dự đoán.
B. Tỷ lệ các trường hợp dự đoán đúng là dương tính trên tổng số các trường hợp thực tế là dương tính.
C. Tỷ lệ các trường hợp dự đoán sai trên tổng số các trường hợp.
D. Tỷ lệ các trường hợp thực tế là dương tính trên tổng số các trường hợp dự đoán là dương tính.

13. Phương pháp nào sau đây thuộc loại học có giám sát (supervised learning)?

A. K-means clustering
B. Phân tích thành phần chính (PCA)
C. Hồi quy tuyến tính (Linear Regression)
D. Apriori algorithm

14. Trong học máy, `bias` và `variance` đề cập đến điều gì?

A. Hai phương pháp tiền xử lý dữ liệu.
B. Hai loại lỗi mà mô hình có thể mắc phải.
C. Hai thuật toán để giảm chiều dữ liệu.
D. Hai kỹ thuật để tránh overfitting.

15. Thuật toán nào sau đây thường được sử dụng để tìm các quy luật kết hợp (association rules) trong khai phá dữ liệu?

A. K-means clustering
B. Apriori algorithm
C. Hồi quy tuyến tính (Linear Regression)
D. Phân tích thành phần chính (PCA)

16. Trong học máy, kỹ thuật nào sau đây giúp giảm thiểu tác động của các outliers (giá trị ngoại lệ) trong dữ liệu?

A. Standardization
B. Normalization
C. RobustScaler
D. MinMaxScaler

17. Hàm loss (loss function) trong học máy được sử dụng để làm gì?

A. Đo lường hiệu suất của mô hình.
B. Tính toán độ phức tạp của mô hình.
C. Xác định các đặc trưng quan trọng nhất.
D. Chuẩn hóa dữ liệu đầu vào.

18. Thuật ngữ nào sau đây mô tả hiện tượng mô hình học máy hoạt động tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới?

A. Underfitting
B. Overfitting
C. Regularization
D. Gradient Descent

19. Phương pháp nào sau đây là một kỹ thuật `ensemble learning`?

A. Hồi quy tuyến tính (Linear Regression)
B. K-means clustering
C. Random Forest
D. Phân tích thành phần chính (PCA)

20. Trong học máy, thuật ngữ `feature engineering` đề cập đến điều gì?

A. Quá trình lựa chọn thuật toán học máy phù hợp nhất cho một bài toán cụ thể.
B. Quá trình tạo và biến đổi các đặc trưng (features) từ dữ liệu thô để cải thiện hiệu suất của mô hình.
C. Quá trình tối ưu hóa các tham số của mô hình học máy.
D. Quá trình đánh giá hiệu suất của mô hình học máy.

21. Trong học máy, thuật ngữ `transfer learning` đề cập đến điều gì?

A. Quá trình chuyển đổi dữ liệu từ định dạng này sang định dạng khác.
B. Quá trình sử dụng kiến thức đã học được từ một bài toán để giải quyết một bài toán khác có liên quan.
C. Quá trình chuyển giao mô hình học máy từ một người sang người khác.
D. Quá trình chuyển đổi các đặc trưng (features) từ dữ liệu thô thành các đặc trưng có ý nghĩa hơn.

22. Trong học máy, phương pháp nào sau đây thường được sử dụng để tìm kiếm các tham số tối ưu cho mô hình?

A. Grid Search
B. Principal Component Analysis (PCA)
C. K-means Clustering
D. Association Rule Mining

23. Trong ngữ cảnh của mạng nơ-ron, hàm kích hoạt (activation function) có vai trò gì?

A. Tính toán sai số giữa đầu ra dự đoán và đầu ra thực tế.
B. Đưa tính phi tuyến vào mạng nơ-ron.
C. Tối ưu hóa trọng số của các kết nối.
D. Chuẩn hóa dữ liệu đầu vào.

24. Trong bối cảnh của mạng nơ-ron tích chập (Convolutional Neural Networks - CNNs), `pooling` layer được sử dụng để làm gì?

A. Tăng số lượng tham số của mạng.
B. Giảm kích thước của các feature maps và giảm độ phức tạp tính toán.
C. Thêm tính phi tuyến vào mạng.
D. Chuẩn hóa dữ liệu đầu vào.

25. Trong học máy, `gradient descent` là gì?

A. Một phương pháp để giảm chiều dữ liệu.
B. Một thuật toán để tối ưu hóa các tham số của mô hình.
C. Một kỹ thuật để làm sạch dữ liệu.
D. Một cách để đánh giá hiệu suất của mô hình.

26. Trong học máy, kỹ thuật nào sau đây giúp cải thiện khả năng khái quát hóa của mô hình bằng cách kết hợp kết quả của nhiều mô hình yếu?

A. Regularization
B. Ensemble Learning
C. Dimensionality Reduction
D. Feature Scaling

27. Trong học máy, phương pháp nào sau đây thường được sử dụng để giảm số lượng chiều dữ liệu trong khi vẫn giữ lại thông tin quan trọng nhất?

A. Chuẩn hóa dữ liệu (Data Normalization)
B. Rút gọn luật kết hợp (Association Rule Mining)
C. Phân tích thành phần chính (Principal Component Analysis - PCA)
D. Hồi quy tuyến tính (Linear Regression)

28. Trong học máy, phương pháp nào sau đây thường được sử dụng để đánh giá mức độ tương đồng giữa hai chuỗi văn bản?

A. Cosine Similarity
B. Linear Regression
C. K-means Clustering
D. Principal Component Analysis (PCA)

29. Đâu là một nhược điểm chính của thuật toán K-means clustering?

A. Yêu cầu dữ liệu phải được gán nhãn trước.
B. Khó khăn trong việc xử lý dữ liệu có nhiều chiều.
C. Nhạy cảm với việc lựa chọn trung tâm ban đầu.
D. Không thể xử lý dữ liệu số.

30. Mục đích chính của việc sử dụng `cross-validation` trong học máy là gì?

A. Tăng tốc độ huấn luyện mô hình.
B. Đánh giá khả năng khái quát hóa của mô hình trên dữ liệu mới.
C. Giảm kích thước của dữ liệu huấn luyện.
D. Lựa chọn các đặc trưng quan trọng nhất.

1 / 30

Category: Học máy

Tags: Bộ đề 10

1. Trong học máy, 'precision' và 'recall' là gì?

2 / 30

Category: Học máy

Tags: Bộ đề 10

2. Trong học máy, thuật ngữ 'regularization' thường được sử dụng để chỉ điều gì?

3 / 30

Category: Học máy

Tags: Bộ đề 10

3. Trong học máy, 'one-hot encoding' được sử dụng để làm gì?

4 / 30

Category: Học máy

Tags: Bộ đề 10

4. Trong học máy, mục đích chính của việc sử dụng 'batch normalization' trong mạng nơ-ron là gì?

5 / 30

Category: Học máy

Tags: Bộ đề 10

5. Trong lĩnh vực học tăng cường (Reinforcement Learning), thành phần nào chịu trách nhiệm quyết định hành động nào nên được thực hiện trong một trạng thái nhất định?

6 / 30

Category: Học máy

Tags: Bộ đề 10

6. Ưu điểm chính của việc sử dụng cây quyết định (decision tree) trong học máy là gì?

7 / 30

Category: Học máy

Tags: Bộ đề 10

7. Trong học máy, mục đích của việc sử dụng 'dropout' trong mạng nơ-ron là gì?

8 / 30

Category: Học máy

Tags: Bộ đề 10

8. Trong học máy, 'ROC curve' được sử dụng để làm gì?

9 / 30

Category: Học máy

Tags: Bộ đề 10

9. Sự khác biệt chính giữa học có giám sát (supervised learning) và học không giám sát (unsupervised learning) là gì?

10 / 30

Category: Học máy

Tags: Bộ đề 10

10. Trong học máy, kỹ thuật nào sau đây thường được sử dụng để xử lý dữ liệu bị thiếu (missing data)?

11 / 30

Category: Học máy

Tags: Bộ đề 10

11. Mô hình học máy nào sau đây thường được sử dụng cho các bài toán phân loại (classification)?

12 / 30

Category: Học máy

Tags: Bộ đề 10

12. Trong học máy, 'recall' đo lường điều gì?

13 / 30

Category: Học máy

Tags: Bộ đề 10

13. Phương pháp nào sau đây thuộc loại học có giám sát (supervised learning)?

14 / 30

Category: Học máy

Tags: Bộ đề 10

14. Trong học máy, 'bias' và 'variance' đề cập đến điều gì?

15 / 30

Category: Học máy

Tags: Bộ đề 10

15. Thuật toán nào sau đây thường được sử dụng để tìm các quy luật kết hợp (association rules) trong khai phá dữ liệu?

16 / 30

Category: Học máy

Tags: Bộ đề 10

16. Trong học máy, kỹ thuật nào sau đây giúp giảm thiểu tác động của các outliers (giá trị ngoại lệ) trong dữ liệu?

17 / 30

Category: Học máy

Tags: Bộ đề 10

17. Hàm loss (loss function) trong học máy được sử dụng để làm gì?

18 / 30

Category: Học máy

Tags: Bộ đề 10

18. Thuật ngữ nào sau đây mô tả hiện tượng mô hình học máy hoạt động tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới?

19 / 30

Category: Học máy

Tags: Bộ đề 10

19. Phương pháp nào sau đây là một kỹ thuật 'ensemble learning'?

20 / 30

Category: Học máy

Tags: Bộ đề 10

20. Trong học máy, thuật ngữ 'feature engineering' đề cập đến điều gì?

21 / 30

Category: Học máy

Tags: Bộ đề 10

21. Trong học máy, thuật ngữ 'transfer learning' đề cập đến điều gì?

22 / 30

Category: Học máy

Tags: Bộ đề 10

22. Trong học máy, phương pháp nào sau đây thường được sử dụng để tìm kiếm các tham số tối ưu cho mô hình?

23 / 30

Category: Học máy

Tags: Bộ đề 10

23. Trong ngữ cảnh của mạng nơ-ron, hàm kích hoạt (activation function) có vai trò gì?

24 / 30

Category: Học máy

Tags: Bộ đề 10

24. Trong bối cảnh của mạng nơ-ron tích chập (Convolutional Neural Networks - CNNs), 'pooling' layer được sử dụng để làm gì?

25 / 30

Category: Học máy

Tags: Bộ đề 10

25. Trong học máy, 'gradient descent' là gì?

26 / 30

Category: Học máy

Tags: Bộ đề 10

26. Trong học máy, kỹ thuật nào sau đây giúp cải thiện khả năng khái quát hóa của mô hình bằng cách kết hợp kết quả của nhiều mô hình yếu?

27 / 30

Category: Học máy

Tags: Bộ đề 10

27. Trong học máy, phương pháp nào sau đây thường được sử dụng để giảm số lượng chiều dữ liệu trong khi vẫn giữ lại thông tin quan trọng nhất?

28 / 30

Category: Học máy

Tags: Bộ đề 10

28. Trong học máy, phương pháp nào sau đây thường được sử dụng để đánh giá mức độ tương đồng giữa hai chuỗi văn bản?

29 / 30

Category: Học máy

Tags: Bộ đề 10

29. Đâu là một nhược điểm chính của thuật toán K-means clustering?

30 / 30

Category: Học máy

Tags: Bộ đề 10

30. Mục đích chính của việc sử dụng 'cross-validation' trong học máy là gì?