1. Trong SQL, mệnh đề nào được sử dụng để sắp xếp các hàng trong kết quả truy vấn?
A. WHERE
B. GROUP BY
C. ORDER BY
D. HAVING
2. Đâu là một phương pháp để cải thiện hiệu suất của cơ sở dữ liệu?
A. Sử dụng index.
B. Tối ưu hóa truy vấn.
C. Phân vùng bảng.
D. Tất cả các đáp án trên.
3. Trong SQL, câu lệnh nào được sử dụng để thêm dữ liệu mới vào một bảng?
A. SELECT
B. UPDATE
C. DELETE
D. INSERT
4. Trong ngữ cảnh cơ sở dữ liệu, `replication` (sao chép) là gì?
A. Quá trình tối ưu hóa truy vấn để tăng tốc độ truy xuất dữ liệu.
B. Quá trình tạo bản sao dữ liệu trên nhiều máy chủ để tăng tính sẵn sàng và khả năng chịu lỗi.
C. Quá trình mã hóa dữ liệu để bảo vệ thông tin nhạy cảm.
D. Quá trình nén dữ liệu để giảm dung lượng lưu trữ.
5. Trong ngữ cảnh cơ sở dữ liệu NoSQL, CAP theorem phát biểu rằng một hệ thống phân tán chỉ có thể đảm bảo tối đa hai trong ba thuộc tính nào sau đây?
A. Tính nhất quán (Consistency), Tính sẵn sàng (Availability), Khả năng chịu lỗi phân vùng (Partition tolerance).
B. Tính bảo mật (Confidentiality), Tính toàn vẹn (Integrity), Tính sẵn sàng (Availability).
C. Tính xác thực (Authentication), Tính ủy quyền (Authorization), Khả năng chịu lỗi (Fault tolerance).
D. Tính đơn giản (Simplicity), Tính linh hoạt (Adaptability), Tính mở rộng (Extensibility).
6. Trong ngữ cảnh cơ sở dữ liệu, `data normalization` (chuẩn hóa dữ liệu) là gì?
A. Quá trình sắp xếp dữ liệu theo thứ tự bảng chữ cái.
B. Quá trình loại bỏ dữ liệu trùng lặp và cải thiện tính nhất quán của dữ liệu.
C. Quá trình mã hóa dữ liệu để bảo vệ thông tin nhạy cảm.
D. Quá trình chuyển đổi dữ liệu sang một định dạng chuẩn.
7. Data masking (che giấu dữ liệu) là gì?
A. Quá trình sao lưu và phục hồi dữ liệu để đảm bảo tính an toàn.
B. Quá trình mã hóa dữ liệu để bảo vệ thông tin nhạy cảm.
C. Quá trình che giấu hoặc thay thế dữ liệu nhạy cảm để bảo vệ quyền riêng tư.
D. Quá trình tối ưu hóa truy vấn để tăng tốc độ truy xuất dữ liệu.
8. Đâu là một biện pháp để bảo vệ cơ sở dữ liệu khỏi các cuộc tấn công SQL injection?
A. Sử dụng mật khẩu mạnh.
B. Kiểm tra và làm sạch dữ liệu đầu vào.
C. Sử dụng tường lửa.
D. Tất cả các đáp án trên.
9. Đâu là một ưu điểm của việc sử dụng hệ quản trị cơ sở dữ liệu dựa trên đám mây (Cloud-based DBMS)?
A. Chi phí đầu tư ban đầu thấp hơn.
B. Khả năng mở rộng linh hoạt.
C. Dễ dàng quản lý và bảo trì.
D. Tất cả các đáp án trên.
10. Trong mô hình ACID, Isolation (Tính độc lập) đảm bảo điều gì?
A. Một giao dịch phải được thực hiện toàn bộ hoặc không thực hiện gì cả.
B. Dữ liệu phải luôn chính xác và nhất quán.
C. Các giao dịch đồng thời không được can thiệp lẫn nhau.
D. Một khi giao dịch đã được cam kết, các thay đổi sẽ là vĩnh viễn.
11. Trong mô hình ACID, Durability (Tính bền vững) đảm bảo điều gì?
A. Một giao dịch phải được thực hiện toàn bộ hoặc không thực hiện gì cả.
B. Dữ liệu phải luôn chính xác và nhất quán.
C. Các giao dịch đồng thời không được can thiệp lẫn nhau.
D. Một khi giao dịch đã được cam kết, các thay đổi sẽ là vĩnh viễn.
12. Data vault là gì?
A. Một kiến trúc kho dữ liệu được thiết kế để cung cấp khả năng kiểm tra và theo dõi lịch sử dữ liệu.
B. Một hệ thống quản lý cơ sở dữ liệu quan hệ.
C. Một công cụ để khai phá dữ liệu.
D. Một kho lưu trữ dữ liệu thô, chưa được xử lý.
13. Đâu là ngôn ngữ truy vấn dữ liệu (DQL) phổ biến nhất trong các hệ quản trị cơ sở dữ liệu quan hệ (RDBMS)?
A. XML
B. JSON
C. SQL
D. HTML
14. Data governance (quản trị dữ liệu) là gì?
A. Quá trình mã hóa dữ liệu để bảo vệ thông tin nhạy cảm.
B. Quá trình quản lý và bảo vệ dữ liệu để đảm bảo tính chính xác, toàn vẹn và bảo mật.
C. Quá trình tối ưu hóa truy vấn để tăng tốc độ truy xuất dữ liệu.
D. Quá trình sao lưu và phục hồi dữ liệu để đảm bảo tính an toàn.
15. Trong SQL, mệnh đề nào được sử dụng để lọc các nhóm (groups) sau khi đã thực hiện GROUP BY?
A. WHERE
B. GROUP BY
C. ORDER BY
D. HAVING
16. Mục đích chính của việc sử dụng index (chỉ mục) trong cơ sở dữ liệu là gì?
A. Để giảm dung lượng lưu trữ của cơ sở dữ liệu.
B. Để tăng tốc độ truy vấn dữ liệu.
C. Để mã hóa dữ liệu và bảo vệ khỏi truy cập trái phép.
D. Để đảm bảo tính toàn vẹn của dữ liệu.
17. Data mining (khai phá dữ liệu) là gì?
A. Quá trình tìm kiếm và khai thác thông tin hữu ích từ một lượng lớn dữ liệu.
B. Quá trình sao lưu và phục hồi dữ liệu để đảm bảo tính an toàn.
C. Quá trình tối ưu hóa truy vấn để tăng tốc độ truy xuất dữ liệu.
D. Quá trình mã hóa dữ liệu để bảo vệ thông tin nhạy cảm.
18. Phân mảnh cơ sở dữ liệu (Database fragmentation) là gì?
A. Quá trình chia nhỏ một bảng lớn thành các phần nhỏ hơn, lưu trữ trên nhiều máy chủ khác nhau.
B. Quá trình sao lưu và phục hồi dữ liệu để đảm bảo tính an toàn.
C. Quá trình tối ưu hóa truy vấn để tăng tốc độ truy xuất dữ liệu.
D. Quá trình mã hóa dữ liệu để bảo vệ thông tin nhạy cảm.
19. Đâu là một yếu tố quan trọng cần xem xét khi thiết kế cơ sở dữ liệu?
A. Tính nhất quán của dữ liệu.
B. Hiệu suất truy vấn.
C. Khả năng mở rộng.
D. Tất cả các đáp án trên.
20. Data lake (hồ dữ liệu) là gì?
A. Một kho lưu trữ dữ liệu được cấu trúc và xử lý sẵn.
B. Một kho lưu trữ dữ liệu thô, chưa được xử lý, có thể chứa nhiều loại dữ liệu khác nhau.
C. Một hệ thống quản lý cơ sở dữ liệu quan hệ.
D. Một công cụ để khai phá dữ liệu.
21. Trong SQL, mệnh đề nào được sử dụng để nhóm các hàng có cùng giá trị trong một cột?
A. WHERE
B. GROUP BY
C. ORDER BY
D. HAVING
22. Đâu là một lợi ích chính của việc sử dụng stored procedure (thủ tục lưu trữ) trong cơ sở dữ liệu?
A. Giảm dung lượng lưu trữ của cơ sở dữ liệu.
B. Tăng cường bảo mật bằng cách che giấu logic nghiệp vụ.
C. Tăng tốc độ truy vấn dữ liệu bằng cách tạo index tự động.
D. Đơn giản hóa việc quản lý cơ sở dữ liệu bằng cách tự động sao lưu dữ liệu.
23. Đâu là một nhược điểm của việc sử dụng cơ sở dữ liệu NoSQL so với cơ sở dữ liệu quan hệ?
A. Khả năng mở rộng kém hơn.
B. Tính nhất quán dữ liệu yếu hơn.
C. Hiệu suất truy vấn chậm hơn.
D. Khó khăn hơn trong việc quản lý và bảo trì.
24. Đâu là một thách thức chính khi quản lý cơ sở dữ liệu lớn (Big Data)?
A. Đảm bảo tính toàn vẹn của dữ liệu khi dữ liệu được lưu trữ trên nhiều máy chủ.
B. Tìm kiếm và truy xuất dữ liệu một cách hiệu quả trong một lượng lớn dữ liệu.
C. Đảm bảo tính bảo mật của dữ liệu khi dữ liệu được truy cập bởi nhiều người dùng.
D. Tất cả các đáp án trên.
25. Trong mô hình ACID, thuộc tính `Atomicity` (Tính nguyên tố) đảm bảo điều gì?
A. Tất cả các thay đổi dữ liệu được thực hiện tuần tự, không có sự can thiệp từ các giao dịch khác.
B. Một giao dịch phải được thực hiện toàn bộ hoặc không thực hiện gì cả; không có trạng thái trung gian.
C. Dữ liệu phải luôn chính xác và nhất quán, phản ánh đúng thực tế.
D. Một khi giao dịch đã được cam kết (commit), các thay đổi sẽ là vĩnh viễn và không thể bị mất.
26. Data warehouse (kho dữ liệu) khác biệt với operational database (cơ sở dữ liệu tác nghiệp) chủ yếu ở điểm nào?
A. Data warehouse được thiết kế để xử lý các giao dịch trực tuyến, trong khi operational database được thiết kế cho phân tích.
B. Data warehouse chứa dữ liệu lịch sử và tổng hợp, trong khi operational database chứa dữ liệu hiện tại và chi tiết.
C. Data warehouse sử dụng mô hình dữ liệu quan hệ, trong khi operational database sử dụng mô hình NoSQL.
D. Data warehouse có tính nhất quán cao hơn operational database.
27. Trong SQL, câu lệnh nào được sử dụng để sửa đổi dữ liệu hiện có trong một bảng?
A. SELECT
B. UPDATE
C. DELETE
D. INSERT
28. Trong ngữ cảnh cơ sở dữ liệu, `backup` (sao lưu) và `recovery` (phục hồi) là gì?
A. Các biện pháp để tăng tốc độ truy vấn dữ liệu.
B. Các biện pháp để bảo vệ dữ liệu khỏi truy cập trái phép.
C. Các biện pháp để tạo bản sao dữ liệu và khôi phục dữ liệu khi có sự cố.
D. Các biện pháp để tối ưu hóa dung lượng lưu trữ của cơ sở dữ liệu.
29. Trong SQL, mệnh đề nào được sử dụng để lọc các hàng thỏa mãn một điều kiện nhất định?
A. SELECT
B. FROM
C. WHERE
D. ORDER BY
30. Trong cơ sở dữ liệu quan hệ, khóa ngoại (foreign key) được sử dụng để làm gì?
A. Để xác định duy nhất mỗi hàng trong một bảng.
B. Để liên kết một bảng với một bảng khác, đảm bảo tính toàn vẹn tham chiếu.
C. Để mã hóa dữ liệu trong một cột.
D. Để tăng tốc độ truy vấn dữ liệu trong một bảng.