[KNTT] Trắc nghiệm Tin học 11 KHMT bài 10 Lưu trữ dữ liệu và khai thác thông tin phục vụ và quản lý
1. Khi thực hiện trích xuất, chuyển đổi, tải (Extract, Transform, Load - ETL) dữ liệu, giai đoạn chuyển đổi (Transform) có vai trò gì?
A. Thu thập dữ liệu từ các nguồn khác nhau.
B. Áp dụng các quy tắc để làm sạch, chuẩn hóa và cấu trúc lại dữ liệu cho phù hợp.
C. Lưu trữ dữ liệu đã xử lý vào đích cuối cùng.
D. Kiểm tra tính hợp lệ của dữ liệu sau khi đã tải.
2. Trong khai thác dữ liệu, thuật toán cây quyết định (decision tree) thường được sử dụng cho loại bài toán nào?
A. Phân cụm dữ liệu.
B. Phân loại (classification) và dự đoán giá trị (regression).
C. Xác định mối quan hệ giữa các mặt hàng (association rule mining).
D. Giảm chiều dữ liệu.
3. Trong cơ sở dữ liệu, ràng buộc duy nhất (unique constraint) được áp dụng cho một cột để đảm bảo điều gì?
A. Cột đó phải luôn có giá trị.
B. Tất cả các giá trị trong cột đó phải là duy nhất, không có giá trị trùng lặp.
C. Cột đó có thể chứa giá trị NULL.
D. Cột đó được sử dụng làm khóa chính.
4. Hành động tối ưu hóa truy vấn (query optimization) trong hệ quản trị cơ sở dữ liệu nhằm mục đích gì?
A. Tăng cường bảo mật bằng cách hạn chế quyền truy cập.
B. Giảm thiểu thời gian và tài nguyên cần thiết để thực thi một truy vấn.
C. Đảm bảo rằng tất cả dữ liệu trong bảng đều được truy cập.
D. Tự động sửa lỗi cú pháp trong các câu lệnh SQL.
5. Khái niệm khóa ngoại (foreign key) trong cơ sở dữ liệu quan hệ được sử dụng để làm gì?
A. Định danh duy nhất một bản ghi trong bảng.
B. Thiết lập mối quan hệ giữa hai bảng, liên kết dữ liệu giữa chúng.
C. Cho phép thay đổi dữ liệu mà không ảnh hưởng đến các bảng khác.
D. Ngăn chặn việc xóa dữ liệu khỏi bảng chính.
6. Khi một cơ sở dữ liệu có nhiều bảng liên quan, việc sử dụng khóa ngoại để duy trì tính toàn vẹn tham chiếu (referential integrity) có ý nghĩa gì?
A. Ngăn chặn việc tạo ra các bản ghi không có khóa chính.
B. Đảm bảo rằng giá trị của khóa ngoại luôn có một bản ghi tương ứng trong bảng được tham chiếu.
C. Giúp phân loại các bản ghi dựa trên mối quan hệ của chúng.
D. Tự động xóa các bản ghi không còn được tham chiếu.
7. Khi thiết kế cơ sở dữ liệu, nguyên tắc DRY (Dont Repeat Yourself) liên quan đến việc:
A. Tránh lặp lại các câu lệnh truy vấn.
B. Tránh lặp lại logic nghiệp vụ trong các quy trình.
C. Tránh lưu trữ cùng một thông tin ở nhiều nơi khác nhau trong cơ sở dữ liệu.
D. Đảm bảo tất cả các trường đều có giá trị.
8. Khái niệm siêu dữ liệu (metadata) trong lĩnh vực lưu trữ và khai thác dữ liệu đề cập đến điều gì?
A. Dữ liệu thô chưa qua xử lý.
B. Dữ liệu về dữ liệu, mô tả về cấu trúc, nội dung và ngữ cảnh của dữ liệu.
C. Kết quả của các phân tích dữ liệu phức tạp.
D. Các quy tắc bảo mật áp dụng cho cơ sở dữ liệu.
9. Một bộ lọc (filter) trong công cụ khai thác dữ liệu có chức năng chính là gì?
A. Tạo ra các bản ghi mới dựa trên dữ liệu hiện có.
B. Chọn ra một tập con của dữ liệu đáp ứng các tiêu chí nhất định.
C. Thay đổi cấu trúc của dữ liệu.
D. Xóa bỏ toàn bộ dữ liệu không mong muốn.
10. Khi so sánh khóa chính và khóa ngoại, điểm khác biệt cốt lõi nhất là gì?
A. Khóa chính dùng để liên kết bảng, khóa ngoại dùng để định danh bản ghi.
B. Khóa chính định danh duy nhất bản ghi trong bảng của nó, khóa ngoại liên kết đến khóa chính của bảng khác.
C. Khóa chính không được phép có giá trị NULL, khóa ngoại có thể có giá trị NULL.
D. Khóa chính thường là một cột, khóa ngoại có thể là nhiều cột.
11. Nếu một bảng trong cơ sở dữ liệu có thuộc tính Ngày sinh và bạn muốn truy vấn tất cả những người sinh vào năm 1990, bạn sẽ sử dụng hàm hoặc toán tử nào trong SQL?
A. COUNT() để đếm số lượng người.
B. SUM() để tính tổng ngày sinh.
C. EXTRACT(YEAR FROM Ngày sinh) hoặc YEAR(Ngày sinh) để lấy năm.
D. AVG() để tính tuổi trung bình.
12. Trong quá trình khai thác thông tin, kỹ thuật phân tích hồi quy (regression analysis) thường được sử dụng để:
A. Phân loại dữ liệu thành các nhóm có đặc điểm tương tự.
B. Dự đoán giá trị của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập.
C. Xác định mối quan hệ nhân quả giữa các biến số.
D. Tìm kiếm các mẫu bất thường trong tập dữ liệu.
13. Trong mô hình dữ liệu quan hệ, mối quan hệ một-nhiều (one-to-many) thường được thể hiện như thế nào?
A. Một bản ghi ở bảng A có thể liên quan đến nhiều bản ghi ở bảng B, và một bản ghi ở bảng B chỉ liên quan đến một bản ghi ở bảng A.
B. Một bản ghi ở bảng A có thể liên quan đến một hoặc nhiều bản ghi ở bảng B, và ngược lại.
C. Mỗi bản ghi ở bảng A chỉ liên quan đến một bản ghi duy nhất ở bảng B.
D. Mỗi bản ghi ở bảng A có thể không liên quan đến bất kỳ bản ghi nào ở bảng B.
14. Khi nói về khai thác thông tin, hành động nào sau đây KHÔNG thuộc phạm vi chính của hoạt động này?
A. Phân tích xu hướng tiêu thụ sản phẩm dựa trên dữ liệu bán hàng.
B. Sắp xếp các tệp tin theo thứ tự bảng chữ cái trong một thư mục.
C. Xây dựng báo cáo tổng hợp doanh thu quý dựa trên dữ liệu giao dịch.
D. Tìm kiếm thông tin khách hàng có địa chỉ ở một tỉnh cụ thể.
15. Mục đích chính của việc chuẩn hóa dữ liệu (data normalization) trong cơ sở dữ liệu là gì?
A. Giảm dung lượng lưu trữ bằng cách loại bỏ các bản ghi trùng lặp.
B. Tăng tốc độ truy vấn bằng cách tạo các chỉ mục phức tạp.
C. Hạn chế sự dư thừa dữ liệu và đảm bảo tính nhất quán, toàn vẹn của dữ liệu.
D. Tăng cường bảo mật bằng cách mã hóa toàn bộ cơ sở dữ liệu.
16. Trong lĩnh vực khai thác dữ liệu, thuật toán phân rã dữ liệu (data decomposition) thường ám chỉ hành động nào?
A. Kết hợp nhiều tập dữ liệu thành một tập duy nhất.
B. Chia một tập dữ liệu lớn thành các phần nhỏ hơn hoặc các thành phần cấu thành.
C. Loại bỏ hoàn toàn các dữ liệu không cần thiết.
D. Mã hóa dữ liệu để bảo vệ thông tin.
17. Trong mô hình lưu trữ dữ liệu, khái niệm bảng (table) được hiểu như thế nào là chính xác nhất?
A. Một tập hợp các bản ghi có cùng cấu trúc, mỗi bản ghi là một hàng.
B. Một tập hợp các trường dữ liệu có cùng kiểu, mỗi trường là một cột.
C. Một tập hợp các khóa chính để định danh duy nhất các bản ghi.
D. Một tập hợp các mối quan hệ giữa các tập dữ liệu khác nhau.
18. Phát biểu nào mô tả đúng nhất vai trò của kết quả phân tích (analytical output) trong quá trình khai thác thông tin?
A. Là dữ liệu thô ban đầu được thu thập.
B. Là các mẫu hình, xu hướng hoặc thông tin chi tiết có ý nghĩa được trích xuất từ dữ liệu.
C. Là danh sách các lỗi trong quá trình xử lý dữ liệu.
D. Là các thuật toán được sử dụng để phân tích dữ liệu.
19. Khi thực hiện truy vấn dữ liệu, phát biểu nào sau đây là ĐÚNG về WHERE clause trong ngôn ngữ SQL?
A. Xác định các cột dữ liệu sẽ được hiển thị trong kết quả truy vấn.
B. Cho phép gộp các bản ghi có giá trị giống nhau ở một hoặc nhiều cột.
C. Lọc các bản ghi dựa trên một hoặc nhiều điều kiện nhất định.
D. Sắp xếp các bản ghi theo thứ tự tăng dần hoặc giảm dần.
20. Khái niệm OLAP (Online Analytical Processing) trong khai thác dữ liệu đề cập đến loại hình xử lý nào?
A. Xử lý giao dịch trực tuyến (Online Transaction Processing).
B. Phân tích dữ liệu đa chiều, cho phép người dùng xem dữ liệu từ nhiều góc độ.
C. Xử lý dữ liệu theo lô (Batch Processing).
D. Lưu trữ và truy xuất dữ liệu theo thời gian thực.
21. Trong khai thác dữ liệu, kỹ thuật phân cụm (clustering) được sử dụng để:
A. Dự đoán giá trị của một biến số dựa trên các biến khác.
B. Phân loại các đối tượng vào các nhóm (cụm) dựa trên sự tương đồng của chúng.
C. Xác định mối quan hệ giữa các sự kiện xảy ra cùng nhau.
D. Tìm kiếm các mẫu dữ liệu bất thường hoặc ngoại lệ.
22. Một chỉ mục (index) trong cơ sở dữ liệu có vai trò chính là gì?
A. Đảm bảo tính toàn vẹn của dữ liệu bằng cách áp dụng các ràng buộc.
B. Tăng tốc độ truy cập và tìm kiếm dữ liệu trong bảng.
C. Xác định các trường dữ liệu cần thiết cho một bảng.
D. Tự động cập nhật dữ liệu khi có thay đổi ở bảng liên quan.
23. Một báo cáo tổng hợp (summary report) trong khai thác dữ liệu thường bao gồm những gì?
A. Chỉ chứa các bản ghi dữ liệu thô.
B. Các số liệu thống kê tổng hợp như tổng, trung bình, đếm, phần trăm.
C. Danh sách tất cả các trường có trong cơ sở dữ liệu.
D. Các công thức tính toán phức tạp mà không có kết quả.
24. Một khóa chính (primary key) trong cơ sở dữ liệu có vai trò quan trọng nhất là gì?
A. Liên kết bảng hiện tại với một bảng khác thông qua khóa ngoại.
B. Đảm bảo mỗi bản ghi trong bảng được nhận dạng duy nhất và không bị trùng lặp.
C. Xác định thứ tự sắp xếp mặc định cho các bản ghi trong bảng.
D. Cho phép truy cập dữ liệu nhanh chóng bằng cách tạo chỉ mục.
25. Trong ngôn ngữ SQL, khi bạn muốn kết hợp dữ liệu từ hai bảng dựa trên một cột chung, bạn sẽ sử dụng loại JOIN nào?
A. UNION JOIN
B. INNER JOIN
C. CROSS JOIN
D. OUTER JOIN