Đề 4 – Đề thi, câu hỏi trắc nghiệm online Dữ liệu lớn (BigData)

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Dữ liệu lớn (BigData)

Đề 4 - Đề thi, câu hỏi trắc nghiệm online Dữ liệu lớn (BigData)

1. Framework nào sau đây được thiết kế để xử lý luồng dữ liệu thời gian thực trong Big Data?

A. Hadoop.
B. Spark Streaming.
C. Hive.
D. Pig.

2. Spark khác với Hadoop MapReduce như thế nào?

A. Spark chỉ hỗ trợ xử lý dữ liệu theo lô, trong khi MapReduce hỗ trợ cả lô và thời gian thực.
B. Spark nhanh hơn MapReduce do sử dụng bộ nhớ trong để xử lý dữ liệu.
C. Spark là một hệ thống lưu trữ dữ liệu, trong khi MapReduce là một framework xử lý dữ liệu.
D. Spark chỉ có thể xử lý dữ liệu có cấu trúc, trong khi MapReduce có thể xử lý cả dữ liệu có cấu trúc và phi cấu trúc.

3. Thuật ngữ `CAP theorem` trong Big Data liên quan đến những thuộc tính nào?

A. Complexity, Agility, and Performance.
B. Consistency, Availability, and Partition tolerance.
C. Capacity, Automation, and Prediction.
D. Customization, Analytics, and Personalization.

4. Công nghệ nào sau đây thường được sử dụng để lưu trữ và xử lý dữ liệu lớn trong môi trường phân tán?

A. Microsoft Access.
B. Hadoop.
C. MySQL.
D. Microsoft Excel.

5. Công cụ nào sau đây thường được sử dụng để thực hiện các truy vấn SQL trên dữ liệu được lưu trữ trong Hadoop?

A. Java.
B. Python.
C. Hive.
D. C++.

6. Trong Big Data, thuật ngữ `Data Cleansing` (Làm sạch dữ liệu) đề cập đến quá trình nào?

A. Mã hóa dữ liệu để bảo mật.
B. Xóa dữ liệu cũ và không cần thiết.
C. Sửa chữa hoặc loại bỏ dữ liệu không chính xác, không đầy đủ hoặc không liên quan.
D. Chuyển đổi dữ liệu sang định dạng chuẩn.

7. Đặc điểm `Veracity` (Tính xác thực) trong Big Data đề cập đến vấn đề gì?

A. Tính kịp thời của dữ liệu.
B. Sự đa dạng của các loại dữ liệu.
C. Độ chính xác và tin cậy của dữ liệu.
D. Khả năng mở rộng của hệ thống xử lý dữ liệu.

8. Công cụ nào sau đây thường được sử dụng để quản lý và điều phối các tác vụ trong một quy trình Big Data?

A. Jupyter Notebook.
B. Apache Airflow.
C. Visual Studio Code.
D. Sublime Text.

9. Đâu là một thách thức chính trong việc triển khai các dự án Big Data?

A. Thiếu công cụ trực quan hóa dữ liệu.
B. Thiếu chuyên gia có kỹ năng phân tích và quản lý dữ liệu lớn.
C. Chi phí lưu trữ dữ liệu quá thấp.
D. Dễ dàng tích hợp dữ liệu từ các nguồn khác nhau.

10. Trong các ứng dụng Big Data, thuật ngữ `ETL` thường được dùng để chỉ quy trình nào?

A. Encryption, Transmission, and Loading.
B. Extract, Transform, and Load.
C. Error Tracking and Logging.
D. Evaluate, Test, and Launch.

11. Trong ngữ cảnh Big Data, đặc điểm `Volume` đề cập đến yếu tố nào?

A. Sự đa dạng của các nguồn dữ liệu.
B. Tốc độ tạo ra và xử lý dữ liệu.
C. Độ chính xác và tin cậy của dữ liệu.
D. Khối lượng dữ liệu cực lớn.

12. Đâu là một thách thức lớn trong việc quản lý và xử lý dữ liệu lớn?

A. Đảm bảo tính bảo mật và quyền riêng tư của dữ liệu.
B. Dung lượng lưu trữ dữ liệu.
C. Tốc độ truy cập dữ liệu.
D. Sự phức tạp của các thuật toán phân tích.

13. Trong Big Data, thuật ngữ `Data Governance` (Quản trị dữ liệu) đề cập đến điều gì?

A. Quá trình mã hóa dữ liệu.
B. Tập hợp các chính sách và quy trình để đảm bảo chất lượng, bảo mật và tuân thủ của dữ liệu.
C. Phương pháp lưu trữ dữ liệu hiệu quả.
D. Công cụ để trích xuất dữ liệu từ các nguồn khác nhau.

14. Hệ thống nào sau đây là một ví dụ về cơ sở dữ liệu NoSQL?

A. MySQL.
B. PostgreSQL.
C. MongoDB.
D. Microsoft SQL Server.

15. Thuật ngữ `Data Lake` (Hồ dữ liệu) khác biệt so với `Data Warehouse` (Kho dữ liệu) như thế nào?

A. Data Lake lưu trữ dữ liệu đã được xử lý và chuyển đổi, trong khi Data Warehouse lưu trữ dữ liệu thô.
B. Data Lake lưu trữ dữ liệu có cấu trúc, trong khi Data Warehouse lưu trữ dữ liệu phi cấu trúc.
C. Data Lake lưu trữ dữ liệu thô ở định dạng gốc của nó, trong khi Data Warehouse lưu trữ dữ liệu đã được xử lý và chuyển đổi để phục vụ phân tích.
D. Data Lake chỉ được sử dụng cho dữ liệu thời gian thực, trong khi Data Warehouse chỉ được sử dụng cho dữ liệu lịch sử.

16. Trong Big Data, thuật ngữ `Scalability` (Khả năng mở rộng) có nghĩa là gì?

A. Khả năng bảo vệ dữ liệu khỏi các cuộc tấn công mạng.
B. Khả năng xử lý dữ liệu với tốc độ cao.
C. Khả năng của hệ thống để xử lý lượng dữ liệu tăng lên hoặc số lượng người dùng tăng lên.
D. Khả năng trực quan hóa dữ liệu một cách hiệu quả.

17. Điểm khác biệt chính giữa NoSQL và SQL là gì?

A. NoSQL chỉ hỗ trợ dữ liệu có cấu trúc, trong khi SQL hỗ trợ cả dữ liệu có cấu trúc và phi cấu trúc.
B. NoSQL không yêu cầu lược đồ cố định, trong khi SQL yêu cầu lược đồ cố định.
C. NoSQL sử dụng ngôn ngữ truy vấn SQL, trong khi SQL sử dụng các ngôn ngữ truy vấn khác.
D. NoSQL chỉ có thể chạy trên một máy chủ, trong khi SQL có thể chạy trên nhiều máy chủ.

18. Công cụ nào sau đây được sử dụng để tự động hóa việc triển khai, mở rộng và quản lý các ứng dụng containerized, thường được sử dụng trong Big Data?

A. Docker Compose.
B. Kubernetes.
C. Ansible.
D. Terraform.

19. Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của việc sử dụng Big Data?

A. Phân tích dự đoán trong bán lẻ để tối ưu hóa hàng tồn kho.
B. Quản lý hồ sơ bệnh nhân điện tử trong một phòng khám nhỏ.
C. Phát hiện gian lận trong lĩnh vực tài chính.
D. Cá nhân hóa quảng cáo trực tuyến.

20. Trong Big Data, kỹ thuật `Data Mining` (Khai phá dữ liệu) được sử dụng để làm gì?

A. Để mã hóa và bảo vệ dữ liệu.
B. Để trích xuất thông tin hữu ích và các mẫu từ lượng lớn dữ liệu.
C. Để chuyển đổi dữ liệu sang định dạng phù hợp.
D. Để lưu trữ dữ liệu một cách hiệu quả.

21. Đâu là một ứng dụng của Big Data trong lĩnh vực tài chính?

A. Dự báo thời tiết.
B. Phát hiện gian lận thẻ tín dụng.
C. Quản lý chuỗi cung ứng.
D. Tối ưu hóa lộ trình giao thông.

22. Đâu là một ví dụ về việc sử dụng Big Data trong lĩnh vực bán lẻ?

A. Dự báo giá cổ phiếu.
B. Tối ưu hóa tuyến đường giao hàng.
C. Cá nhân hóa đề xuất sản phẩm cho khách hàng.
D. Phân tích chất lượng không khí.

23. Ngôn ngữ lập trình nào thường được sử dụng để phát triển các ứng dụng Big Data?

A. HTML.
B. CSS.
C. Java.
D. JavaScript.

24. Trong Big Data, thuật ngữ `Data Discovery` (Khám phá dữ liệu) đề cập đến quá trình nào?

A. Việc tìm kiếm và xác định các nguồn dữ liệu có liên quan.
B. Việc mã hóa dữ liệu để bảo mật.
C. Việc chuyển đổi dữ liệu sang định dạng chuẩn.
D. Việc xóa dữ liệu trùng lặp.

25. Trong ngữ cảnh Big Data, `Machine Learning` (Học máy) được sử dụng để làm gì?

A. Để nén dữ liệu.
B. Để tự động hóa việc khám phá các mẫu và dự đoán từ dữ liệu.
C. Để trực quan hóa dữ liệu.
D. Để bảo mật dữ liệu.

26. Đâu là một lợi ích chính của việc sử dụng Big Data analytics trong lĩnh vực y tế?

A. Giảm chi phí lưu trữ dữ liệu.
B. Cải thiện độ chính xác của chẩn đoán và điều trị.
C. Tăng tốc độ truy cập dữ liệu.
D. Đơn giản hóa việc quản lý dữ liệu.

27. Trong Big Data, thuật ngữ `Data Integration` (Tích hợp dữ liệu) đề cập đến quá trình nào?

A. Việc mã hóa dữ liệu để bảo mật.
B. Việc thu thập dữ liệu từ nhiều nguồn khác nhau và kết hợp chúng thành một dạng thống nhất.
C. Việc xóa dữ liệu trùng lặp.
D. Việc phân tích dữ liệu để tìm ra các mẫu.

28. Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu lớn?

A. Microsoft Word.
B. Microsoft PowerPoint.
C. Tableau.
D. Microsoft Excel.

29. Yếu tố `Velocity` (Tốc độ) trong Big Data thể hiện điều gì?

A. Sự thay đổi liên tục của dữ liệu theo thời gian.
B. Khả năng mở rộng của hệ thống lưu trữ dữ liệu.
C. Tốc độ tạo ra và xử lý dữ liệu.
D. Độ tin cậy của nguồn dữ liệu.

30. Trong Big Data, thuật ngữ `Data Streaming` (Truyền dữ liệu trực tuyến) đề cập đến điều gì?

A. Việc lưu trữ dữ liệu trên các thiết bị di động.
B. Việc xử lý dữ liệu liên tục khi nó được tạo ra.
C. Việc chuyển đổi dữ liệu sang các định dạng khác nhau.
D. Việc nén dữ liệu để tiết kiệm không gian lưu trữ.

1 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

1. Framework nào sau đây được thiết kế để xử lý luồng dữ liệu thời gian thực trong Big Data?

2 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

2. Spark khác với Hadoop MapReduce như thế nào?

3 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

3. Thuật ngữ 'CAP theorem' trong Big Data liên quan đến những thuộc tính nào?

4 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

4. Công nghệ nào sau đây thường được sử dụng để lưu trữ và xử lý dữ liệu lớn trong môi trường phân tán?

5 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

5. Công cụ nào sau đây thường được sử dụng để thực hiện các truy vấn SQL trên dữ liệu được lưu trữ trong Hadoop?

6 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

6. Trong Big Data, thuật ngữ 'Data Cleansing' (Làm sạch dữ liệu) đề cập đến quá trình nào?

7 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

7. Đặc điểm 'Veracity' (Tính xác thực) trong Big Data đề cập đến vấn đề gì?

8 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

8. Công cụ nào sau đây thường được sử dụng để quản lý và điều phối các tác vụ trong một quy trình Big Data?

9 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

9. Đâu là một thách thức chính trong việc triển khai các dự án Big Data?

10 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

10. Trong các ứng dụng Big Data, thuật ngữ 'ETL' thường được dùng để chỉ quy trình nào?

11 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

11. Trong ngữ cảnh Big Data, đặc điểm 'Volume' đề cập đến yếu tố nào?

12 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

12. Đâu là một thách thức lớn trong việc quản lý và xử lý dữ liệu lớn?

13 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

13. Trong Big Data, thuật ngữ 'Data Governance' (Quản trị dữ liệu) đề cập đến điều gì?

14 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

14. Hệ thống nào sau đây là một ví dụ về cơ sở dữ liệu NoSQL?

15 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

15. Thuật ngữ 'Data Lake' (Hồ dữ liệu) khác biệt so với 'Data Warehouse' (Kho dữ liệu) như thế nào?

16 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

16. Trong Big Data, thuật ngữ 'Scalability' (Khả năng mở rộng) có nghĩa là gì?

17 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

17. Điểm khác biệt chính giữa NoSQL và SQL là gì?

18 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

18. Công cụ nào sau đây được sử dụng để tự động hóa việc triển khai, mở rộng và quản lý các ứng dụng containerized, thường được sử dụng trong Big Data?

19 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

19. Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của việc sử dụng Big Data?

20 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

20. Trong Big Data, kỹ thuật 'Data Mining' (Khai phá dữ liệu) được sử dụng để làm gì?

21 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

21. Đâu là một ứng dụng của Big Data trong lĩnh vực tài chính?

22 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

22. Đâu là một ví dụ về việc sử dụng Big Data trong lĩnh vực bán lẻ?

23 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

23. Ngôn ngữ lập trình nào thường được sử dụng để phát triển các ứng dụng Big Data?

24 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

24. Trong Big Data, thuật ngữ 'Data Discovery' (Khám phá dữ liệu) đề cập đến quá trình nào?

25 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

25. Trong ngữ cảnh Big Data, 'Machine Learning' (Học máy) được sử dụng để làm gì?

26 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

26. Đâu là một lợi ích chính của việc sử dụng Big Data analytics trong lĩnh vực y tế?

27 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

27. Trong Big Data, thuật ngữ 'Data Integration' (Tích hợp dữ liệu) đề cập đến quá trình nào?

28 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

28. Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu lớn?

29 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

29. Yếu tố 'Velocity' (Tốc độ) trong Big Data thể hiện điều gì?

30 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 4

30. Trong Big Data, thuật ngữ 'Data Streaming' (Truyền dữ liệu trực tuyến) đề cập đến điều gì?