Đề 6 – Đề thi, câu hỏi trắc nghiệm online Dữ liệu lớn (BigData)

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Dữ liệu lớn (BigData)

Đề 6 - Đề thi, câu hỏi trắc nghiệm online Dữ liệu lớn (BigData)

1. Trong Big Data, thuật ngữ `Lambda Architecture` đề cập đến điều gì?

A. Một kiến trúc xử lý dữ liệu chỉ sử dụng xử lý theo lô (batch processing).
B. Một kiến trúc xử lý dữ liệu chỉ sử dụng xử lý thời gian thực (real-time processing).
C. Một kiến trúc xử lý dữ liệu kết hợp cả xử lý theo lô và xử lý thời gian thực để cung cấp cả độ chính xác và tốc độ.
D. Một kiến trúc chỉ sử dụng cơ sở dữ liệu quan hệ để lưu trữ dữ liệu.

2. Ứng dụng nào sau đây của Big Data được sử dụng để tối ưu hóa chuỗi cung ứng và giảm chi phí vận chuyển?

A. Phân tích dự đoán.
B. Phân tích chuỗi cung ứng.
C. Phân tích rủi ro.
D. Phân tích gian lận.

3. Trong Big Data, thuật ngữ `Schema on Read` có nghĩa là gì?

A. Cấu trúc dữ liệu được xác định trước khi dữ liệu được lưu trữ.
B. Cấu trúc dữ liệu được xác định khi dữ liệu được truy vấn.
C. Dữ liệu được lưu trữ trong một lược đồ cố định.
D. Dữ liệu được mã hóa trước khi lưu trữ.

4. Công cụ nào sau đây được sử dụng để xây dựng các pipeline xử lý dữ liệu (data processing pipelines) trong Big Data?

A. Microsoft Excel.
B. Apache Airflow.
C. Adobe Photoshop.
D. Microsoft Word.

5. Ứng dụng nào sau đây của Big Data được sử dụng để cải thiện trải nghiệm khách hàng bằng cách cá nhân hóa các đề xuất và quảng cáo?

A. Phân tích dự đoán.
B. Phân tích chuỗi cung ứng.
C. Phân tích hành vi khách hàng.
D. Phân tích rủi ro.

6. Công cụ nào sau đây thường được sử dụng để truy vấn và phân tích dữ liệu trong Hadoop?

A. Java.
B. Python.
C. SQL.
D. Pig và Hive.

7. Trong ngữ cảnh của Big Data, thuật ngữ `Data Mining` (Khai phá dữ liệu) đề cập đến điều gì?

A. Quá trình thu thập dữ liệu từ các nguồn khác nhau.
B. Quá trình làm sạch và chuẩn hóa dữ liệu.
C. Quá trình khám phá các mẫu, xu hướng và thông tin hữu ích từ dữ liệu lớn.
D. Quá trình bảo mật dữ liệu khỏi truy cập trái phép.

8. Hệ thống nào sau đây thường được sử dụng để quản lý và điều phối các tài nguyên trong một cluster Hadoop?

A. HDFS.
B. YARN.
C. MapReduce.
D. Hive.

9. Trong Big Data, `Data Cleansing` (Làm sạch dữ liệu) là gì?

A. Quá trình mã hóa dữ liệu để bảo mật.
B. Quá trình loại bỏ các dữ liệu trùng lặp, không chính xác hoặc không đầy đủ.
C. Quá trình chuyển đổi dữ liệu sang một định dạng khác.
D. Quá trình nén dữ liệu để giảm dung lượng lưu trữ.

10. Kỹ thuật nào sau đây được sử dụng để giảm kích thước dữ liệu trong Big Data mà vẫn giữ được thông tin quan trọng?

A. Data encryption.
B. Data compression.
C. Data masking.
D. Data replication.

11. Công nghệ nào sau đây thường được sử dụng để xử lý và phân tích dữ liệu lớn trong môi trường phân tán?

A. Microsoft Excel.
B. Hadoop.
C. Microsoft Access.
D. Adobe Photoshop.

12. Ứng dụng nào sau đây của Big Data được sử dụng để dự đoán xu hướng thị trường và hành vi của người tiêu dùng?

A. Phân tích dự đoán.
B. Phân tích chuỗi cung ứng.
C. Phân tích rủi ro.
D. Phân tích gian lận.

13. Trong lĩnh vực Big Data, `Data Governance` (Quản trị dữ liệu) đề cập đến điều gì?

A. Quá trình thu thập dữ liệu từ các nguồn khác nhau.
B. Quá trình phân tích dữ liệu để tìm ra thông tin hữu ích.
C. Tập hợp các chính sách và quy trình để đảm bảo chất lượng, bảo mật và tuân thủ của dữ liệu.
D. Quá trình trực quan hóa dữ liệu để dễ dàng hiểu được các mẫu và xu hướng.

14. Trong Big Data, `Data Integration` (Tích hợp dữ liệu) là gì?

A. Quá trình tạo ra dữ liệu mới.
B. Quá trình kết hợp dữ liệu từ nhiều nguồn khác nhau vào một dạng thống nhất.
C. Quá trình xóa dữ liệu cũ.
D. Quá trình mã hóa dữ liệu.

15. Yếu tố nào sau đây không thuộc `5V` của Big Data?

A. Volume.
B. Velocity.
C. Variety.
D. Validity.

16. Trong Big Data, `MapReduce` là gì?

A. Một ngôn ngữ lập trình.
B. Một framework lập trình để xử lý song song lượng lớn dữ liệu.
C. Một hệ thống quản lý cơ sở dữ liệu.
D. Một công cụ trực quan hóa dữ liệu.

17. Trong Big Data, `Data Security` (Bảo mật dữ liệu) bao gồm những biện pháp nào?

A. Chỉ mã hóa dữ liệu.
B. Chỉ kiểm soát truy cập dữ liệu.
C. Các biện pháp bảo vệ dữ liệu khỏi truy cập trái phép, mất mát, hoặc hư hỏng, bao gồm mã hóa, kiểm soát truy cập, và giám sát bảo mật.
D. Chỉ sao lưu dữ liệu.

18. Trong Big Data, `Data Discovery` (Khám phá dữ liệu) là gì?

A. Quá trình tìm kiếm và xác định các nguồn dữ liệu có sẵn.
B. Quá trình xóa dữ liệu không cần thiết.
C. Quá trình mã hóa dữ liệu.
D. Quá trình chuyển đổi dữ liệu sang định dạng khác.

19. Trong ngữ cảnh của Big Data, đặc điểm `Variety` đề cập đến điều gì?

A. Số lượng lớn dữ liệu được tạo ra và lưu trữ.
B. Tốc độ mà dữ liệu được tạo ra và xử lý.
C. Sự đa dạng của các loại dữ liệu khác nhau (có cấu trúc, bán cấu trúc và phi cấu trúc).
D. Độ chính xác và tin cậy của dữ liệu.

20. Phương pháp nào sau đây được sử dụng để xử lý dữ liệu theo thời gian thực trong Big Data?

A. Batch processing.
B. Real-time processing (Stream processing).
C. Data warehousing.
D. Data mining.

21. Công nghệ nào sau đây được sử dụng để thu thập và xử lý dữ liệu từ các thiết bị IoT (Internet of Things)?

A. Hadoop.
B. Spark.
C. Kafka.
D. Tableau.

22. Trong Big Data, `Data Warehouse` (Kho dữ liệu) khác với `Data Lake` (Hồ dữ liệu) như thế nào?

A. Data Warehouse lưu trữ dữ liệu thô, còn Data Lake lưu trữ dữ liệu đã được xử lý.
B. Data Warehouse lưu trữ dữ liệu có cấu trúc, còn Data Lake có thể lưu trữ dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc.
C. Data Warehouse được sử dụng cho phân tích thời gian thực, còn Data Lake được sử dụng cho phân tích theo lô.
D. Data Warehouse dễ mở rộng hơn Data Lake.

23. Công cụ nào sau đây thường được sử dụng để xử lý các truy vấn SQL trên dữ liệu lưu trữ trong HDFS?

A. Java.
B. Python.
C. Hive.
D. C++.

24. Hệ thống nào sau đây được thiết kế để xử lý các truy vấn phức tạp trên lượng lớn dữ liệu một cách nhanh chóng?

A. Hệ thống quản lý cơ sở dữ liệu quan hệ (RDBMS).
B. Hệ thống NoSQL.
C. Hệ thống quản lý tệp tin.
D. Hệ thống quản lý bộ nhớ.

25. Trong kiến trúc Big Data, thành phần nào chịu trách nhiệm thu thập và chuyển dữ liệu từ nhiều nguồn khác nhau vào hệ thống?

A. Data warehouse.
B. Data lake.
C. Data ingestion.
D. Data visualization.

26. Thuật ngữ `Data Lake` (Hồ dữ liệu) trong Big Data dùng để chỉ điều gì?

A. Một kho lưu trữ dữ liệu được cấu trúc chặt chẽ và được thiết kế cho các truy vấn SQL.
B. Một kho lưu trữ dữ liệu lớn, nơi dữ liệu được lưu trữ ở định dạng gốc của nó cho đến khi cần thiết.
C. Một kỹ thuật nén dữ liệu để giảm dung lượng lưu trữ.
D. Một phương pháp trực quan hóa dữ liệu để dễ dàng hiểu được các mẫu và xu hướng.

27. Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu Big Data?

A. Microsoft Word.
B. Tableau.
C. Microsoft PowerPoint.
D. Adobe Illustrator.

28. Công nghệ nào sau đây cung cấp khả năng xử lý dữ liệu theo lô (batch processing) trong hệ sinh thái Hadoop?

A. Spark.
B. Flink.
C. MapReduce.
D. Kafka.

29. Đặc điểm `Veracity` trong Big Data đề cập đến khía cạnh nào?

A. Số lượng dữ liệu được tạo ra.
B. Tốc độ tạo ra dữ liệu.
C. Sự đa dạng của các loại dữ liệu.
D. Độ chính xác và tin cậy của dữ liệu.

30. Ứng dụng nào sau đây của Big Data được sử dụng để phát hiện gian lận trong các giao dịch tài chính?

A. Phân tích dự đoán.
B. Phân tích rủi ro.
C. Phân tích gian lận.
D. Phân tích chuỗi cung ứng.

1 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

1. Trong Big Data, thuật ngữ 'Lambda Architecture' đề cập đến điều gì?

2 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

2. Ứng dụng nào sau đây của Big Data được sử dụng để tối ưu hóa chuỗi cung ứng và giảm chi phí vận chuyển?

3 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

3. Trong Big Data, thuật ngữ 'Schema on Read' có nghĩa là gì?

4 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

4. Công cụ nào sau đây được sử dụng để xây dựng các pipeline xử lý dữ liệu (data processing pipelines) trong Big Data?

5 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

5. Ứng dụng nào sau đây của Big Data được sử dụng để cải thiện trải nghiệm khách hàng bằng cách cá nhân hóa các đề xuất và quảng cáo?

6 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

6. Công cụ nào sau đây thường được sử dụng để truy vấn và phân tích dữ liệu trong Hadoop?

7 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

7. Trong ngữ cảnh của Big Data, thuật ngữ 'Data Mining' (Khai phá dữ liệu) đề cập đến điều gì?

8 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

8. Hệ thống nào sau đây thường được sử dụng để quản lý và điều phối các tài nguyên trong một cluster Hadoop?

9 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

9. Trong Big Data, 'Data Cleansing' (Làm sạch dữ liệu) là gì?

10 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

10. Kỹ thuật nào sau đây được sử dụng để giảm kích thước dữ liệu trong Big Data mà vẫn giữ được thông tin quan trọng?

11 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

11. Công nghệ nào sau đây thường được sử dụng để xử lý và phân tích dữ liệu lớn trong môi trường phân tán?

12 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

12. Ứng dụng nào sau đây của Big Data được sử dụng để dự đoán xu hướng thị trường và hành vi của người tiêu dùng?

13 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

13. Trong lĩnh vực Big Data, 'Data Governance' (Quản trị dữ liệu) đề cập đến điều gì?

14 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

14. Trong Big Data, 'Data Integration' (Tích hợp dữ liệu) là gì?

15 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

15. Yếu tố nào sau đây không thuộc '5V' của Big Data?

16 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

16. Trong Big Data, 'MapReduce' là gì?

17 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

17. Trong Big Data, 'Data Security' (Bảo mật dữ liệu) bao gồm những biện pháp nào?

18 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

18. Trong Big Data, 'Data Discovery' (Khám phá dữ liệu) là gì?

19 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

19. Trong ngữ cảnh của Big Data, đặc điểm 'Variety' đề cập đến điều gì?

20 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

20. Phương pháp nào sau đây được sử dụng để xử lý dữ liệu theo thời gian thực trong Big Data?

21 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

21. Công nghệ nào sau đây được sử dụng để thu thập và xử lý dữ liệu từ các thiết bị IoT (Internet of Things)?

22 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

22. Trong Big Data, 'Data Warehouse' (Kho dữ liệu) khác với 'Data Lake' (Hồ dữ liệu) như thế nào?

23 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

23. Công cụ nào sau đây thường được sử dụng để xử lý các truy vấn SQL trên dữ liệu lưu trữ trong HDFS?

24 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

24. Hệ thống nào sau đây được thiết kế để xử lý các truy vấn phức tạp trên lượng lớn dữ liệu một cách nhanh chóng?

25 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

25. Trong kiến trúc Big Data, thành phần nào chịu trách nhiệm thu thập và chuyển dữ liệu từ nhiều nguồn khác nhau vào hệ thống?

26 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

26. Thuật ngữ 'Data Lake' (Hồ dữ liệu) trong Big Data dùng để chỉ điều gì?

27 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

27. Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu Big Data?

28 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

28. Công nghệ nào sau đây cung cấp khả năng xử lý dữ liệu theo lô (batch processing) trong hệ sinh thái Hadoop?

29 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

29. Đặc điểm 'Veracity' trong Big Data đề cập đến khía cạnh nào?

30 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

30. Ứng dụng nào sau đây của Big Data được sử dụng để phát hiện gian lận trong các giao dịch tài chính?