Đề 1 – Đề thi, câu hỏi trắc nghiệm online Dữ liệu lớn (BigData)

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Dữ liệu lớn (BigData)

Đề 1 - Đề thi, câu hỏi trắc nghiệm online Dữ liệu lớn (BigData)

1. Trong Big Data, `data visualization` (trực quan hóa dữ liệu) đóng vai trò gì?

A. Làm cho dữ liệu trở nên khó hiểu hơn.
B. Giúp người dùng dễ dàng hiểu và khám phá các mẫu, xu hướng trong dữ liệu.
C. Tăng kích thước của cơ sở dữ liệu.
D. Bảo vệ dữ liệu khỏi bị xóa.

2. Trong Big Data, `data security` (bảo mật dữ liệu) bao gồm những biện pháp nào?

A. Chỉ mã hóa dữ liệu.
B. Chỉ sao lưu dữ liệu.
C. Mã hóa, kiểm soát truy cập, giám sát và các biện pháp khác để bảo vệ dữ liệu khỏi truy cập trái phép.
D. Chỉ sử dụng mật khẩu mạnh.

3. Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu (data visualization) trong Big Data?

A. Microsoft Word
B. Tableau
C. Adobe Photoshop
D. Microsoft Outlook

4. Trong Big Data, `data integration` (tích hợp dữ liệu) là gì?

A. Việc chia nhỏ dữ liệu thành các phần nhỏ hơn.
B. Việc kết hợp dữ liệu từ nhiều nguồn khác nhau thành một tập dữ liệu thống nhất.
C. Việc xóa bỏ dữ liệu trùng lặp.
D. Việc mã hóa dữ liệu để bảo mật.

5. Đâu là một lợi ích của việc sử dụng `in-memory computing` (điện toán trong bộ nhớ) trong Big Data?

A. Giảm chi phí lưu trữ dữ liệu.
B. Tăng tốc độ xử lý dữ liệu bằng cách lưu trữ dữ liệu trong bộ nhớ RAM thay vì trên ổ cứng.
C. Đơn giản hóa việc quản lý dữ liệu.
D. Tăng cường bảo mật dữ liệu.

6. Đâu là một ví dụ về dữ liệu `velocity` (tốc độ) trong Big Data?

A. Lịch sử mua hàng của khách hàng trong một năm.
B. Số lượng bài đăng trên mạng xã hội mỗi giây.
C. Thông tin nhân khẩu học của dân số một quốc gia.
D. Danh sách các sản phẩm trong một cửa hàng trực tuyến.

7. Công cụ nào sau đây thường được sử dụng để thực hiện các truy vấn và phân tích dữ liệu trên Hadoop?

A. Microsoft Excel
B. Hive
C. Adobe Photoshop
D. Microsoft Word

8. Đâu là một ví dụ về ứng dụng của Big Data trong lĩnh vực giao thông vận tải?

A. Thiết kế nội thất xe hơi.
B. Tối ưu hóa lưu lượng giao thông, dự đoán tắc nghẽn và cải thiện hệ thống giao thông công cộng.
C. In 3D các bộ phận xe hơi.
D. Sử dụng mạng xã hội để quảng cáo xe hơi.

9. Trong ngữ cảnh Big Data, `data wrangling` (xử lý dữ liệu) là gì?

A. Việc lưu trữ dữ liệu trên các thiết bị di động.
B. Việc thu thập dữ liệu từ các nguồn công cộng.
C. Việc làm sạch, chuyển đổi và chuẩn bị dữ liệu để phân tích.
D. Việc mã hóa dữ liệu để bảo mật.

10. Công cụ nào sau đây thường được sử dụng để xây dựng các pipeline xử lý dữ liệu (data pipeline) trong Big Data?

A. Microsoft PowerPoint
B. Apache Kafka
C. Adobe Illustrator
D. Microsoft Access

11. Khi nói về `data mining` (khai thác dữ liệu) trong Big Data, chúng ta thường muốn đạt được điều gì?

A. Xóa bỏ dữ liệu trùng lặp.
B. Tìm kiếm các mẫu, xu hướng và thông tin hữu ích ẩn sâu trong khối lượng dữ liệu lớn.
C. Tăng tốc độ truy cập dữ liệu.
D. Giảm kích thước của cơ sở dữ liệu.

12. Trong Big Data, `machine learning` (học máy) được sử dụng để làm gì?

A. Lưu trữ dữ liệu hiệu quả hơn.
B. Tự động hóa việc phân tích dữ liệu, dự đoán và đưa ra quyết định.
C. Bảo vệ dữ liệu khỏi các cuộc tấn công mạng.
D. Tăng tốc độ truyền dữ liệu.

13. Ứng dụng nào sau đây thể hiện rõ nhất việc sử dụng Big Data trong lĩnh vực y tế?

A. Gửi email quảng cáo thuốc mới cho bệnh nhân.
B. Phân tích dữ liệu bệnh án để dự đoán dịch bệnh và cải thiện phương pháp điều trị.
C. Sử dụng mạng xã hội để thu thập thông tin cá nhân của bệnh nhân.
D. Lưu trữ thông tin bệnh nhân trong một cơ sở dữ liệu tập trung.

14. Trong lĩnh vực marketing, Big Data được sử dụng để làm gì?

A. Gửi thư rác hàng loạt cho khách hàng.
B. Phân tích hành vi khách hàng, cá nhân hóa trải nghiệm và tối ưu hóa chiến dịch quảng cáo.
C. Tăng giá sản phẩm một cách ngẫu nhiên.
D. Giảm chi phí nghiên cứu thị trường.

15. Trong ngữ cảnh của Big Data, `data lake` (hồ dữ liệu) khác biệt so với `data warehouse` (kho dữ liệu) như thế nào?

A. Data lake lưu trữ dữ liệu đã qua xử lý và chuyển đổi, trong khi data warehouse lưu trữ dữ liệu thô.
B. Data lake lưu trữ dữ liệu có cấu trúc, trong khi data warehouse lưu trữ dữ liệu phi cấu trúc.
C. Data lake lưu trữ dữ liệu thô ở định dạng gốc, trong khi data warehouse lưu trữ dữ liệu đã được xử lý và chuyển đổi cho mục đích cụ thể.
D. Data lake chỉ có thể truy cập bởi các nhà khoa học dữ liệu, trong khi data warehouse có thể truy cập bởi người dùng doanh nghiệp.

16. Điều gì KHÔNG phải là một lợi ích của việc sử dụng điện toán đám mây (cloud computing) cho Big Data?

A. Khả năng mở rộng linh hoạt theo nhu cầu.
B. Chi phí đầu tư ban đầu thấp.
C. Bảo mật dữ liệu tuyệt đối.
D. Truy cập dữ liệu từ mọi nơi.

17. Ứng dụng nào sau đây KHÔNG phải là một ứng dụng phổ biến của Big Data trong lĩnh vực tài chính?

A. Phát hiện gian lận.
B. Đánh giá rủi ro tín dụng.
C. Cá nhân hóa dịch vụ khách hàng.
D. Thiết kế logo cho ngân hàng.

18. Điều gì KHÔNG phải là một thách thức khi triển khai các dự án Big Data?

A. Thiếu hụt kỹ năng chuyên môn.
B. Khả năng mở rộng của hạ tầng.
C. Tính phức tạp của các công nghệ.
D. Dễ dàng tìm thấy dữ liệu chất lượng cao.

19. Sự khác biệt chính giữa `batch processing` và `stream processing` trong Big Data là gì?

A. Batch processing xử lý dữ liệu theo thời gian thực, trong khi stream processing xử lý dữ liệu theo lô.
B. Batch processing xử lý dữ liệu theo lô lớn, trong khi stream processing xử lý dữ liệu liên tục theo thời gian thực.
C. Batch processing chỉ có thể xử lý dữ liệu có cấu trúc, trong khi stream processing có thể xử lý dữ liệu phi cấu trúc.
D. Batch processing sử dụng ít tài nguyên hơn stream processing.

20. Ứng dụng nào sau đây KHÔNG phải là một ứng dụng của Big Data trong lĩnh vực bán lẻ?

A. Dự đoán nhu cầu sản phẩm.
B. Tối ưu hóa giá cả.
C. Cá nhân hóa trải nghiệm mua sắm.
D. Thiết kế bao bì sản phẩm.

21. Trong Big Data, `data discovery` (khám phá dữ liệu) là gì?

A. Việc tìm kiếm các nguồn dữ liệu mới.
B. Việc tìm kiếm các mẫu, xu hướng và thông tin hữu ích trong dữ liệu hiện có.
C. Việc xóa bỏ dữ liệu không cần thiết.
D. Việc chuyển đổi dữ liệu sang định dạng khác.

22. Đâu là một thách thức lớn khi làm việc với Big Data liên quan đến vấn đề bảo mật và quyền riêng tư?

A. Khó khăn trong việc sao lưu và phục hồi dữ liệu.
B. Đảm bảo dữ liệu không bị truy cập trái phép và tuân thủ các quy định về bảo vệ dữ liệu cá nhân.
C. Chi phí lưu trữ dữ liệu quá cao.
D. Thiếu nhân lực có kỹ năng phân tích dữ liệu.

23. Đâu là một trong những đặc điểm `V` quan trọng nhất của Big Data, thường được xem là yếu tố làm cho dữ liệu trở nên `lớn`?

A. Veracity (Tính xác thực)
B. Variety (Tính đa dạng)
C. Velocity (Tốc độ)
D. Volume (Dung lượng)

24. Công nghệ nào sau đây thường được sử dụng để xử lý dữ liệu lớn, đặc biệt là khi dữ liệu đó không phù hợp với một cơ sở dữ liệu quan hệ truyền thống?

A. SQL Server
B. Hadoop
C. Oracle Database
D. MySQL

25. Trong Big Data, kỹ thuật `data aggregation` (tổng hợp dữ liệu) dùng để làm gì?

A. Chia nhỏ dữ liệu thành các phần nhỏ hơn.
B. Kết hợp dữ liệu từ nhiều nguồn khác nhau để tạo ra một tập dữ liệu lớn hơn.
C. Lọc bỏ dữ liệu không liên quan.
D. Mã hóa dữ liệu để bảo mật.

26. Trong Big Data, `data quality` (chất lượng dữ liệu) là gì?

A. Số lượng dữ liệu có sẵn.
B. Độ chính xác, đầy đủ, nhất quán và kịp thời của dữ liệu.
C. Tốc độ truy cập dữ liệu.
D. Chi phí lưu trữ dữ liệu.

27. Công cụ nào sau đây thường được sử dụng để thu thập và xử lý dữ liệu nhật ký (log data) trong Big Data?

A. Microsoft Paint
B. Elasticsearch
C. Adobe Premiere
D. Microsoft Outlook

28. Trong kiến trúc Hadoop, thành phần nào chịu trách nhiệm lưu trữ dữ liệu?

A. YARN (Yet Another Resource Negotiator)
B. MapReduce
C. HDFS (Hadoop Distributed File System)
D. Hive

29. Trong Big Data, thuật ngữ `data governance` (quản trị dữ liệu) đề cập đến điều gì?

A. Việc mã hóa tất cả dữ liệu.
B. Việc quản lý, bảo vệ và đảm bảo chất lượng dữ liệu trong toàn tổ chức.
C. Việc di chuyển dữ liệu lên đám mây.
D. Việc sử dụng các công cụ trực quan hóa dữ liệu.

30. Thuật ngữ `NoSQL` dùng để chỉ loại cơ sở dữ liệu nào?

A. Cơ sở dữ liệu chỉ hỗ trợ ngôn ngữ SQL.
B. Cơ sở dữ liệu không tuân theo mô hình quan hệ truyền thống.
C. Cơ sở dữ liệu được thiết kế để xử lý dữ liệu số.
D. Cơ sở dữ liệu không yêu cầu lược đồ cố định.

1 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

1. Trong Big Data, 'data visualization' (trực quan hóa dữ liệu) đóng vai trò gì?

2 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

2. Trong Big Data, 'data security' (bảo mật dữ liệu) bao gồm những biện pháp nào?

3 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

3. Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu (data visualization) trong Big Data?

4 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

4. Trong Big Data, 'data integration' (tích hợp dữ liệu) là gì?

5 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

5. Đâu là một lợi ích của việc sử dụng 'in-memory computing' (điện toán trong bộ nhớ) trong Big Data?

6 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

6. Đâu là một ví dụ về dữ liệu 'velocity' (tốc độ) trong Big Data?

7 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

7. Công cụ nào sau đây thường được sử dụng để thực hiện các truy vấn và phân tích dữ liệu trên Hadoop?

8 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

8. Đâu là một ví dụ về ứng dụng của Big Data trong lĩnh vực giao thông vận tải?

9 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

9. Trong ngữ cảnh Big Data, 'data wrangling' (xử lý dữ liệu) là gì?

10 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

10. Công cụ nào sau đây thường được sử dụng để xây dựng các pipeline xử lý dữ liệu (data pipeline) trong Big Data?

11 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

11. Khi nói về 'data mining' (khai thác dữ liệu) trong Big Data, chúng ta thường muốn đạt được điều gì?

12 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

12. Trong Big Data, 'machine learning' (học máy) được sử dụng để làm gì?

13 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

13. Ứng dụng nào sau đây thể hiện rõ nhất việc sử dụng Big Data trong lĩnh vực y tế?

14 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

14. Trong lĩnh vực marketing, Big Data được sử dụng để làm gì?

15 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

15. Trong ngữ cảnh của Big Data, 'data lake' (hồ dữ liệu) khác biệt so với 'data warehouse' (kho dữ liệu) như thế nào?

16 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

16. Điều gì KHÔNG phải là một lợi ích của việc sử dụng điện toán đám mây (cloud computing) cho Big Data?

17 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

17. Ứng dụng nào sau đây KHÔNG phải là một ứng dụng phổ biến của Big Data trong lĩnh vực tài chính?

18 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

18. Điều gì KHÔNG phải là một thách thức khi triển khai các dự án Big Data?

19 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

19. Sự khác biệt chính giữa 'batch processing' và 'stream processing' trong Big Data là gì?

20 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

20. Ứng dụng nào sau đây KHÔNG phải là một ứng dụng của Big Data trong lĩnh vực bán lẻ?

21 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

21. Trong Big Data, 'data discovery' (khám phá dữ liệu) là gì?

22 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

22. Đâu là một thách thức lớn khi làm việc với Big Data liên quan đến vấn đề bảo mật và quyền riêng tư?

23 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

23. Đâu là một trong những đặc điểm 'V' quan trọng nhất của Big Data, thường được xem là yếu tố làm cho dữ liệu trở nên 'lớn'?

24 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

24. Công nghệ nào sau đây thường được sử dụng để xử lý dữ liệu lớn, đặc biệt là khi dữ liệu đó không phù hợp với một cơ sở dữ liệu quan hệ truyền thống?

25 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

25. Trong Big Data, kỹ thuật 'data aggregation' (tổng hợp dữ liệu) dùng để làm gì?

26 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

26. Trong Big Data, 'data quality' (chất lượng dữ liệu) là gì?

27 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

27. Công cụ nào sau đây thường được sử dụng để thu thập và xử lý dữ liệu nhật ký (log data) trong Big Data?

28 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

28. Trong kiến trúc Hadoop, thành phần nào chịu trách nhiệm lưu trữ dữ liệu?

29 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

29. Trong Big Data, thuật ngữ 'data governance' (quản trị dữ liệu) đề cập đến điều gì?

30 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 1

30. Thuật ngữ 'NoSQL' dùng để chỉ loại cơ sở dữ liệu nào?