A Deep Dive into Secure Product Development Frameworks.pdf
Introduce BigData and MongoDB
1. Big Data & MongoDB
Reporter: Hung Teacher: Khoan
2. 01 What is Big Data?
Advantages and Disadvantages03
04 What is MongoDB?
Comparing MongoDB with MySQL05
CONTENTS
Characteristics Of Big Data02
Advantages and Disadvantages06
5. Big Data
Big Data is also data
but with a huge size.
Big Data is a term used
to describe a collection
of data that is huge in
size and yet growing
exponentially with
time.
01 What is Big Data?
9. VolumeVolume refers to the quantity of data generated
and stored by a Big Data system.
The data that is generated is completely heterogeneous in
the sense that it could be in various formats like video, text,
database, numeric, sensor data and so on
The rate at which new data is being generated all thanks to our
dependence on the internet, sensors, machine-to-machine
data is also important to parse Big Data in a timely manner.
Knowing whether the data that is available is coming from a
credible source is of utmost importance before deciphering and
implementing Big Data for business needs.
Variety
Velocity
Veracity
9
02 Characteristics Of Big Data
15. It’s an open source NoSQL database,
developed for high performance, high
availability, and easy scalability. Collection
and document are the two primarily used
terms/concepts in MongoDB.
These are a NoSQL database. It uses BSON
format for document storage and
communication with its client. BSON is a
binary form of JSON.
15
04 What is Mongo?
17. MongoDB Database Collections Document
Can contain one or more
collections
Can contain differnt types
of document(object)
Key value pair list of
array or nested document
04 Concepts in MongoDB
26. Advantages
1 2
5
4
Easy on Use
This easy to install and setup
No Complex Joins
MongoDB is based on BSON format – key-
value pair, hence no complex joins here.
Agility
It’s exceptionally easy to add or change
fields in MongoDB.
Many Supported Platform
MongoDB supports wide varieties of
platforms: Windows, Ubuntu, Debian,
Solaris, macOS.
06 Advantages of MongoDB
Due to its nature of using the internal
memory for the storage, it provides
fast access to the data.
Faster Access to Data
3
27. Disadvantages
1
2Joins not Supported
MongoDB doesn’t support joins
like a relational database.
High Memory Usage
Due to no functionality of joins,
there is data redundancy. This
results in increasing unnecessary
usage of memory.
Limited Data Size
You can have document size, not more
than 16MB.
06 Disadvantages of MongoDB
3
1/ What is Data?
- Data is any set of characters, It can be any character, including text and numbers, pictures, sound, or video.
- Within a computer's storage, data is a collection of numbers represented as bytes that are in turn composed of bits (binary digits) that can have the value one or zero.
=> In short such data is so large and complex that none of the traditional data management tools are able to store it or process it efficiently.
Nói tóm lại, dữ liệu đó quá lớn và phức tạp đến nỗi không có công cụ quản lý dữ liệu truyền thống nào có thể lưu trữ hoặc xử lý nó một cách hiệu quả.
Let's start by looking at what happens every minute from a broad perspective:
Hãy bắt đầu bằng cách nhìn vào những gì xảy ra mỗi phút từ một viễn cảnh rộng lớn:
Because of this, BigData was born
- Volume: Khối lượng đề cập đến số lượng dữ liệu được tạo và lưu trữ bởi hệ thống Dữ liệu lớn.
- Variety: Đa dạng: dữ liệu được tạo ra hoàn toàn không đồng nhất theo nghĩa là nó có thể ở các định dạng khác nhau như video, văn bản, cơ sở dữ liệu, số, dữ liệu cảm biến, v.v. và do đó hiểu loại Dữ liệu lớn là yếu tố chính để mở khóa giá trị của nó .
- Velocity: Vận tốc: tốc độ tạo ra dữ liệu mới nhờ vào sự phụ thuộc của chúng ta vào internet, cảm biến, dữ liệu từ máy đến máy cũng rất quan trọng để phân tích dữ liệu lớn kịp thời.
- Veracity: Tính xác thực: biết liệu dữ liệu có sẵn đến từ một nguồn đáng tin hay không là vô cùng quan trọng trước khi giải mã và triển khai Dữ liệu lớn cho nhu cầu kinh doanh.
heterogeneous : không đồng nhất
Veracity: độ chính xác
deciphering: giải mã
- Tăng năng suất
- Giảm chi phí
- Doanh thu tăng
- Dịch vụ khách hàng được cải thiện
- Rủi ro an ninh mạng
- Nhu cầu phần cứng
- Chi phí
- Đây là một cơ sở dữ liệu NoQuery mã nguồn mở, được phát triển cho hiệu năng cao, tính sẵn sàng cao và khả năng mở rộng dễ dàng. Bộ sưu tập và tài liệu là hai thuật ngữ / khái niệm được sử dụng chủ yếu trong MongoDB.
- Đây là một cơ sở dữ liệu NoQuery, được định hướng tài liệu đa nền tảng. Nó sử dụng định dạng BSON để lưu trữ tài liệu và liên lạc với khách hàng của mình. BSON là một dạng nhị phân của JSON.
Agility: Nhanh nhẹn
Nothing is fully complete or perfect. In spite of having so many advantages
High Memory Usage: Do không có chức năng của các phép nối, có sự dư thừa dữ liệu. Điều này dẫn đến việc tăng sử dụng bộ nhớ không cần thiết
redundancy: Dư, thừa