Hệ thống phân tích tình trạng giao thông
Ứng dụng công cụ xử lý dữ liệu lớn thời
gian thực
Sinh viên thực hiện: Trương Hoàng Linh– 20102688
Bùi Duy Khánh - 20101702
Giáo viên hướng dẫn: TS. Trần Việt Trung
Nội Dung
Thiết kế hệ thống
Lựa chọn công nghệ
Tích hợp hệ thống
Khai phá dữ liệu
Thử nghiệm và đánh giá
Giới thiệu chung
Kết luận
2
Nội Dung
Thiết kế hệ thống
Lựa chọn công nghệ
Tích hợp hệ thống
Khai phá dữ liệu
Thử nghiệm và đánh giá
Giới thiệu chung
Kết luận
Giới thiệu chung
3
Đặt vấn đề
 Hiện trạng giao thông
 Cơ sở hạ tầng
 Ý thức người tham gia
giao thông
 Ùn tắc trầm trọng
 Thu thập dữ liệu giao thông (91/2009/NĐCP)
 150.000 phương tiện lắp đặt
thiết bị GPS (2011), thêm
15.000 phương tiện mỗi năm
 Gửi dữ liệu 30s/lần.
 Dữ liệu lớn, liên tục
4
Giải pháp
5
HỆ
THỐNG
XỬ LÝ DỮ
LIỆU GIAO
THÔNG
Xử lý thời gian thực
Độ tin cậy
Hiển thị trực quan
Kết quả đạt được
Giao diện trang chủ
6
Kết quả đạt được
Giao diện hiển thị tình trạng giao thông thời gian thực
7
Kết quả đạt được
Giao diện tìm đường đi
8
Các bước thực hiện đồ án
 Phân tích dữ liệu thô
 Xây dựng hệ thống
• TÌm hiểu
 Khai phá dữ liệu
 Hiển thị
 So sánh, đánh giá
9
Phương pháp
Map matching
Nội Dung
Thiết kế hệ thống
Lựa chọn công nghệ
Tích hợp hệ thống
Khai phá dữ liệu
Thử nghiệm và đánh giá
Giới thiệu chung
Kết luận
Thiết kế hệ thống
10
Thiết kế hệ thống
Mô hình tổng thể của hệ thống
11
Đảm bảo:
- Không mất mát dữ liệu
- Xử lý dữ liệu thời gian thực
- Lưu trữ kết quả xử lý
Khối khai phá dữ liệu – Mô hình chi tiết
Mô hình chi tiết khối khai phá dữ liệu
-Thông lượng cao
-Không mất mát dữ liệu
-Dễ dàng mở rộng
-Xử lý nhanh chóng
-Khả năng xử lý liên tục
-Dễ dàng mở rộng
-Khả năng chịu lỗi
Thông lượng cao
-Lưu trữ khối lượng dữ liệu lớn
-Dễ dàng mở rộng
-Ghi dữ liệu nhanh chóng
12
Nội Dung
Thiết kế hệ thống
Lựa chọn công nghệ
Tích hợp hệ thống
Khai phá dữ liệu
Thử nghiệm và đánh giá
Giới thiệu chung
Kết luận
Lựa chọn công nghệ
13
 Hệ thống truyền thông điệp phân tán
 Thành phần
• Topic
• Broker
• Partition
• Producer
• Consumer
 Đặc điểm
• Khả năng mở rộng
• Thông lượng cao
• Độ tin cậy
Kiến trúc của Kafka
Hàng đợi thông điệp – Apache Kafka
14
Xử lý luồng dữ liệu phân tán – Spark Streaming
 Apache Spark
 Thành phần chính
 Mô hình hoạt động trên cụm
15
RDD
-Tập hợp dữ liệu đầu vào
-Chia thành các partition
-Phân phối trên các node
-Xử lý trên bộ nhớ trong
-Lưu lại các thao tác sinh ra
nó
nhanh
Driver
Worker
-Lập lịch, điều phối nhiệm vụ
-Thực hiện nhiệm vụ
-Lưu trữ dữ liệu RDD
(cache)
-Lưu trữ dữ liệu đầu vào
Chịu lỗi
API mức cao Thuận tiện, dễ
dàng
Xử lý luồng dữ liệu phân tán – Spark Streaming
Kiến trúc của Spark Streaming
16
Xử lý liên tục
RDD
DStream
Xử lý luồng dữ liệu phân tán – Spark Streaming
 Áp dụng một thao tác biến đổi trên DStream
17
Cơ sở dữ liệu - MongoDb
 Dễ sử dụng
 Đảm bảo cơ chế ghi tốc độ cao và tin cậy
 Các thành phần chính
 Collection
 Document
18
Xử lý luồng dữ liệu phân tán – Apache Storm
 Hệ thống tính toán phân tán mã nguồn mở thời
gian thực miễn phí
Kiến trúc của Apache Storm
 Các thành phần chính
 Topology
• Đồ thị tính toán xử lý các luồng dữ liệu liên tục
• Các thành phần
– Spout
– Bolt
– Các liên kết
– Bộ phận giám sát lỗi
Xử lý luồng dữ liệu phân tán – Apache Storm
Chịu lỗi
Tốc độ xử lý
nhanh
Spout A
Bolt B
Bolt D
Bolt C
Cơ sở dữ liệu - Geomesa
 Đánh chỉ mục dữ liệu theo tọa độ
Hệ sinh thái Accumulo
Cơ sở dữ liệu Geomesa
Nội Dung
Thiết kế hệ thống
Lựa chọn công nghệ
Tích hợp hệ thống
Khai phá dữ liệu
Thử nghiệm và đánh giá
Giới thiệu chung
Kết luận
Tích hợp hệ thống
22
Tích hợp hệ thống
23
Spark Streaming
24
1429847742000,D5DAE94,106.715
82139756944,10.747578125,11.1
<32578711-1, (1/39.5,1) >
<0, (1/11.2,1) >
<32578711-1, (1/39.5,1) >
<32578711-1, (4.8,200) >
<32578711-1, (41.67 ,200) >
32578711-1-41.67-200
Mô-đun kết nối
25
Kafka Spout
Reverse
GeoCode
Bolt
Statistic
Bolt
Kafka
Bolt
Storage
Bolt
1429847742000,D5DAE94,106.71582139756944,
10.747578125,11.1
<32578711-1,(1/39.5)>
32578711-1-41.67-200
32578711-1-41.67-200
1429847742000,D5DAE94,106.71582139756944,
10.747578125,11.1
Apache Storm
Nội Dung
Thiết kế hệ thống
Lựa chọn công nghệ
Tích hợp hệ thống
Khai phá dữ liệu
Thử nghiệm và đánh giá
Giới thiệu chung
Kết luận
Khai phá dữ liệu
27
Cơ sở lý thuyết
28
Định dạng dữ liệu
Trong đó:
 time_stamp: Thời gian dữ liệu GPS được gửi
lên
 car_id: Id của xe
 lon: Kinh độ
 lat: Vĩ độ
 Speed: Tốc độ của xe
Cơ sở lý thuyết
Ánh xạ tọa độ vào đường
Phương pháp ánh xạ tọa độ điểm-điểm
 Tính vận tốc trung bình
 Vận tốc của một phương tiện giao thông
𝑣𝑖 =
𝐷
𝑡𝑖
 Vận tốc trung bình trong khoảng thời gian ti
𝑣𝑠 =
𝑖=1
𝑁
𝐷
𝑖=1
𝑁
𝑡𝑖
=
𝑁 × 𝐷
𝑖=1
𝑁 𝐷
𝑣𝑖
=
𝑁
𝑖=1
𝑁 1
𝑣𝑖
29
Tiền xử lý dữ liệu
Cấu trúc dữ liệu bản đồ OSM
 Trích xuất dữ liệu
30
Khai phá dữ liệu
Thuật toán ánh xạ tọa độ sử dụng cây k-d
 Thuật toán tìm láng giềng gần nhất trên cây k-d
 Thuật toán ánh xạ tọa độ vào đường
• Hệ tọa độ: Cartesian
• Thuật toán
31
Nội Dung
Thiết kế hệ thống
Lựa chọn công nghệ
Tích hợp hệ thống
Khai phá dữ liệu
Thử nghiệm và đánh giá
Giới thiệu chung
Kết luận
Thử nghiệm và đánh giá
32
Thử nghiệm và đánh giá
Cài đặt
Kết quả thử nghiệm
Dữ liệu thử nghiệm
Kết quả
33
Thử nghiệm và đánh giá
So sánh Spark và Storm
34
0
5
10
15
20
25
3.200.000 bản ghi 8.500.000 bản ghi
Đỗ trễ
0
100
200
300
400
500
600
700
800
900
1000
3.200.000 bản ghi 8.500.000 bản ghi
Tốc độ xử lý
Spark Streaming
Storm
Kết quả đạt được
So sánh Spark Streaming và Storm
35
0
5
10
15
20
25
3.200.000 bản ghi 8.500.000 bản ghi
Đỗ trễ
(giây)
0
100
200
300
400
500
600
700
800
900
1000
3.200.000 bản ghi 8.500.000 bản ghi
Tốc độ xử lý
Spark Streaming
Storm
(giây)
Tích hợp hệ thống
 Cải tiến đảm bảo dữ liệu được xử lý duy nhất.
 Vấn đề của Spark Streaming với Kafka dùng bộ nhận:
• Dữ liệu nhận từ Kafka có thể trùng lặp
• Kết quả ra hệ thống ngoài có thể không đầy đủ.
 Phương pháp:
1. Xây dựng mô-đun lấy dữ liệu cùng id trong Kafka
2. Tạo transaction với id đó, đẩy dữ liệu kết quả vào mongodb
3. Hệ thống lỗi => dùng id cũ trong mongodb => lấy dữ liệu và xử lý
lại
36
Nội Dung
Thiết kế hệ thống
Lựa chọn công nghệ
Tích hợp hệ thống
Khai phá dữ liệu
Thử nghiệm và đánh giá
Giới thiệu chung
Kết luậnKết luận
37
Kết luận
Kết quả đạt được
Những điểm hạn chế
Định hướng phát triển
38
Tài liệu tham khảo
 Andrew W.Moore: An introductory tutorial on kd-tree, Cargeghie Mellon
University, Canada
 Robert F. Sproull: Refinements to Nearest-Neighbor Searching in k-
Dimensional Trees.
 M. Otair: Approximate k-nearest neighbour based spatial clustering using k-d
tree. International Journal of Database Management Systems 5(1) (2013).
 P. Taylor Goetz, Hortonworks: Apache Storm and Apache Spark Streaming
Compared.
 Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia: Learning
Spark, Lightning- Fast Big Data Analysis.
 Ugur Demiryurek, Farnoush Banaei-Kashani, Cyrus Shahabi, and Anand
Ranganathan: Online Computation of Fastest Path in Time-Dependent
Spatial Networks, University of Southern California- Department of
Computer Science Los Angeles, CA USA.
 https://www.openstreetmap.org/
 Nguyễn Đức Vinh, Hệ thống phân tích tình trạng giao thông – Xây dựng ứng
dụng phía người dùng, Đồ án tốt nghiệp Kỹ sư, Trường Đại học Bách Khoa
Hà Nội, Việt Nam, 2015
39
www.themegallery.com
Cảm ơn thầy cô và
các bạn đã lắng nghe!
Cải tiến
41
Spark Streaming
Kafka
Thông điệp
Nhận và sao
chép
 Vấn đề của Spark Streaming với Kafka dùng bộ nhận
 Có thể trùng lặp dữ liệu đầu vào
Thông báo
Trùng lặp dữ liệu
đầu vào
Cải tiến
42
Spark StreamingKafka
Thông điệp
Tôi xử lý
xong lô này
rồi
Spark Streaming
lỗi, dữ liệu đẩy ra
chưa hết
 Vấn đề của Spark Streaming với Kafka dùng bộ nhận
 Có thể mất dữ liệu kết quả
Tôi đẩy dữ
liệu ra
Cải tiến
43
 Giải pháp
 .
1. Viết lại bộ nhận
2. Tạo transaction
<id đầu, Thông điệp>
………………………
………………………
………………………
<id cuối, Thông điệp>
RDD
Spark Streaming
<id, Thông điệp>
Kafka
Khởi tạo transaction
<id transaction, id đầu, id cuối, trạng thái>
PROCESSING
FINISH

Hệ thống phân tích tình trạng giao thông: Ứng dụng công cụ xử lý dữ liệu lớn thời gian thực

  • 1.
    Hệ thống phântích tình trạng giao thông Ứng dụng công cụ xử lý dữ liệu lớn thời gian thực Sinh viên thực hiện: Trương Hoàng Linh– 20102688 Bùi Duy Khánh - 20101702 Giáo viên hướng dẫn: TS. Trần Việt Trung
  • 2.
    Nội Dung Thiết kếhệ thống Lựa chọn công nghệ Tích hợp hệ thống Khai phá dữ liệu Thử nghiệm và đánh giá Giới thiệu chung Kết luận 2
  • 3.
    Nội Dung Thiết kếhệ thống Lựa chọn công nghệ Tích hợp hệ thống Khai phá dữ liệu Thử nghiệm và đánh giá Giới thiệu chung Kết luận Giới thiệu chung 3
  • 4.
    Đặt vấn đề Hiện trạng giao thông  Cơ sở hạ tầng  Ý thức người tham gia giao thông  Ùn tắc trầm trọng  Thu thập dữ liệu giao thông (91/2009/NĐCP)  150.000 phương tiện lắp đặt thiết bị GPS (2011), thêm 15.000 phương tiện mỗi năm  Gửi dữ liệu 30s/lần.  Dữ liệu lớn, liên tục 4
  • 5.
    Giải pháp 5 HỆ THỐNG XỬ LÝDỮ LIỆU GIAO THÔNG Xử lý thời gian thực Độ tin cậy Hiển thị trực quan
  • 6.
    Kết quả đạtđược Giao diện trang chủ 6
  • 7.
    Kết quả đạtđược Giao diện hiển thị tình trạng giao thông thời gian thực 7
  • 8.
    Kết quả đạtđược Giao diện tìm đường đi 8
  • 9.
    Các bước thựchiện đồ án  Phân tích dữ liệu thô  Xây dựng hệ thống • TÌm hiểu  Khai phá dữ liệu  Hiển thị  So sánh, đánh giá 9 Phương pháp Map matching
  • 10.
    Nội Dung Thiết kếhệ thống Lựa chọn công nghệ Tích hợp hệ thống Khai phá dữ liệu Thử nghiệm và đánh giá Giới thiệu chung Kết luận Thiết kế hệ thống 10
  • 11.
    Thiết kế hệthống Mô hình tổng thể của hệ thống 11 Đảm bảo: - Không mất mát dữ liệu - Xử lý dữ liệu thời gian thực - Lưu trữ kết quả xử lý
  • 12.
    Khối khai phádữ liệu – Mô hình chi tiết Mô hình chi tiết khối khai phá dữ liệu -Thông lượng cao -Không mất mát dữ liệu -Dễ dàng mở rộng -Xử lý nhanh chóng -Khả năng xử lý liên tục -Dễ dàng mở rộng -Khả năng chịu lỗi Thông lượng cao -Lưu trữ khối lượng dữ liệu lớn -Dễ dàng mở rộng -Ghi dữ liệu nhanh chóng 12
  • 13.
    Nội Dung Thiết kếhệ thống Lựa chọn công nghệ Tích hợp hệ thống Khai phá dữ liệu Thử nghiệm và đánh giá Giới thiệu chung Kết luận Lựa chọn công nghệ 13
  • 14.
     Hệ thốngtruyền thông điệp phân tán  Thành phần • Topic • Broker • Partition • Producer • Consumer  Đặc điểm • Khả năng mở rộng • Thông lượng cao • Độ tin cậy Kiến trúc của Kafka Hàng đợi thông điệp – Apache Kafka 14
  • 15.
    Xử lý luồngdữ liệu phân tán – Spark Streaming  Apache Spark  Thành phần chính  Mô hình hoạt động trên cụm 15 RDD -Tập hợp dữ liệu đầu vào -Chia thành các partition -Phân phối trên các node -Xử lý trên bộ nhớ trong -Lưu lại các thao tác sinh ra nó nhanh Driver Worker -Lập lịch, điều phối nhiệm vụ -Thực hiện nhiệm vụ -Lưu trữ dữ liệu RDD (cache) -Lưu trữ dữ liệu đầu vào Chịu lỗi API mức cao Thuận tiện, dễ dàng
  • 16.
    Xử lý luồngdữ liệu phân tán – Spark Streaming Kiến trúc của Spark Streaming 16 Xử lý liên tục RDD DStream
  • 17.
    Xử lý luồngdữ liệu phân tán – Spark Streaming  Áp dụng một thao tác biến đổi trên DStream 17
  • 18.
    Cơ sở dữliệu - MongoDb  Dễ sử dụng  Đảm bảo cơ chế ghi tốc độ cao và tin cậy  Các thành phần chính  Collection  Document 18
  • 19.
    Xử lý luồngdữ liệu phân tán – Apache Storm  Hệ thống tính toán phân tán mã nguồn mở thời gian thực miễn phí Kiến trúc của Apache Storm
  • 20.
     Các thànhphần chính  Topology • Đồ thị tính toán xử lý các luồng dữ liệu liên tục • Các thành phần – Spout – Bolt – Các liên kết – Bộ phận giám sát lỗi Xử lý luồng dữ liệu phân tán – Apache Storm Chịu lỗi Tốc độ xử lý nhanh Spout A Bolt B Bolt D Bolt C
  • 21.
    Cơ sở dữliệu - Geomesa  Đánh chỉ mục dữ liệu theo tọa độ Hệ sinh thái Accumulo Cơ sở dữ liệu Geomesa
  • 22.
    Nội Dung Thiết kếhệ thống Lựa chọn công nghệ Tích hợp hệ thống Khai phá dữ liệu Thử nghiệm và đánh giá Giới thiệu chung Kết luận Tích hợp hệ thống 22
  • 23.
    Tích hợp hệthống 23
  • 24.
    Spark Streaming 24 1429847742000,D5DAE94,106.715 82139756944,10.747578125,11.1 <32578711-1, (1/39.5,1)> <0, (1/11.2,1) > <32578711-1, (1/39.5,1) > <32578711-1, (4.8,200) > <32578711-1, (41.67 ,200) > 32578711-1-41.67-200
  • 25.
  • 26.
  • 27.
    Nội Dung Thiết kếhệ thống Lựa chọn công nghệ Tích hợp hệ thống Khai phá dữ liệu Thử nghiệm và đánh giá Giới thiệu chung Kết luận Khai phá dữ liệu 27
  • 28.
    Cơ sở lýthuyết 28 Định dạng dữ liệu Trong đó:  time_stamp: Thời gian dữ liệu GPS được gửi lên  car_id: Id của xe  lon: Kinh độ  lat: Vĩ độ  Speed: Tốc độ của xe
  • 29.
    Cơ sở lýthuyết Ánh xạ tọa độ vào đường Phương pháp ánh xạ tọa độ điểm-điểm  Tính vận tốc trung bình  Vận tốc của một phương tiện giao thông 𝑣𝑖 = 𝐷 𝑡𝑖  Vận tốc trung bình trong khoảng thời gian ti 𝑣𝑠 = 𝑖=1 𝑁 𝐷 𝑖=1 𝑁 𝑡𝑖 = 𝑁 × 𝐷 𝑖=1 𝑁 𝐷 𝑣𝑖 = 𝑁 𝑖=1 𝑁 1 𝑣𝑖 29
  • 30.
    Tiền xử lýdữ liệu Cấu trúc dữ liệu bản đồ OSM  Trích xuất dữ liệu 30
  • 31.
    Khai phá dữliệu Thuật toán ánh xạ tọa độ sử dụng cây k-d  Thuật toán tìm láng giềng gần nhất trên cây k-d  Thuật toán ánh xạ tọa độ vào đường • Hệ tọa độ: Cartesian • Thuật toán 31
  • 32.
    Nội Dung Thiết kếhệ thống Lựa chọn công nghệ Tích hợp hệ thống Khai phá dữ liệu Thử nghiệm và đánh giá Giới thiệu chung Kết luận Thử nghiệm và đánh giá 32
  • 33.
    Thử nghiệm vàđánh giá Cài đặt Kết quả thử nghiệm Dữ liệu thử nghiệm Kết quả 33
  • 34.
    Thử nghiệm vàđánh giá So sánh Spark và Storm 34 0 5 10 15 20 25 3.200.000 bản ghi 8.500.000 bản ghi Đỗ trễ 0 100 200 300 400 500 600 700 800 900 1000 3.200.000 bản ghi 8.500.000 bản ghi Tốc độ xử lý Spark Streaming Storm
  • 35.
    Kết quả đạtđược So sánh Spark Streaming và Storm 35 0 5 10 15 20 25 3.200.000 bản ghi 8.500.000 bản ghi Đỗ trễ (giây) 0 100 200 300 400 500 600 700 800 900 1000 3.200.000 bản ghi 8.500.000 bản ghi Tốc độ xử lý Spark Streaming Storm (giây)
  • 36.
    Tích hợp hệthống  Cải tiến đảm bảo dữ liệu được xử lý duy nhất.  Vấn đề của Spark Streaming với Kafka dùng bộ nhận: • Dữ liệu nhận từ Kafka có thể trùng lặp • Kết quả ra hệ thống ngoài có thể không đầy đủ.  Phương pháp: 1. Xây dựng mô-đun lấy dữ liệu cùng id trong Kafka 2. Tạo transaction với id đó, đẩy dữ liệu kết quả vào mongodb 3. Hệ thống lỗi => dùng id cũ trong mongodb => lấy dữ liệu và xử lý lại 36
  • 37.
    Nội Dung Thiết kếhệ thống Lựa chọn công nghệ Tích hợp hệ thống Khai phá dữ liệu Thử nghiệm và đánh giá Giới thiệu chung Kết luậnKết luận 37
  • 38.
    Kết luận Kết quảđạt được Những điểm hạn chế Định hướng phát triển 38
  • 39.
    Tài liệu thamkhảo  Andrew W.Moore: An introductory tutorial on kd-tree, Cargeghie Mellon University, Canada  Robert F. Sproull: Refinements to Nearest-Neighbor Searching in k- Dimensional Trees.  M. Otair: Approximate k-nearest neighbour based spatial clustering using k-d tree. International Journal of Database Management Systems 5(1) (2013).  P. Taylor Goetz, Hortonworks: Apache Storm and Apache Spark Streaming Compared.  Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia: Learning Spark, Lightning- Fast Big Data Analysis.  Ugur Demiryurek, Farnoush Banaei-Kashani, Cyrus Shahabi, and Anand Ranganathan: Online Computation of Fastest Path in Time-Dependent Spatial Networks, University of Southern California- Department of Computer Science Los Angeles, CA USA.  https://www.openstreetmap.org/  Nguyễn Đức Vinh, Hệ thống phân tích tình trạng giao thông – Xây dựng ứng dụng phía người dùng, Đồ án tốt nghiệp Kỹ sư, Trường Đại học Bách Khoa Hà Nội, Việt Nam, 2015 39
  • 40.
    www.themegallery.com Cảm ơn thầycô và các bạn đã lắng nghe!
  • 41.
    Cải tiến 41 Spark Streaming Kafka Thôngđiệp Nhận và sao chép  Vấn đề của Spark Streaming với Kafka dùng bộ nhận  Có thể trùng lặp dữ liệu đầu vào Thông báo Trùng lặp dữ liệu đầu vào
  • 42.
    Cải tiến 42 Spark StreamingKafka Thôngđiệp Tôi xử lý xong lô này rồi Spark Streaming lỗi, dữ liệu đẩy ra chưa hết  Vấn đề của Spark Streaming với Kafka dùng bộ nhận  Có thể mất dữ liệu kết quả Tôi đẩy dữ liệu ra
  • 43.
    Cải tiến 43  Giảipháp  . 1. Viết lại bộ nhận 2. Tạo transaction <id đầu, Thông điệp> ……………………… ……………………… ……………………… <id cuối, Thông điệp> RDD Spark Streaming <id, Thông điệp> Kafka Khởi tạo transaction <id transaction, id đầu, id cuối, trạng thái> PROCESSING FINISH

Editor's Notes

  • #2 1
  • #5 Sự gia tăng nhanh chóng về nhu cầu đi lại và số lượng các phương tiện tham gia giao thông tại các thành phố lớn trên thế giới nói chung và Việt Nam nói riêng đang gây một sức ép ko nhỏ lên hạ tầng giao thông đô thị khiến cho tình trạng ùn tắc liên tục diễn ra - Bên cạnh đó ý thức của người tham gia giao thông cũng trực tiếp gây ra những ảnh hưởng ko nhỏ khiến tình trạng ách tắc trầm trọng hơn Theo thông tư số 91/2009/ND-CP của bộ Giao thông vận tải, các phương tiện giao thông bắt buộc phải gắn các thiết bị giám sát hành trình khoảng 200.000 phương tiện đã lắp đặt Dữ liệu giám sát gửi 30 giây một lần về các trung tâm dữ liệu tập trung => lượng dữ liệu giao thông thu nhập đc là rất lớn và có đặc trưng của dữ liệu lớn. ( thuật ngữ để chỉ dữ liệu lớn và phức tạp mà ứng dụng xử lí truyền thống ko thể đáp ứng đc.
  • #6 Giải pháp của nhóm em là xây dựng một hệ thống - Khả năng xử lý, phân tích một khối lượng lớn dữ liệu giao thông trong thời gian thực và liên tục Và đảm bảo độ tin cậy Kết quả xử lý bao gồm thông tin về tình trạng giao thông của từng đoạn đường. Từ kết quả này thì hệ thống sẽ hiển thị trực quan thông qua giao diện website cho người dùng và cung cấp dịch vụ tìm đường đi với thời gian hành trình nhỏ nhất => Người tham gia giao thông có thể lựa chọn quãng đường di chuyển cho phù hợp => Các nhà quản lý có thể hoạch định các chính sách phát triển cơ sở hạ tầng để góp phần giảm thiểu tình trạng ách tắc
  • #7 6
  • #8 7
  • #9 8
  • #10 9
  • #12 11
  • #13 12
  • #17 16
  • #18 17
  • #26 25
  • #36 35