ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...
Cơ sở dữ liệu hướng đối tượng thời gian và xử lý truy vấn trong cơ sở dữ liệu hướng đối tượng thời gian.pdf
1. BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
-------------------------WX
WX
WX
WX
WX----------------------------
LUẬN VĂN THẠC SỸ KHOA HỌC
C S D NG
Ơ Ở Ữ LIỆU HƯỚ ĐỐI TƯỢNG THỜI GIAN
VÀ
X S D NG
Ử LÝ TRUY VẤN TRONG CƠ Ở Ữ LIỆU HƯỚ
ĐỐI TƯỢNG THỜI GIAN
NGUYỄN THỊ HỘI
HÀ NỘI 2006
NGÀNH: CÔNG NGHỆ THÔNG TIN
MÃ SỐ:
Người hướng dẫn khoa học: TS. NGUYỄN KIM ANH
2. Trang - 1 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
L M
ỜI CẢ ƠN
Lời đầu tiên của luận văn em xin gửi lời cảm ơn chân thành đến cô giáo, Tiến
s i
ỹ Nguyễn Kim Anh người đã trực tiếp hướng dẫn, giúp đỡ và tạo mọi đ ều
kiện thuận lợi cho em từ lúc tìm hiểu, định hướng cũng như tìm kiếm tài liệu
trong lĩ ự
nh v c Cơ sở dữ ệ ờ
li u hướ ượ
ng đối t ng th i gian cho đến lúc hoàn
thành luận văn. Chúc cô mạ ỏ ố ề ế
nh kh e, công tác t t và ngày càng có nhi u k t
quả m l
ới từ ĩnh vực nghiên cứu mà cô yêu mến.
Em xin được gửi lời cám ơ ạ
n đến b n bè và những người thân trong gia đình
đ ạ đ ề ệ ũ ư ọ ặ
ã t o i u ki n c ng nh giúp đỡ em m i m t trong quá trình hoàn thành
luận văn. Chúc mọi người gặp nhiều may mắn.
Em cũng xin gửi l t c
ời cám ơ ấ
n đến t ả các thầy cô giáo của Khoa Công Nghệ
Thông Tin và Trung tâm Đ ạ ọ ủ ọ
ào t o Sau Đại h c c a Trường Đại h c Bách
Khoa Hà Nội đã giúp đỡ, chỉ bả ạ ọ đ ề ệ
o, t o m i i u ki n cho em hoàn thành được
luận văn này.
Hà nội, mùa thu 2006!
3. Trang - 2 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
MỞ ĐẦU
Quản lý dữ liệu là một phần không thể thiếu đối với việc phát triển các hệ
thống thông tin, quản lý dữ liệu theo thời gian trong các hệ thống thông tin
ứ ụ ĩ ự đ ỏ ề ầ
ng d ng trong các l nh v c thay đổi thường xuyên và òi h i nhi u yêu c u
như tài chính, ngân hàng, viễn thông, y tế đã làm cho các hệ quản trị cơ sở ữ
d
liệu quan hệ không quản lý về mặ ờ ộ ộ ữ ạ
t th i gian b c l nh ng h n chế Đ ề
. i u này
đ ỏ ứ ề
òi h i các nhà nghiên c u v cơ sở dữ ệ ả ữ ế ả ả
li u ph i đưa ra nh ng k t qu kh
quan hơn, những hệ quản trị mớ ơ ể ử ụ ụ
i h n, các ki u x lý khác làm sao để ph c v
được ngày càng tố ơ ầ ự ế đ ỏ ế ộ
t h n nhu c u mà th c t òi h i. Vì th , m t hướng nghiên
cứu cơ sở dữ ệ ớ đ ữ
li u m i ra đời ó là xem xét d liệ ạ
u dưới d ng các đối tượng
như nó vốn tồn tại trên thực tế ế
và thêm y u tố thời gian để đáp ứng các yêu
cầu cho các ứng dụng quản lý về mặt thời gian.
Cơ sở dữ ệ ờ ớ
li u đối tượng th i gian m i được nghiên cứ ữ ă
u vào nh ng n m 90
của thể kỷ ữ ă ủ ể
20 và nh ng n m đầu c a th kỷ ộ ấ ờ
21. M t b t ng là các nhà khoa
họ đ ữ ế ả
c ã thu được nh ng k t qu tố ơ ứ ẹ
t h n mong đợi và h a h n mộ ề ứ
t mi n ng
dụng rộng lớn sẽ được sử dụng các kết quả này khi đưa vào thực tế. Cơ sở dữ
liệu hướng đối tượng thời gian không những thu được các kết quả về cơ sở lý
thuyết như các đại số nghiên cứu về cơ sở dữ ệ ờ ố
li u th i gian (đại s TA,
OSAM*/T, …) [SSH-98] mà còn thu được các kết quả về ặ ự đ
m t th c hành là ã
xây dựng được các hệ quản trị cơ sở dữ ệ ờ ớ
li u hướng đối tượng th i gian v i
đầ đủ đị
y các tính nă ồ ữ
ng bao g m mô hình, ngôn ng nh nghĩ ả
a và c ngôn ngữ
truy vấ ẹ
n đầy đủ, toàn v n trên dữ liệu hướng đối tượng thời gian (TOOM,
TODL, TOQL). Vì lý do như ậ
v y, cùng với sự hướng dẫn của cô giáo Tiến sỹ
Nguyễn Kim Anh, em đã chọn tìm hiểu và nghiên cứu về “Cơ sở dữ ệ
li u đối
tượng thời gian và xử lý truy vấn trong cơ sở dữ liệu đối tượng thời gian”
Nội dung chính của luận văn là giới thiệu về mô hình cơ sở dữ ệ
li u hướng đối
thời gian trong các hệ thống thông tin (TOOBIS). Và để có được các nguyên
tắc xử lý bên dưới củ ữ ĩ ũ ư ữ ấ
a ngôn ng định ngh a c ng nh ngôn ng truy v n thì
4. Trang - 3 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
luận văn giới thiệu đại số TA là cơ sở ọ ử ơ ở
toán h c cho x lý c s dữ ệ
li u hướng
đố để
i tượng thờ ớ ệ
i gian trong TODL và TOQL. TOQL được gi i thi u minh
họa lại rõ nét hơn các toán tử cũ ư ạ ơ
ng nh các toán h ng trong c sở dữ ệ
li u
hướng đối tượng thời gian.
Trong thời gian tìm hiểu và nghiên cứ đ ữ ế ả
u đề tài, em ã đạt được nh ng k t qu
bước đầ đố để
u về ơ ở ữ ệ
c s d li u hướng i tượng thờ ơ ở
i gian, làm c s hoàn thành
cuốn luận văn này. Nội dung của luận văn bao gồm 4 chương :
Chương I: Tổng quan
Chương II: CSDL hướng đối tượng thời gian trong các hệ thống thông tin
Chương III: Cơ sở toán học cho xử lý CSDL hướng đối tượng thời gian
Chương IV: TOQL một ngôn ngữ truy vấn cho CSDL hướng đối tượng thời
gian
Chương V: Kết luận của luận văn
Nội dung của luận văn mới chỉ là những vấn đề cơ sở ủ ơ ở ữ ệ
c a c s d li u hướng
đố đề
i tượng thờ ữ
i gian, nh ng vấn sâu hơn mong rằng sẽ được trình bày trong
m t.
ột thời gian gần nhấ
5. Trang - 4 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
CHƯƠNG I – TỔNG QUAN
Giới thiệu
Cơ sở dữ ệ
li u là mộ ầ ể ế ể
t thành ph n không th thi u trong quá trình phát tri n các
hệ thống thông tin. Trong thời gian gần đây, các ứng dụng thông tin không chỉ
dừng lại ở các ứng dụng trong lĩnh vực xử lý dữ liệu kinh doanh, thương mại
mà còn phát triển sang các lĩnh vực khác như trí tuệ nhân tạo, thông tin văn
phòng, đa phương tiện… Do vậy, cơ sở dữ ệ ỉ
li u (CSDL) không còn ch có
kiểu quan hệ truyền thống mà còn phát triển thành CSDL đối tượng, với các
yêu cầu về mặ ả ờ ử ữ ệ ờ
t qu n lý th i gian và x lý d li u theo th i gian. CSDL đối
tượng có yêu cầu về mặ ả ờ đ ể ằ đ ứ
t qu n lý th i gian ã được phát tri n nh m áp ng
các ứng dụng thông tin một cách đầy đủ hơn.
Trong chương này lu n trình bày nh
ận vă ững khái niệm cơ bả ủ
n c a CSDL đối
tượng và CSDL thời gian. Phần 1.1 sẽ trình bày về CSDL thời gian cũng như
các bài toán liên quan và phần 1.2 sẽ trình bày về CSDL đối tượng.
1.1 Cơ ở ữ
s d liệu thời gian
1.1.1 Khái niệm
Hệ quản trị cơ sở dữ ệ
li u (DataBase Management System - DBMS) [NKA-
04] là một hệ thống phần mề ạ ậ ơ
m cho phép t o l p c sở dữ ệ
li u (DataBase –
CSDL) và đ ề
i u khiển mọi truy nhập đối với CSDL đó.
Hệ cơ sở dữ liệu có 4 thành phần [NKA-04] :
• CSDL hợ ấ ủ ệ ấ ơ
p nh t: CSDL c a h có hai tính ch t c bả ố ể
n là t i thi u hóa
dư thừa và được chia sẻ.
• Những người sử d d
ụng: Người sử ụ ủ ệ ấ ỳ
ng c a h là b t k một cá nhân nào
có nhu cầu truy nhập CSDL, bao gồm những người sử dụ ố
ng cu i,
những người viết chương trình, những người quản trị CSDL.
• Phầ ề
n m m DBMS
6. Trang - 5 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
• Phầ ứ ầ ứ ủ ệ ố ồ ế ị ớ ứ
n c ng: Ph n c ng c a h th ng bao g m các thi t b nh th cấp
được sử ụ ư ữ
d ng để l u tr CSDL.
Sau đây là một số khái niệm về các hệ quản trị CSDL thông thường và thời
gian [NN-02] :
• Snapshot DataBases Management Systems (DBMS): các DBMS truyền
thống không hỗ trợ cho bất kỳ kiểu thời gian nào.
• Valid Time (Historical) DBMSs: các DBMS chỉ hỗ ợ ờ ệ
tr th i gian hi u
lực.
• Transaction Time (Rollback) DBMSs: các DBMS chỉ hỗ ợ ờ
tr th i gian
giao dịch.
• Bi_Temporal DBMSs: các DBMS có hỗ ợ
tr cả ể ờ
hai ki u th i gian giao
dịch và hiệu lực.
1.1.2 Các v c nghiên c u trong CSDL th
ấ đề
n đượ ứ ời gian
Trong các h i gian
ệ quản trị CSDL thời gian thì thuộc tính thờ được xem là
một bộ phận gắn kết với hệ quản trị CSDL thời gian.
Một số vấn đề chính khi nghiên cứu CSDL thời gian là:
- Ngữ nghĩa của dữ liệu thời gian
- Mô hình hóa trình diễn dữ liệu thời gian
- Ngôn ngữ truy vấn trên các hệ quản trị CSDL thời gian
- Thiết kế CSDL thời gian
- Cài đặt và thực thi CSDL thời gian
- Các kỹ thuật tối ưu hóa trong thực thi CSDL thời gian
1.1.3 Ngữ nghĩ ủ ữ
a c a d liệu thời gian
Trong CSDL thời gian có hai khái niệm được quan tâm là thời gian hiệu lực
và thời gian giao dịch. Khi nói đến ngữ nghĩa c a d
ủ ữ liệu thời gian, chúng ta
sẽ nói đến thời gian hiệu lực và thời gian giao dịch.
7. Trang - 6 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
Thời gian hiệu lực của một sự kiện là tất cả các khoảng thời gian, có thể trong
quá kh ng có th
ứ, có thể là hiện tạ ũ
i, c ể là tương lai khi sự kiện được xem là
đúng.
• Thờ ệ ự ậ ạ ủ ự ệ
i gian hi u l c ghi nh n quá trình thay đổi tr ng thái c a các s ki n
trong thực tế.
• Thờ ệ ự ủ ộ ự ệ ả ờ
i gian hi u l c c a m t s ki n không ph i bao gi cũng được ghi
nhận trong CSDL vì một s t s
ố lí do như: thời gian hiệu lực của mộ ự
kiện là không thể biết hoặc khoảng thời gian hiệu lực không xác định
được một cách chính xác…
Thời gian giao dị ủ
ch (Transaction Time - TT) c a một sự kiện tương đối với
CSDL là khoảng th ki n t
ời gian trong đó sự ện được ghi nhận và tồ ại trong
CSDL.
• Thờ ị ậ ự ạ ủ ả
i gian giao d ch ghi nh n s thay đổi tr ng thái c a chính b n thân
CSDL.
• Các ứ ụ ầ ỗ ợ ả
ng d ng có các yêu c u h tr kh nă ậ ạ
ng truy c p đến các tr ng
thái trước đó c n s
ủa CSDL thì chúng cầ ự ỗ
h tr th
ợ ời gian giao dịch.
• Thờ ị ị ặ ở ờ đ ể
i gian giao d ch b ch n hai đầu b i các th i i m khi CSDL được
khởi tạo và trạng thái hiện thời của chính nó.
• Thờ ị ấ ă ầ ự ễ ệ
i gian giao d ch còn có tính ch t là t ng tu n t và d dàng cho vi c
ghi nhận một cách tự ở
động b i hệ quản trị CSDL đó.
1.1.4 Mô hình hóa thể hiện dữ liệu thời gian
Để biể ễ ự ệ ả ị ờ ở
u di n và xây d ng các h qu n tr CSDL th i gian, người ta m rộng
các hệ qu qu qu
ản trị CSDL thông thường (hệ ản trị CSDL quan hệ, hệ ản trị
CSDL đ ể
i m nối đ ể
i m…) theo một trong hai hoặc cả hai cách sau đây:
• Ghi nhậ ờ
n thông tin th i gian liên quan đến mỗ ộ ữ ệ
i b d li u.
• Ghi nhậ ờ
n thông tin th i gian liên quan đến mỗ ộ ừ
i thu c tính trong t ng bộ
dữ liệu.
8. Trang - 7 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
Cách thứ nhấ ỗ
t, m i b li
ộ ữ
d ệu được thêm 4 trường dùng để lưu các giá trị thời
gian bao gồm: {TTB, TTE, VTB, VTE}
- TTB: Thời gian bắt đầu giao dịch
- TTE: Thời gian kết thúc giao dịch
- VTB: Thời gian hiệu lực bắt đầu
- VTE: Thời gian hiệu lực kết thúc
Sau khi thêm 4 trường này, cách biểu diễ ủ ộ
n c a các b dữ ệ ẫ ở
li u v n dạng
chuẩn 1 (1NF) và chúng vẫn được hỗ trợ trong hầu hết các hệ quản trị CSDL
thông dụng hiện nay. Nhưng nếu các thuộc tính trong cùng một bộ dữ ệ
li u
thay đổi không đồng thời với nhau thì cách thể hiện này sẽ vi phạm nguyên
tắc dư thừa dữ liệu.
Cách thứ hai biể ễ ấ ứ ạ
u di n thông tin r t ph c t p vì mỗ ộ ủ ỗ ộ ữ
i thu c tính c a m i b d
liệu sẽ có các giá trị thời gian riêng tương ứng với nó. Do đó, các hệ quản trị
CSDL phải h tr
ỗ ợ thêm các phương pháp l u tr
ư ữ, xử lý, và truy vấn hi u qu
ệ ả
hơn. Đối với trường hợp này, sử dụng CSDL hướng đối tượng thời gian sẽ có
nhi u u
ề ư đ ể
i m hơn (sẽ nói chi tiết trong phần 1.2).
1.1.5 Ngôn ngữ truy vấn trên các hệ ờ
CSDL th i gian
Để thiế ế ự ộ ữ ấ ớ ầ
t k xây d ng m t ngôn ng truy v n m i, yêu c u phả ộ
i tuân theo m t
s i
ố đ ều kiện như:
• Tương thích với các hệ quản trị CSDL đã có.
• Việ ữ ấ ớ ă
c cài đặt ngôn ng truy v n m i không quá khó kh n.
• Ngôn ngữ ấ ớ ả ố ữ ấ đ
truy v n m i ph i có cú pháp gi ng các ngôn ng truy v n ã
có.
• Ngôn ngữ ấ ớ ả ả
truy v n m i ph i có kh nă ễ
ng di n đạt cao hơn và hỗ trợ
nhi n
ều hơn các ngôn ngữ truy vấ đã có.
Với các yêu cầu như vậ ệ ế ế
y, vi c thi t k mộ ữ ấ ớ
t ngôn ng truy v n m i là một
9. Trang - 8 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
công việc rất khó khăn, tốn nhiều thời gian và công sức mà chưa chắc chắn
rằng việc phổ dụng nó đã dễ dàng.
Do vậy, giải quyết vấ ấ
n đề truy v n trên CSDL thời gian chính là mở rộng các
ngôn ngữ truy vấn thông dụng như SQL bằng cách thêm yếu tố thời gian. Đối
với CSDL thời gian hướng đối tượng có một số ngôn ngữ truy vấn được xây
dựng riêng như TOQL, TOOSQL, OQL/T. Trong chương 4 luận văn sẽ trình
bày về TOQL.
1.1.6 Thiết kế CSDL thời gian
Mục đích chính của quá trình thiết kế là khai thác tối đa các khả năng và các
tiện ích của các hệ quản trị CSDL để phục vụ cho ứng dụng của hệ thống.
Các ứng dụng yêu cầu hỗ trợ các yếu tố thời gian thường phức tạp hơn các
ứ ụ ờ ũ ấ ế ế ế ế
ng d ng thông thường đồng th i c ng r t khó thi t k . Các thi t k CSDL
thời gian thường được dựa trên các thiết kế CSDL thông thường, sau đó thêm
yếu tố thời gian. Ví dụ:
• Với quá trình thiết kế logic thì đưa thêm yếu tố thời gian và mở rộng
các phụ thuộc với y li
ếu tố thời gian. Sau đó, quá trình chuẩn hóa dữ ệu
với dữ liệu thời gian được định nghĩa, các thuật toán để chuẩn hoá dữ
liệu cũng được thay đổi.
• Với quá trình thiết kế mứ ệ ũ ữ ấ
c khái ni m c ng có nh ng v n đề tương tự.
Tức là mức thiết kế khái niệm của các CSDL thời gian đều dựa trên mô
hình thực thể liên kết (quan hệ) và một số dựa trên mô hình đối tượng
(sẽ nói rõ trong phần CSDL thời gian hướng đối tượng).
Để chuyể ừ ự ể ế ế
n đổi t mô hình th c th liên k t thông thường sang mô hình có y u
tố thời gian thường phải mở rộ ế ố
ng thêm y u t th i chuy
ời gian và phả ển đổi
một cách thủ công. Do đó, nếu sử dụng mô hình đối tượng và chuyển sang mô
hình đối tượng thời gian thông qua các đối tượng, chúng ta chỉ cầ ế
n thêm y u
tố thời gian vào các thuộc tính của đối tượng và các thao tác (hành vi) được tự
động thêm vào các yếu tố ờ
th i gian.
10. Trang - 9 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
1.1.7 Cài đặt các CSDL thời gian
Đối vớ ệ ờ ế
i vi c cài đặt CSDL th i gian [NN-02] có hai hướng ti p cận chính là:
Hướng tiếp cận tích hợp (Intergrated) và Hướng tiếp cận sử dụng lại các hệ đã
có (Layered).
Hướng tiếp cận tích hợp sử dụ ộ ệ ố ẵ đ
ng nhân là m t h th ng CSDL s n có, sau ó
mở rộng và chỉnh sửa thêm các yếu tố thời gian.
Ư đ ể ủ ế ậ
u i m chính c a ti p c n này là:
• Hệ quản trị CSDL m ớ ể
i có th xử ệ ệ ả
lý tri t để, hi u qu vớ ữ ệ ờ
i d li u th i
gian.
• Các ứ ụ ẽ ấ ự ế ớ ệ ả ị
ng d ng CSDL s truy xu t tr c ti p v i h qu n tr CSDL mà
không cần qua thành ph n trung gian nên hi
ầ ệu quả ơ
h n.
• Có thể ử ụ ệ ủ ệ ả ị ớ ữ ệ ờ
s d ng các ti n ích c a h qu n tr đối v i d li u phi th i gian.
Nh c
ược đ ể
i m đáng kể ủa hướng tiế ậ
p c n này:
• Khố ệ ầ ỉ ử ớ ấ ớ ứ ạ
i lượng công vi c c n ch nh s a, thêm m i r t l n và độ ph c t p
truy xuất cao.
• Chi phí sả ấ ờ đ ể
n xu t và chi phí th i gian là áng k .
Hướng tiếp cận sử dụng các hệ sẵn có với mụ đ ắ ụ
c ích chính là kh c ph c nhược
đ ể ứ
i m th hai củ ế ậ ợ ả
a cách ti p c n tích h p: gi m chi phí khi cài đặt.
• Chọ ộ ệ
n m t h quản trị CSDL sẵn có, giữ nguyên nhân hệ thống này.
• Xây dự ộ ứ ấ ă ỗ ợ ờ
ng m t m c trung gian cung c p các tính n ng h tr th i gian,
thực hiện biến đổi các yêu cầu liên quan đến dữ liệu thời gian thành các
yêu cầu thông thường mà h qu
ệ ản trị CSDL ở mứ ể ể
c dưới có th hi u và
xử lý được.
• Chuyể ấ ệ ả ị ở
n đổi các câu truy v n cho h qu n tr CSDL mứ ự
c dưới th c
hiện.
• Thự ệ ộ ố ử ợ ớ ế ả ậ
c hi n m t s bước x lý thích h p đối v i k t qu nh n được.
11. Trang - 10 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
Ư đ ể ủ ế ậ
u i m chính c a hướng ti p c n này:
• Giả ả ơ
m chí phí cài đặt nên tính kh thi cao h n.
• Thích hợ ẫ ử ử ụ ứ ự ệ
p cho các m u th s d ng trong nghiên c u th c nghi m.
Nhược đ ể
i m chính:
• Xử lý các dữ liệu thời gian không được triệt để do các hệ quản trị CSDL
ở ứ ậ ụ ế ư đ ể ủ ữ ệ ờ
m c dưới không t n d ng h t các u i m c a d li u th i gian.
1.2 Cơ ở ữ
s d liệu hướng đối tượng
Hiện nay có một lớp các ứng dụng mới trong các lĩnh vực khác nhau như: Các
ứ ụ ế ế ợ
ng d ng thi t k có máy tính tr giúp (computer-aided design), các hệ thống
đ ệ ệ ạ
a phương ti n (multimedia information system), trí tu nhân t o (artificial
intelligence), hệ thống tin học văn phòng (office information system)… Đối
v ng
ới nhữ ứng dụng này, các hệ quản trị CSDL đối tượng (Object DBMS)
được xem là phù hợ ơ ớ ư
p h n v i các đặc tr ng [MTO-00] :
• Chúng phả ư ữ ớ ể ữ ệ
i l u tr và thao tác v i các ki u d li u trừu tượng và khả
năng cho phép người dùng định nghĩa các kiểu mới.
• Biể ễ ứ ụ ấ ằ ệ
u di n các đối tượng ng d ng có c u trúc b ng mô hình quan h
phẳng làm mất đi cấu trúc tự nhiên vốn có đối với các ứng dụng. Mô
hình quan hệ tồ ạ ữ ễ ễ ư
n t i gi a các đối tượng không d di n đạt nh ng trong
mô hình đối t i r t d
ượng lạ ấ ễ thể hiện.
• Các hệ ố ứ ụ ứ ạ ể ế ằ
th ng đối tượng, các ng d ng ph c t p có th được vi t b ng
một ngôn ngữ lập trình CSDL đối tượng xác định.
Sau ng.
đây, luận văn sẽ trình bày những nét cơ bản về CSDL đối tượ
1.2.1 Đối tượng và cơ sở dữ liệu đối tượng
Hệ quản trị CSDL đối tượng là một hệ thống sử dụng “đối tượng - object”
làm đơn vị cơ bả ấ đ ể
n để mô hình hoá và truy xu t [MTO-00] . Đặc i m chung
của các mô hình dữ liệu đối tượng là:
12. Trang - 11 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
Định danh đối tượng: Mỗi thực thể trong thế giới thực được mô hình hóa vào
trong CSDL được gọi là đối tượng. Mỗi m i t
ột đố ượng được xác định duy
nh ng.
ất bởi định danh đối tượ Định danh đối tượng do hệ thống sinh ra và
được quả ở ệ ố
n lý b i h th ng.
Các đối tượng phức hợp: Các mô hình dữ ệ
li u đối tượng cho phép cấu trúc
kiểu dữ liệu mới t li i c
ừ các kiểu dữ ệ đ
u ã có bở ấu trúc bộ (tuple) và cấu trúc
tập (set).
Sự phân cấp kiểu: Mô hình dữ ệ ể ớ
li u đối tượng cho phép có các ki u con v i
các tính chất đặc biệt riêng của nó.
Một đối tượng có 4 đặc trưng [MV-03] :
• Định danh: Mỗ ộ ấ
i đối tượng có m t định danh (IDentifier - ID) duy nh t
xác định trong toàn bộ hệ thống.
• Giá trị ỗ ể ộ
: M i đối tượng có th có m t giá trị tạ ộ ờ đ ể
i m t th i i m trong
CSDL.
• Các tham chiế ế ệ ể
u: Các tham chi u hay các quan h mà đối tượng có th
có.
• Phương thứ ứ ể ự ệ
c: Các phương th c mà đối tượng có th th c hi n.
Hình 1. 1 Mô hình một đối tượng
CSDL đối tượng được xét trên khía cạnh cấp phát, quản lý và huỷ bỏ các đối
tượng và các hành vi (cách ứng xử) của chúng. Với mỗi đối tượng có hai vấn
13. Trang - 12 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
đề cầ đ ạ
n xem xét ó là Tr ng thái (Status) và Hành vi (Behavior).
• Trạ ể ễ ư
ng thái được bi u di n nh mộ ậ ế ể ệ
t t p các bi n th hi n (instance
variable) hay thuộc tính (attribute) và chúng là các giá trị.
• Hành vi củ ể ễ ứ
a đối tượng được bi u di n thông qua các phương th c
(method). Hành vi định nghĩa các hành động được phép trên những đối
tượng này và được sử dụng để thao tác với các đối tượng đó.
Trong mô hình dữ liệu đối tượng chúng ta xét đến một số khái niệm liên
quan:
- Các kiểu dữ liệu
- Quản lý đối tượng
- Truy vấn trên dữ liệu đối tượng …
1.2.2 Các kiểu dữ liệu
Kiểu dữ liệu trừu tượng (Abstract Data Type - ADT) [MTO-00]: là một hình
thức mô tả cho tất cả các đối tượng thuộc kiểu đó. Một ADT mô tả kiểu của
dữ liệu bằng cách cung cấp một miền dữ liệu với cùng cấu trúc và các phương
thức áp dụng cho các phần tử thuộc miền đó. Khả nă ừ ủ
ng tr u tượng c a ADT
đượ đượ
c gọ đ ế
i là óng gói (encapsulation) các chi ti t cài đặt, c viế ằ ộ
t b ng m t
ngôn ngữ hình thức.
Thành phần kết hợp (Composition): Là một trong nhữ ư
ng đặc tr ng tiêu biểu
nh u u n
ất trong mô hình dữ liệ đối tượng. Nó cho phép chia sẻ tham chiế đế đối
tượng thông qua các OID của nó.
Lớp (Class): Lớ ộ ể ệ ộ ề
p là m t nhóm các th hi n đối tượng thu c v mộ ể đ
t ki u ã
cho. Một l t t t c
ớp thường có dòng tộc của nó, đó là mộ ập h p t
ợ ấ ả các đối
tượng có kiểu đi kèm với lớp đó
Tập (Collection): Tậ ộ
p là m t nhóm do người dùng định nghĩa chứa các đối
tượng. Sự khác biệt giữa lớp và tập như sau:
14. Trang - 13 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
Bảng 1. 1 Bảng so sánh giữa lớp và tập
Lớp Tập
Lớp có khả năng tạo ra các đối tượng Tập không có khả năng tạo ra đối tượng
Một đối tượng là phần tử của một lớp duy nhất Mộ ể ở ề ậ
t đối tượng có th trong nhi u t p
Quản lý lớp là không tường minh và do hệ
thống tự động duy trì các lớp
Quản lý tập là tường minh
Một lớp bao gồm các mở rộ ủ ộ ể
ng c a m t ki u
duy nhất và các mở rộ ủ ể ủ
ng c a các ki u con c a
nó.
Một tập là nhóm các đối tượng do người dùng
định nghĩa nên không thuần nhất về kiểu. Chúng
chứa các đối tượng thuộc các kiểu không có liên
quan với nhau
1.2.3 Quản lý đối tượng
Quản lý định danh đối tượng: Định danh đối tượng OID được hệ thố ấ
ng c p
phát và được dùng để xác định một cách duy nhất mỗ ệ
i đối tượng trong h
thống.
Đ ề ế ỏ
i u ch con tr : Trong các hệ ả ị ệ ừ
qu n tr CSDL đố để
i tượng, duy t t một đối
tượng này đến một đối tượng khác, chúng ta dùng các biểu thức đường dẫn
(path expression) ch i giá tr
ứa các thuộc tính vớ ị củ ự
a chúng d a trên đối tượng.
Đối tượng này chính là các con trỏ ạ ỏ ỏ ộ ớ
. Có hai lo i con tr là con tr trong b nh
(in memory pointer) và con trỏ đĩa (disk pointer).
Con trỏ đĩa chính là cách sử dụ ỏ ộ ớ ệ
ng OID và con tr trong b nh dùng để duy t
từ đối tượng này đế đố
n i tượng khác. Quá trình chuyển đổi con trỏ đĩa thành
con tr con tr
ỏ trong bộ nhớ được gọi là đ ề
i u chế ỏ (pointer swizzling). Có hai
lược đồ: phần cứng và phần mềm được dùng để i
đ ều chế con trỏ
Lược đồ phần cứng: Dùng cơ ế ế ủ ệ đ ề
ch khuy t trang (page fault) c a h i u hành
đ ử ụ ộ ộ ớ ấ ả ỏ đ
ang s d ng. Khi m t trang được đưa vào b nh , t t c các con tr trong ó
đề đế
u được đ ề ế ỉ
i u ch và chúng ch n các khung nhớ ả ữ ệ
o riêng. Các trang d li u
tương ứng với các khung ảo này chỉ được tải vào bộ nhớ khi có truy xuất đến
chúng. Việc truy xuất trang sẽ sinh ra một khuyết trang của hệ đ ề
i u hành mà
nó phải được ghi nhận và xử lý.
15. Trang - 14 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
L m
ược đồ phần mề : Mộ ả ụ đ đ ề ế
t b ng đối tượng được dùng cho m c ích i u ch
con tr i con tr t v i t
ỏ ỗ
. M ỏ đ ề
được i u chế chỉ ộ
đến m ị trí trong bảng đố ượng.
1.3 Kết luận chương I
Trong chương này luận văn đã trình bày những khái niệm cơ bả ề
n v CSDL
thời gian và CSDL đối tượng. Vấn đề đặt ra là khi các yêu cầu của các DBMS
đối tượng lạ đ ỏ ả
i òi h i qu n lý về mặ ờ ả ế ẽ ư ế
t th i gian thì hướng gi i quy t s nh th
nào? Trong chương 2, luận văn sẽ trình bày chi tiết về CSDL thời gian hướng
đối tượng (Temporal Object Oriented DataBase - TOODB) trong các hệ ố
th ng
thông tin. CSDL thời gian hướ ượ
ng đối t ng được xây d cho
ựng nhằm hỗ trợ
các ứng dụng có yêu cầu quản lý về mặt thời gian đối với dữ liệu.
16. Trang - 15 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
CHƯƠNG II – CƠ S D
Ở Ữ Ệ Ờ
LI U HƯỚNG ĐỐI TƯỢNG TH I
GIAN TRONG CÁC HỆ THỐNG THÔNG TIN
Giới thiệu
Vào hai th c, nhi ng vào d
ập niên trướ ều nhà nghiên cứ đ
u ã hướ ữ liệu thời
gian, hay dữ li t các h th
ệu thay đổi theo thời gian. Hầu hế ệ ống thông tin máy
tính hóa hiện nay (và đặc biệt là trong DBMSs) chỉ lư ữ ự ể
u tr các th c th trong
thế giới thực với trạng thái hiện thời của nó mà không cung cấp hay không hỗ
trợ việc lưu trữ những giá trị trạng thái trong quá khứ hay trong tương lai của
các thực thể. Một số hệ ố ạ
th ng thông tin cho phép duy trì các tr ng thái trong
quá khứ cho mỗi th ng ph
ực thể, nhưng nhữ ương tiện này phần l n ph
ớ ục vụ
những mục đích kiểm toán và lưu trữ, cung cấp rất ít khả nă ỗ ợ
ng h tr để lấy
lại và phân tích, xử lý thông tin. Về mặ ỹ ậ ờ ỗ ẩ
t k thu t, th i gian mà m i m u tin
đ đ ế ớ ự ọ ờ ệ ự
ang úng trong th gi i th c được g i là th i gian hi u l c, trong khi thời
gian từ lúc chèn bản ghi vào trong một DBMS đến lúc xóa (logic) nó được gọi
là thời gian giao dịch. Phụ thuộc vào việc hỗ trợ kiểu thời gian mà chúng cung
cấp cho hai chiều thời gian, DBMSs được phân loại vào bốn phạm trù đã trình
bày trong phần 1.1.1
Trong chương này luận v n s
ă ẽ trình bày về nh ng v
ữ ấn đề liên quan đến CSDL
đố đố
i tượng thờ ụ ẽ ổ ề
i gian. M c 2.1 s trình bày t ng quan v CSDL hướng i
tượng trong các hệ thống thông tin - Temporal Object Oriented DataBases
within Information System (TOOBIS), mục 2.2 trình bày những mục tiêu
chung của TOOBIS, mục 2.3 trình bày các kết quả đã đạt được và mục 2.4
trình bày hệ ề
n n của TOOBIS.
2.1 Tổng quan
TOOBIS là một ph ng pháp lu
ươ ận mô hình hóa khái niệm mớ ớ
i, v i cách nắm
bắt ngữ nghĩa, phân tích yêu cầu và hình thức hoá thiết kế củ ệ ố
a các h th ng
thông tin thời gian. Đồng thời có chức năng lưu trữ mộ ệ ả ị
t h qu n tr cơ sở dữ
17. Trang - 16 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
li t
ệu hướng đối tượng (Object Oriented DBMS – OODBMS), với việc lưu kế
quả trong một Hệ thống Quản lý Cơ sở dữ ệ ờ
li u Hướ ượ
ng đối t ng Th i gian
(TOODBMS), nó cung cấp cơ sở cầ ế ệ ự ả ữ
n thi t cho vi c th c thi và b o trì nh ng
ứ ụ ờ
ng d ng th i gian.
Các ứng dụng hiện nay thực hiện theo hướng OODBMS bao gồm :
• Viễ ả ạ ả ị ỏ ậ
n thông: Qu n lý m ng, Qu n tr , Mô ph ng, L p kế ạ
ho ch, ...
• Công nghiệ ữ ệ ỹ ậ ả ệ ỹ ậ
p hàng không : D li u k thu t và qu n lý tài li u k thu t.
• Bảo vệ : Chuẩn bị các đặc vụ, Mô phỏng, Tập trận giả, ...
• Ngân hàng và bả ể ệ ố ạ
o hi m : H th ng nhà thương m i, Hệ ố
th ng thông tin
khách hàng…
• D i
ịch vụ : Phân phối đ ện, Quản lý mạng vận tải, bản đồ học, ...
• Thương mại : ( Nhữ ứ
ng ng dụng DSS về tài chính, ngân hàng, bảo
hiểm).
• Sức khỏe : ( Mô phỏng, Thao tác y học, Quản lý bệnh, dược lý).
Những lợi ích mà công nghệ TOODBMS mang lại trong quá trình xây dựng
các ứng dụng thông tin:
• Tiệ ế ế ớ ạ ờ
n ích để phân tích và thi t k , v i các khía c nh th i gian có hành vi
động và tĩ ộ ề
nh trên m t mi n ứ ụ
ng d ng.
• Giả ế ế ữ ứ ụ ờ
m giá thành cho quá trình thi t k nh ng ng d ng th i gian, phát
triể ả
n, b o trì và tiến hóa.
• Cải tiến việc thực thi những ứng dụng lưu kết quả.
• Chuẩ ị
n b mộ ạ
t khung linh ho t để lư ữ ệ ờ ộ ữ
u d li u th i gian và m t ngôn ng
truy vấn mạnh để thao tác trên chúng.
2.2 Mục tiêu chung của TOOBIS
TOOBIS nhắm vào việc phát triển một Hệ nề ạ
n c nh tranh để hỗ ợ
tr vòng đời
đầ đủ
y củ ứ
a các ng dụ ờ ụ ủ ư
ng th i gian. M c tiêu c a TOOBIS nh sau:
18. Trang - 17 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
1. Cung cấp một phương pháp phân tích và thiết kế thời gian, bằng việc
mở rộ ự ớ ữ ậ đ
ng và xây d ng để thích nghi v i nh ng phương pháp lu n ang
t i.
ồn tạ
2. Mở rộ ứ ă ằ ệ ấ ỗ ợ
ng ch c n ng chính b ng vi c đề xu t O2 OODBMS, và h tr
cả thời gian hiệu lực lẫn thời gian giao dịch. Những mở rộ ả
ng này ph i
t i
ương thích với các chuẩn ODMG và các đ ều khoản mà các chuẩn
SQL/3 sắp định nghĩa .
3. nh
Tuân theo việc phát triển những chuẩn ODBMS, có mặt trong các đị
ngh u
ĩa mà những chuẩn này chị ảnh hưởng.
4. u
Làm giàu thêm chức năng của O2 OODBMS, cung cấp mô hình dữ liệ
xây d i t i t
ự ở
ng để kh ạo và thao tác trên các đố ượng thời gian.
5. Tăng cường các chuẩn cho ngôn ngữ định nghĩa đối tượng (Object
Definition Language - ODL).
6. Mở rộ ẩ ữ ấ
ng chu n cho ngôn ng truy v n đối tượng ở mức cao (Object
Query Language - OQL).
7. Tăng tính hiệu lực với cách tiếp cận và những sản phẩm TOOBIS
(TOODBMS và Phương pháp luận) bằng việc phát triển các ứng dụng
thực tế…
TOODBMS cung c p cách th
ấ ức lưu trữ kiến trúc mô hình dữ liệu để tạ ớ
o m i
và thao tác trên các đối t th i t
ượng thời gian. Nó kế ừa đố ượng thời gian của
O2 OODBMS, ngôn ngữ định nghĩa thời gian (Temporal Object Defined
Language - TODL), bằng cách mở ộ
r ng ODMG ODL và mở ộ ẩ
r ng chu n ngôn
ng n
ữ truy vấ đối tượng mức cao (OQL).
2.3 Kết quả thu được
Dự án TOOBIS đã phát triển một Hệ nề ỗ ợ
n h tr vòng đờ đầ đủ
i y củ ệ
a các h
thống thông tin thời gian. Hệ nền này bao gồm những thành phần sau :
1. ng
Phương pháp luận thời gian hướ đối tượng (Temporal Object
19. Trang - 18 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
Oriented Method - TOOM). TOOM được sử dụng trong pha phân tích
và thiết kế hệ ố ờ ả
th ng thông tin th i gian. TOOM, ngoài kh nă ự
ng th c
hiện việc nắm bắt và mô hình hóa, còn cung cấp cách thức xây dựng
mô hình hoá bao gồm cả khía cạnh cấu trúc l nh hành vi c
ẫn khía cạ ủa
hệ thống thông tin.
2. ng
DBMS hướ đối tượng thời gian (TOODBMS). TOODBMS có thể sử
dụng để định nghĩa, lưu trữ và truy vấn dữ liệu thời gian, cung cấp cơ
sở h t
ạ ầng cần thiết cho việc thực thi và thao tác của các hệ thống thông
tin thời gian. TOODBMS gồm ba thành phần phân biệ ọ
t được minh h a
trong Hình 2.1
Hình 2. 1 Ki a TOODBMS
ến trúc củ
i) Mô hình Dữ liệu Đối tượng Thời gian (Temporal Object Data Model -
TODM). Mô đun này cung cấp các phương tiện cần thi t cho vi
ế ệc tạo
thành, lưu trữ và thực thi các thao tác trên những đối tượng phi thời
gian và thời gian: thêm mới và xóa bỏ thông tin thời gian, trích chọn
thông tin theo giai đ ạ
o n thời gian ...
ii) Ngôn ngữ Định nghĩa Đối tượng Thời gian (Temporal Object Define
Language - TODL). Mô đun này cung cấp một phương thứ ở
c mức cao
để định nghĩ ữ
a nh ng đố đặ
i tượng với c trư ờ ở ộ
ng th i gian. TODL m r ng
Ngôn ngữ Định ngh n n
ĩa Đối tượng ODMG (ODL). Hơ ữa TODL còn
20. Trang - 19 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
lưu trữ mộ ừ đ ể ọ ấ
t t i n (meta - data), thông qua người dùng mà h truy v n
trên những kiểu s nh nh ng thu
ẵn có và xác đị ữ ộc tính của chúng.
iii) Ngôn ngữ truy vấn Đối tượng Thời gian (Temporal Object Query
Language TOQL), ở mứ ứ ữ ấ
c cao ngang m c ngôn ng truy v n để trích
chọn thông tin từ những cơ s d
ở ữ liệu Thời gian. TOQL là mộ ở ộ
t m r ng
của ODMG đối tượng với ngôn ngữ truy vấn ( OQL), đồng thời cung
cấ ạ ứ ụ ề ờ
p thêm tính ho t độ đế
ng n các ng d ng có chi u th i gian, tương
thích v th
ới việ ứ
c ng dụ ế
ng k thừa … Kiến trúc hệ ống toàn bộ được
minh họa trong Hình 2.2
Hình 2. 2 Kiến trúc tổng quan hệ ề
n n TOOBIS
2.4 Hệ ề
n n TOOBIS
2.4.1 Ph ng pháp lu n h
ươ ậ ướng đối tượng thời gian
2.4.1.1 Mục tiêu của phương pháp luận
Những vấn đề trọng tâm khi xây dựng phương pháp luận hướng đối tượng là:
• Đơn vị ờ đ ề ể ổ ứ ứ ụ
th i gian dùng để i u khi n t ch c vòng đời ng d ng
21. Trang - 20 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
• Ngữ ĩ ề ờ ủ ỗ ộ
ngh a và mi n th i gian c a m i thu c tính.
• Dữ liệu nào được thể hiện cho thích hợp để lư ữ ả ơ
u tr và qu n lý trong c
sở dữ liệu.
• Các ràng buộ ĩ ả ệ ắ ế
c nào được định ngh a để đảm b o vi c g n k t trong quá
khứ, tương lai và hiện tại của dữ liệu thời gian.
Đ ữ ấ ố ệ
ây là nh ng v n đề then ch t trong vi c mở rộ ậ ờ
ng phương pháp lu n th i
gian, với các khái niệm về đ
độ o và trình diễn thời gian, các khái niệm cho
việc quản lý lịch sử. Những khái niệm này cho phép cho mô hình hóa theo
khía cạnh thời gian củ ứ
a ng dụng ở mức khái niệm.
2.4.1.2 Ph i t
ương pháp hướng đố ượng
Phương pháp hướng đối tượng cơ bả ử
n s dụ ộ ấ
ng m t mô hình duy nh t, được
phân phối vào ba nhóm: cấu trúc, hàm và hành vi. Những khái niệm chính của
mô hình, được sử dụ ệ ự ế ớ
ng để mô hình hoá hi n tượng trong th c t , cùng v i
những mối quan hệ nằm bên dưới chúng được cho thấy trong Hình 2.3
Hình 2. 3 Các khái niệm cơ ả
b n của mô hình đối tượng
Trong phần này chúng ta s xem xét theo 2 thu
ẽ ộc tính là: Cấu trúc và Hành vi.
A - Thuộc tính cấu trúc
Hai khái niệm cơ ả
b n của mô hình, là đối tượng và lớp đối tượng, được đưa ra
từ sơ đồ hướng đối tượng. Mục đích chính của mô hình là tuân theo khái niệm
đố đế
i tượng từ pha phân tích cho n pha thực thi.
• Đối tượ ượ
ng biể ễ ộ ệ
u di n cho m t hi n t ng, mộ ự ể ự ế
t th c th trong th c t
không gian ứng dụng.
22. Trang - 21 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
• Lớp đối tượng mô tả mộ ư ề
t nhóm các đối tượng có cùng đặc tr ng v
hành vi và cấu trúc.
• Thuộ ộ ư ủ ộ ớ ậ ợ ị
c tính là m t đặc tr ng c a m t l p. T p h p giá tr củ ộ ộ
a m t thu c
tính được định nghĩa thông qua khái niệm miền.
Mô tả cấ ủ ộ ớ
u trúc c a m t l p đối tượng y
đầ đủ bằ ộ ậ ộ ự
ng m t t p các ràng bu c. S
ràng buộc có thể được phân loại thành ba phạm trù :
1. Ràng buộc thừa kế, sự phân chia các mô hình, sự phủ và sự tách rời.
2. Ràng buộc thuộc tính, hạn chế ị
các giá tr thuộc tính của một đối tượng,
ho ng
ặc những giới hạn của các thuộc tính, định nghĩa nhữ đối tượng
liên quan hoặc những mi n nh
ền theo một chuẩ ất định.
3. Ràng buộc duy nhất, được định nghĩa giữa một tập của các thuộc tính
và một t i t
ập các đố ượng.
B - Thuộc tính hành vi
Ngoài khía cạnh cấu trúc, mô hình đối tượng cũ ữ ệ
ng xem xét nh ng khái ni m
về sự ệ ạ
ki n và thao tác theo khía c nh hành vi của các hệ thống thông tin ở
mức khái niệm.
Ba nhóm sự ki ki ki
ện được phân biệt như sau: Sự ện ngoài, Sự ện bên trong và
Sự kiện thời gian.
• Sự kiện ngoài tương ứng với những sự kiện xuấ ệ
t hi n trong môi trường
bên ngoài hệ thống thông tin.
• Sự kiện bên trong tương ứng với trạng thái bên trong thay đổi hoặc
tương ứng với những đáp ứng lại của hệ thống do bên ngoài thay đổi.
• Sự kiện thời gian là một trạng thái đặc biệt của đồng hồ đo thời gian.
Sự kiện ngoài gắn liền với một lớp tác nhân, trong khi tất cả các sự kiệ ờ
n th i
gian đều gắn liền với lớp lịch biểu. Sự kiện bên trong được gắn với những lớp
đối tượng. Hình 2.4 tổ ế ự
ng k t s hợ ấ ủ ệ ấ
p nh t c a các khái ni m khác nhau (C u
trúc, hàm và Hành vi).
23. Trang - 22 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
Hình 2. 4 Một lược đồ động
2.4.1.3 Mở ộ
r ng thời gian
Mở rộ ờ ậ ở
ng th i gian t p trung vào trình bày mứ ữ ệ
c phân tích, nh ng khái ni m
về yêu cầu quản lý thời gian theo khía cạnh của một ứng dụng cơ sở dữ ệ
li u.
Mở rộ ờ ủ ậ
ng th i gian c a phương pháp lu n hướ ượ
ng đối t ng (Temporal Object
Oriented Method - TOOM) bao gồm những khía cạnh sau :
• Định nghĩ ủ ộ ặ ề ị ể ộ ứ ụ
a c a m t ho c nhi u l ch bi u cho m t ng d ng,
• Mở rộng của các miền cơ sở đến các miền thời gian,
• Mở rộng lớp đối tượng tới các chiều thời gian,
• Mở rộng của các ràng buộc áp dụng trên những lớp đối tượng,
• Mở rộng thời gian của các sự kiện.
A - Định nghĩa lịch biểu
[EIV-99F] nói rằ ộ
ng m t l ch bi t h th
ị ểu là mộ ệ ống ma trận được áp dụng với
các đường thời gian. OOM đề xướng khái niệ ớ ị ể ĩ
m l p l ch bi u để định ngh a
những sự kiện thời gian của ứng dụng. Trong OOM ban đầu, lịch Gregorian
được sử dụ ở
ng mứ ớ ị ể ỉ ộ ể ệ đ
c đối tượng, l p l ch bi u ch có m t th hi n ó là đồng
hồ lịch Gregorian.
[EIV-99F] mở rộ ĩ ủ ớ ị
ng định ngh a c a l p l ch biể ĩ ấ ỳ ệ
u để định ngh a b t k ti n ích
24. Trang - 23 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
lịch biểu nào áp dụng cho ứng dụng. Một lịch biểu được mô tả trong [EIV-
99F] bao gồm :
- Tên của lịch biểu,
- Gốc hay vị trí bắt đầu của lịch biểu,
- Một đơn vị cơ bản (nguyên tố),
- Một trật tự liệt kê của các thành tố vớ ữ ể ị ớ
i nh ng chuy n đổi đơn v l n
hơn và đơn vị nhỏ ơ ủ
h n c a chúng,
- M i o
ột thao tác chuyển dịch từ một thời đ ểm đến một giai đ ạn,
- Một thao tác chuyển đổi giữa những thành tố của cùng lịch biểu đó,
- Hai thao tác chuyển đổi, từ đâu (from) và tới đâu (to) của lịch biểu
Gregorian (Hai thao tác này dễ dàng cho chuyể ữ
n đổi gi a những lịch
biểu với nhau).
B - Mở ộ
r ng miề n cơ ở ớ
s t i miền thời gian
Miền thời gian mới được sử dụ ể ễ ờ ơ
ng để bi u di n th i gian trong c sở dữ ệ
li u
bao g m (Instant), giai n (Period) và kho
ồm có ba kiểu: thời đ ể
i đ ạ
o ảng
(Interval).
• M i i
ột thời đ ểm trình bày một đ ểm trên đường thời gian.
• M o
ột thời kỳ hay giai đ ạn trình bày số lượng củ ờ ữ
a th i gian gi a hai thời
đ ể
i m.
• Một khoảng, là một số lượng không bị hạn chế của thời gian.
Mỗi thể hiện của ba kiểu này được biểu thị trong một đơn thể củ ộ ị
a m t l ch
biểu. Những miền thời gian chung bao gồm: (INSTANT<calendar,granule>,
PERIOD<calendar,granule> và INTERVAL<calendar, granule>).
Các kiểu cổ đ ể
i n: ngày tháng, thời gian và ngày tháng, thời gian được tìm
thấy trong DBMSs cổ đ ể
i n. Còn INSTANT-A<calendar, granule>, PERIOD-
A<calendar, granule> được sử dụ ỉ ề ờ ệ ề
ng để ch mi n th i gian tuy t đối. Mi n
25. Trang - 24 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
th i
ời gian tương đố được trình bày bởi: INSTANT-R<calendar, granule> và
PERIOD-R<calendar, granule>.
C - Mở ộ
r ng lớp đối tượng tới các chiều thời gian
Trong mục này luận v n s
ă ẽ trình bày các chiều thời gian được mở rộng trong
lớp đối tượng bao gồm: Lớp thông thường và lớp thời gian
Lớp thông thường
Một lớp thông thường không hỗ trợ thời gian là một lớp không có yêu cầu về
quản lý thời gian. Sau đây là các thuộ ớ ỗ ợ
c tính l p thông thường không h tr
quản lý mặt thời gian :
• Một thuộc tính của một lớp thông thường có thể là một quan hệ tớ ớ
i l p
khác hoặc một thuộc tính khác, nó được định nghĩa trong lớp đối tượng.
• Một ràng buộc định nghĩa cho một lớp thông thường có thể là một ràng
buộc thuộc tính hoặc một ràng buộc thừa kế, nó được mô tả trong lớp
đối tượng.
• Phương thứ ủ ộ ớ ể ữ ấ ặ
c c a m t l p thông thường có th là nh ng truy v n ho c
những thao tác cơ bả ể ụ ở
n, chúng có th được áp d ng mức đối tượng
hoặc mức lớp. Những kiểu thao tác cơ bả ư
n nh tạ ớ ậ ậ
o m i, c p nh t, xoá
hoặc huỷ b .
ỏ
Sự kiện bên trong có thể được định nghĩa trong lớp thông thường.
Lớp thời gian
Một lớp thời gian là một lớp với yêu cầu quản lý về mặ ờ ớ ờ
t th i gian. L p th i
gian cho phép quản lý toàn vẹn th n lý th
ời gian hiệu lực và/hoặc quả ời gian
giao dịch trong định nghĩa lớp.
Trạng thái của đối tượng là một tập giá trị ở mộ ờ đ ể đ ủ ụ
t th i i m ã cho c a tr c
thời gian. Một trạng thái có liên quan đến một nhãn thời gian nhất định. Theo
[EIV-99F] thì:
• Trạ ọ ệ ự ờ ệ ự
ng thái g i là hi u l c khi nó có liên quan đến th i gian hi u l c.
26. Trang - 25 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
• Trạ ọ ơ ở ữ ệ ờ ị
ng thái g i là c s d li u khi nó liên quan đến th i gian giao d ch.
• Trạ ờ ứ ợ ệ ự ờ ị ủ
ng thái th i gian ph c h p là hi u l c trên th i gian giao d ch c a
nó.
Trong sơ đồ hướ ượ
ng đối t ng, có ít nhấ ộ ộ ờ
t m t thu c tính không bao gi thay
đổ để đố
i, nó dùng nhận biết i tượng. Như vậy, mộ ớ ờ ộ ự
t l p th i gian là m t s
bi n
ế đổi theo thời gian của một lớp thông thường. Mố ế ữ ộ ớ
i liên k t gi a m t l p
th t
ời gian và lớp thông thường của nó được gọi mộ <<temporal variation>>.
Ví dụ, Hình 2.5 miêu tả mộ ị ế
t nhân viên có hai giá tr bi n đổi theo thời gian :
tiền lương và tình trạng gia đình
Hình 2. 5 Các lớp thời gian
Việc kết hợp có thể có trong lớp thời gian được tổng kết trong Bảng 2.1
Bảng 2. 1 Định nghĩa quản lý thời gian trong một lớp thời gian
Thời gian giao dịch
Thông thường Trạng thái Lịch sử
Thông
thường
Không quản lý thời gian
(Lớp thông thường)
Trạng thái CSDL cuối
cùng của một đối tượng
Lịch sử CSDL của một
đối tượng
Trạng
thái
Trạng thái cuối cùng của
một đối tượng với thời
gian hiệu l a nó
ực củ
Trạng thái bitemporal
của một đối tượng
Lịch sử CSDL của một
đối tượng và trạng thái
hiệu lục của nó
Thời
gian
hiệu
lực
L ch
ị
sử
Lịch sử hiệu lực của một
đối tượng
Lịch sử hiệu lực của một
đối tượng và trạng thái
CSDL cuối cùng của nó
Lịch sử bitemporal của
một đối tượng
Để phù hợ ớ ầ ụ ữ ư ủ ỗ ề
p v i thông tin c n được khôi ph c, nh ng đặc tr ng c a m i chi u
th i
ời gian cần quản lý phả được định nghĩa một cách phù hợp.
27. Trang - 26 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
• Định nghĩ ờ ệ ự
a th i gian hi u l c. Nế ờ ệ ự ầ
u th i gian hi u l c được yêu c u,
thì một số đặc trưng của nó phải được xác định như sau:
- i o
Thời gian hiệu lực trên đơn vị nào? (là thời đ ểm hoặc giai đ ạn),
- Đơn vị nguyên tố và lịch biểu của thời gian hiệu lực,
- Kiểu quản lý ( trạng thái hoặc lị ử
ch s ),
- Tính đầ đủ
y của lịch sử (đầ đủ
y hoặc bộ phận).
• Định nghĩ ờ ị
a th i gian giao d ch. Nế ờ ị ầ
u th i gian giao d ch được yêu c u,
thì kiểu quản lý (trạng thái hoặc lịch sử) phải được xác định.
D - Mở ộ
r ng ràng bu c áp d
ộ ụng l ng t
ớp đối tượ ới chiều thời gian
Định nghĩ ạ ộ
a khung để phân lo i ràng bu c
1. Trong OODBMS hoạt động như ộ
[ODE], ràng bu c được phân vào hai
nhóm: các ràng buộ ộ
c intra – object và các ràng bu c inter - object.
• Ràng buộ ĩ ụ ộ ộ
c intra - object được định ngh a c c b đến m t đối tượng và
có thể được ki c hi
ểm tra vào cuối mỗi phương thức thự ện.
• Ràng buộc inter - object sử dụ ộ ố ả ể
ng m t s đối tượng, nó ph i được ki m
tra vào cuối của giao dịch cơ ở ữ
s d liệu.
2. Sự phân loại th li
ứ hai từ miền cơ ở ữ
s d ệu thời gian và nhóm các ràng buộc
vào hai phạm trù : các ràng buộ ộ
c intra - time và các ràng bu c inter - time.
• Ràng buộ ộ ờ đ ể ỗ ờ đ ể ầ
c intra - time tùy thu c vào th i i m t. M i th i i m t c n
ph ng
ải thỏa mãn các ràng buộc, tươ ứng với các chiều thời gian sau đây
: intra - VT, intra - TT và intra - Bi.
• Ràng buộ ĩ ở ẵ
c inter - time được định ngh a b i cách dùng thông tin s n có
hoặc hi m khác nhau. M
ệu lự ở
c nh ng th
ữ ờ đ ể
i i ỗi thời i
đ ể
i m cần phả
thỏa mãn các ràng buộc, tương ứng với chiều thời gian xem xét : inter -
VT, inter - TT và inter - Bi.
E - Mở ộ
r ng thời gian của sự kiện
28. Trang - 27 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
Sự kiện là khái niệm được sử dụ ĩ ủ
ng trong OOM để định ngh a tính động c a
ứ ụ ạ ự ệ ĩ ư
ng d ng. Ba lo i s ki n được [EIV-99F] định ngh a nh sau :
Sự kiện ngoài mô hình hóa thể ệ ủ
hi n c a mộ ở ộ ự
t thông báo b i m t tác nhân. S
kiện ngoài được phân loại vào ba nhóm dựa trên tính hiệu lực của chúng :
• Sự kiện “Đúng lúc” là sự kiện có thời gian hiệu lực thể hiện tại thời
gian hiện tại.
• Sự kiện “Tiên nghiệm ” là sự kiện có một thời gian hiệu lực trong tương
lai (cho phép xúc tiến các hoạt động trước khi đ ề đ
i u ó thực sự ả
x y ra).
• Sự kiện “Hậu nghiệm ” là sự kiện có thời gian hiệu lực trong quá khứ.
Sự kiện bên trong được xem như mộ ự ạ ầ ớ
t s thay đổi tr ng thái c n ghi nh về
một đối tượng. Thờ ệ ự ủ ộ ự
i gian hi u l c c a m t s kiệ ạ ế
n bên trong được h n ch
trong TOOM đến “ Sự ệ
ki n đúng lúc ”.
Một sự kiện dựa vào sự thay đổi trạng thái của một đối tượng được gọi sự
ki a
ện củ đối tượng. Ví dụ ế
, n u mộ đ ă ề
t nhân viên ã t ng thêm ti n lương của
anh ấy bốn lầ ă
n trong ba n m trước, thì ban nhân viên được thông báo. Sự kiện
này được gọi sự kiện lịch sử.
Sự kiện thời gian là mộ ạ
t tr ng thái đặc biệ ủ ệ ậ ờ
t c a vi c ghi nh n th i gian. Ba
kiểu sự kiện thời gian được định nghĩa như sau: sự kiện có chu kỳ, sự kiện
tuyệt đối và sự kiện tương đối. Ví dụ, “ mỗ ă
i 25 tháng 12 hàng n m” là một sự
kiện có chu kỳ, “ 25/12/1996 ” là mộ ự ệ ệ
t s ki n tuy t đối, và “ 1 tháng sau khi
hết hạn của tiền vay ” là mộ ự ệ
t s ki n tương đối.
2.4.1.4 K ng pháp lu
ết luận về phươ ận TOOBIS
Phương pháp luận TOOBIS hỗ trợ khía cạnh thời gian của các ứng dụng cơ ở
s
dữ liệu và hỗ trợ tương ứ ả ệ
ng các đặc t khái ni m đến TOOBIS - TOODBMS
với ngôn ngữ định nghĩa TODL của nó.
Mở rộng thời gian giới hạn theo các hướng [EIV-99F] :
• Phép đ ờ ệ ĩ ị ể
o th i gian thông qua vi c định ngh a l ch bi u,
29. Trang - 28 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
• Trình diễ ờ ữ ề ờ ớ
n th i gian thông qua nh ng mi n th i gian m i,
• Hình thứ ờ ư ữ ị ử
c hóa th i gian, l u tr trong l ch s củ ữ ệ ớ ớ ờ
a d li u v i l p th i
gian và các liên kết m i c
ớ ủa nó,
• Định nghĩ ự ẹ ủ ữ ệ ờ ớ ệ ở
a s toàn v n c a d li u th i gian v i vi c m rộng các ràng
bu nh.
ộc tĩ
2.4.2 Hệ quản tr u th
ị ơ ở ữ
c s d liệ ời gian hướng đối tượng
TOODBMS gồm có ba mô đun, bao gồm:
• Mô hình dữ ệ ờ
li u đối tượng th i gian (TODM)
• Ngôn ngữ ĩ ờ
định ngh a đối tượng th i gian (TODL)
• Ngôn ngữ ấ ờ
truy v n đối tượng th i gian (TOQL)
Trong phần này lu trình bày hai ph
ận v n s
ă ẽ ần là TODM và TODL, riêng
TOQL lu i các ví d
ận v n s
ă ẽ trình bày chi tiết vớ ụ minh hoạ rõ ràng trong
chương 4.
2.4.2.1 Mô hình dữ liệu đối tượng thời gian (TODM)
TODM là một mở rộ ủ ữ ệ
ng c a Mô hình d li u đối tượng (ODM) của ODMG
mà các hệ quản trị cơ sở dữ ệ
li u hướ ượ
ng đối t ng (OODBMS) được xây
dựng. TODM tập trung cho việc chuyển đổi giữa các OODBMS.
Trước khi giới thiệu dữ liệu thời gian trong khái niệm hướng n
đối tượng, luậ
văn sẽ trình bày mô hình dữ liệu đối tượng thời gian TODM. Sau đó, luận văn
sẽ trình bày các cấu trúc và giao diện được sử dụng để biể ễ ữ ệ ờ
u di n d li u th i
gian.
A - Mô hình và thao tác thời gian
TODM dựa vào một mô hình thời gian gần chuẩn và cổ đ ể
i n. Nó là một cấu
trúc tuyến tính và thời gian được sắp xếp thống kê trong định nghĩa, sử dụng
thao tác “inferior to”. Trụ ờ ể ộ ố
c th i gian có th được chia thành m t s hữ ạ
u h n
các đ ạ
o n nhỏ gọ ữ ố ố ỏ ấ ọ
i là nh ng nguyên t . Nguyên t nh nh t được g i là
30. Trang - 29 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
chronon và kích thước của nó là đơn vị nh nh
ỏ ất dùng để thực thi khi xử lý dữ
liệu. Thời gian trên số lượng thực thể được [EIV-99F] định nghĩa như sau:
• M i i
ột thời đ ểm là một đ ểm thời gian trên trục thời gian.
• M o i
ột thời kỳ (giai đ ạn) là một lượng thời gian giữa hai thời đ ểm
• Một khoảng là một lượng thời gian với một thuộc tính độ dài thời gian,
nhưng không có những ranh giới xác định như giai đ ạ
o n.
TODM cung cấp hay hỗ trợ đầ đủ
y cho lịch Gregorian chuẩn với những
nguyên tố chuẩn của nó - năm, tháng, ngày, giờ, phút và giây - cũng như
chuẩn bị các lịch biểu hỗ trợ.
B - Dữ liệu thời gian bên trong đối tượng
Cơ sở ớ
ban đầ đố
u là i tượng v i định danh duy nhất (OID) không thay đổi.
Trạng thái của nó được định nghĩa bởi những giá trị mang những thuộc tính
tường minh và hành vi của nó được định nghĩa bởi một tập các thao tác.
Những đối tượng là những thực thể vớ ị ể ế ể
i các giá tr , và nó có th ti n tri n
trong cả th t k
ời gian. TODM được thiế ế để lư ữ ữ ế ư
u tr nh ng ti n hóa nh vậy
thông qua thời gian hiệu l c và/ho
ự ặc thờ ị
i gian giao d ch.
Hình 2. 6 Mở ộ
r ng đến kiểu phân cấp của ODMG
Hình 2.6 miêu tả mộ ầ ệ ở
t ph n vi c m rộ ứ
ng th bậ ủ ể
c c a ki u mà được ODMG
31. Trang - 30 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
giới thiệu bởi TODM.
Hình 2.7 minh họa sự khác nhau giữa đối tượng thời gian thể hiện thuộc tính
và đối tượng.
Hình 2. 7 Các tính chất thể hiện thời gian và các đối tượng thời gian
TODM giới thiệu một loại quan hệ mớ ố ệ ạ ộ ố
i: m i quan h tr ng thái. M t m i
quan hệ trạng thái không chỉ về ộ
phía M t đối tượng, mà là về phía Một trạng
thái đặc biệt của Một đối tượng thời gian. Trong trường hợp này, OID của đối
tượng đích không đủ để mô hình hoá mối quan hệ trạng thái. Thay vào đó,
một OID Thời gian (TOID) của nhãn thời gian đối tượng đích liên quan đến
một trong số những trạng thái của nó - được sử dụng, cho phép lựa chọn chính
xác trạng thái của đối tượng thời gian kéo theo trong trạng thái mối quan hệ.
Hình 2.8. Minh họa những quan hệ và trạng thái truyền thống.
32. Trang - 31 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
Hình 2. 8 Các quan hệ và các quan hệ trạng thái
2.4.2.2 Ngôn ng i t
ữ định nghĩa đố ượng thời gian (TODL)
Ngôn ngữ định ngh t ngôn ng
ĩa đối tượng thời gian (TODL) là mộ ữ cho phép
người dùng định nghĩa thêm các giao diện thời gian. TODL ngang hàng với
những khái niệm ODL của ODMG [EIV-99F] :
• TODL hỗ ợ ấ ả ữ ĩ ự ữ ệ
tr t t c ng ngh a xây d ng mô hình hóa d li u bên dưới .
• TODL là mộ ữ ĩ ả
t ngôn ng định ngh a cho các đặc t đối tượng.
• TODL là mộ ữ ậ
t ngôn ng l p trình độc lập.
TODL liên quan đế đị
n nh nghĩa các thuộ ệ
c tính giao di n và thể hiện cho đối
tượng thời gian. TODL cho phép định nghĩa dữ liệu thời gian trên cả thuộc
tính thể hi n l
ệ ẫn mức đối t tr
ượng, trong khi chính nó được hỗ ợ bởi TODM.
Hình 2.9 minh họa cấu trúc bộ ử
x lý TODL.
33. Trang - 32 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
Hình 2. 9 Kiến trúc bộ ử
x lý TODL
2.5 Kết luận chương 2
Trong chương 2, luận văn đã đi vào phân tích chi tiết về cơ sở dữ ệ ờ
li u th i
gian hướ ượ
ng đối t ng trong các hệ thống thông tin - TOOBIS. Trong đó trình
bày chi tiết về ph qu
ương pháp luận TOOBIS và Hệ ản trị TOODBMS.
• Phương pháp luậ ỗ ợ ữ ả ữ
n TOOBIS h tr nh ng người phân tích mô t nh ng
khía cạnh thời gian của các ứng dụ ơ
ng c sở dữ ệ ỗ ợ
li u và h tr tương ứng
các đặc tả khái ni i ngôn ng
ệm đến TOOBIS - TOODBMS vớ ữ định
nghĩa TODL.
• Hệ quản trị TOODBMS với ba mô đun TODL, TODM và TOQL.
Chương 2 đã trình bày hai mô đun TODM và TODL, với mở rộ ữ
ng d
liệu thời gian và ngôn ngữ ĩ
định ngh a mớ ỗ
i, h trợ đầ đủ
y các tính năng
dành cho các ứng d ng qu
ụ ản lý cơ sở ệ ế ố ờ
li u có y u t th i gian theo
ph ng
ương thức hướ đối tượng.
Chương 3 sẽ giới thiệu một đại s th
ố ời gian là cơ sở ọ ệ ử
toán h c cho vi c x lý
đố đố
i vớ ơ ở ữ ệ ờ ứ
i c s d li u th i gian theo phương th c hướng i tượng.
34. Trang - 33 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
CHƯƠNG 3 – CƠ S S
Ở TOÁN HỌC CHO XỬ LÝ CƠ Ở Ữ
D
LIỆU HƯỚNG ĐỐI TƯỢNG THỜI GIAN
Giới thiệu
Mô hình dữ li i t
ệu hướng đố ượng có nhiề ư đ ể
u u i m vớ ấ
i các tính ch t như kế
thừa, định danh đối tượng, đóng kín, đóng gói thông tin, đ ỹ
a hình, các k thuật
kiểu/lớp… cho phép các thực thể trong thế giới thực được mô hình hoá trực
tiếp, thể hiện y
đầ đủ để phát triển hệ thống và mô hình hoá dữ liệu. Khung
nhìn của một CSDL hướ ượ
ng đối t ng có thể được trình bày bở ộ ạ
i m t m ng các
lớp ng
đối tượ được kết nối trong bằng các kiểu kết hợp khác nhau. Các khung
nhìn mở rộ ủ ố ư
ng c a chúng gi ng nh một mạ ủ ể ệ ớ
ng c a các th hi n l p đối tượng
được kế ố ở ể ệ ủ ể ế ố
t n i trong b i các th hi n c a các ki u k t n i.
Một hướng đi chính cho đại số TA là các hỗ trợ củ ử ả
a nó cho x lý và đặc t
dựa trên mẫu (hoặc dựa trên đồ thị). Trong một đặc tả truy vấn dựa mẫu, một
truy vấn có th t l i t
ể giải quyết hình thức hoá mộ ớp đố ượng đơn hay các lớp
đối tượng phứ ấ ế ặ ạ
c có c u trúc tuy n tính, cây ho c m ng lưới (ví dụ chúng có
chứa các vòng lặp). Các nhánh của một cây hoặc một mạng có thể được gán
nhãn là các nhánh AND hoặc OR phụ thuộc vào ngữ nghĩa của truy vấ Ư
n. u
đ ể ủ ử ố ớ ệ
i m c a các toán t đại s tường minh được gi i thi u trong hướng này là:
• Chúng tương thích vớ ấ ữ
i các c u trúc ngôn ng mứ ễ ả
c cao, d dàng cho kh
năng thiết lập cũng như ánh xạ giữa chúng với nhau.
• Chúng có thể ự ự ế ớ ệ ấ ơ ệ ử ụ
được th c thi tr c ti p v i hi u su t cao h n vi c s d ng
một số các toán tử khác để biểu diễn và thực thi các ngữ nghĩ ố
a gi ng
nhau.
Đại số ậ ă ớ ộ đ
TA được lu n v n trình bày trong chương 3 này v i các n i dung ã
được chấ ậ ư ư
p nh n trong [SSH-98] . Nó có các đặc tr ng riêng nh sau :
• Sử dụ ộ ơ
ng m t s đồ dự ẫ ộ ơ
a trên các m u thay vì m t s đồ dự ả
a vào b ng
35. Trang - 34 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
các thuộc tính đã sử ụ
d ng trong đại số quan hệ và các mở ộ
r ng thời gian
của nó.
• Các toán tử ố ộ ặ ậ ẫ ấ
đại s thao tác trên m t ho c hai t p các m u đồng nh t
ho p ng
ặc không đồng nhất của các kết hợ đối tượ để sinh ra một tập các
mẫu có thể được xử lý sau này bằng các toán tử khác.
• Trự ế ỗ ợ ệ ử ữ ĩ ế
c ti p h tr vi c x lý ng ngh a các phi k t hợp, các quan hệ phi
thời gian, và ngữ nghĩ ế
a các nhánh AND/OR. Nó duy trì k t hợp giữa
các đối tượng trong việc duyệt các đường dẫn khác nhau của quá trình
xử lý truy vấn thời gian.
Trong chương này, lu i t
ận văn trình bày về mô hình hoá đố ượng và hình thức
hoá truy vấn thời gian, đại số kế ợ ờ ệ ế ế ữ ờ
t h p th i gian, vi c thi t k ngôn ng th i
gian và phân tích đại số.
3.1 Mô hình hóa đối tượng thời gian và hình thức hóa truy vấn
3.1.1 Dữ liệu thời gian
Sự khác biệt giữa CSDL phi thời gian và CSDL thời gian chính là các sự kiện,
các sự ki ki
ện thời gian và việc ghi nhận các sự ệ đ
n ó theo một quá trình.
Có 3 s i t
ự kiện thời gian tiêu biểu trên các đố ượng đó là: update, delete, và
insert (cập nhật, xoá và chèn). Triển khai của một thể hiện trên được xem như
là phiên bản lịch sử củ ể ệ ọ
a các th hi n và được g i là temporal instances (các
thể hiện thời gian).
Triển khai của một thể hi hi
ện được trình bày bằng một dãy các thể ện thời
gian. Các thể hi p x
ện thời gian được sắ ếp theo th i gian, còn g
ứ ự
t thờ ọi là trục
thời gian hay đường thời gian (time-line).
Trong chương này luận v u l
ăn trình bày thời gian hiệ ực để mô tả các toán tử
đại số ả
. Kho ng hiệu lự ủ ộ ể
c c a m t th hiệ ờ ả
n th i gian được mô t bằ ờ
ng th i gian
bắt đầu ts và thờ ế
i gian k t thúc te. Nế ộ
u m t thể ệ ễ ộ
hi n trình di n m t số thông
tin hiện thời thì khi đó có th th
ể ấy quan hệ: ts = te = now, trong đó now mô tả
36. Trang - 35 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
một giá trị đặc biệt cho biết thông tin đó ở trạng thái hiện thời.
3.1.2 Biểu diễ đồ
n thị ủ
c a TOODB
Một trình diễn đồ thị của một CSDL hướng đối tượng đặc tả mối quan hệ giữa
các đối tượng dữ liệu thời gian bằng các liên kết kết hợp tường minh [SSH-
98]. Trong mộ ữ ệ ự ị ư
t mô hình d li u d a trên đồ th - graphbased data model, nh
OSAM*/T [SSH-98] , một CSDL thời gian hướ ượ
ng đối t ng được trình bày
trong hai đồ th th
ị: Schema Graph (SG - Đồ ị lược đồ) và Temporal Object
Graph (TOG - Đồ thị đố đồ
i tượng thờ đ
i gian ) trong ó các thị trình bày tương
ứ ớ ổ ở ộ
ng v i CSDL t ng quát và CSDL m r ng.
3.1.2.1 Đồ thị lược đồ
Trong một đồ thị lược đồ - Schema Graph (SG), [SSH-98] một CSDL được
nhìn nhận như mộ ậ ớ ể ế ợ
t t p các l p đối tượng thông qua các ki u k t h p khác
nhau .
Ví dụ SG của một CSDL công ty được trình bày trong hình 3.1.
Hình 3. 1 Đồ thị ủ ộ
lược đồ c a m t CSDL công ty
Các hình chữ nh u di
ật biể ễn các lớp thực thể - entity classes, và các hình tròn
biểu diễn các thuộc tính được định nghĩa trên các lớp miền – domain classes.
Các cạnh trong SG trình bày các kết h i t
ợp giữa các lớp đố ượng. Mũi tên hai
đầ đỉ đơ
u ký hiệ ế ổ
u các liên k t t ng quát hoá - generalization và các nh n giản
là ký hiệu các liên kết gộp – aggregation giữa các lớp đối tượng. Tất cả các
liên kết gộp - aggregation t tên nh
đề đặ
u ưng tên của chúng không đưa ra theo
37. Trang - 36 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
thứ t .
ự
3.1.2.2 Tổ chức dữ liệu thời gian và đồ thị đối tượng th i gian
ờ
Việc mở rộ ủ ộ ờ ể ở ộ
ng c a m t CSDL th i gian có th được trình b i m t - Temporal
Object Graph (TOG). Trong một TOG, các cạnh bi u di hi
ể ễn các thể ện thời
gian. Các kết hợp gi n b
ữa chúng được biểu diễ ằng các liên kết trong. Trong
một TOG, [SSH-98] một CSDL được xem như là một tập của các thể hiện
thời gian đ ế ố ế ế ợ ể ộ
ã được k t n i trong thông qua các liên k t k t h p phi ki u. M t
thể hiện thời gian trong một TOG có thể được định danh bằng một TIID, nó
được hình thứ ằ ộ ỗ ự ệ ế ủ ộ ờ
c hoá b ng m t chu i các s ki n liên ti p c a m t nhãn th i
gian và một IID.
Các bộ nhãn thời gian - Timestamping [SSH-98] và các nhãn thờ ộ
i gian thu c
tính – Attribute timestamping [SSH-98] được dùng trong việ ở
c m rộ ờ
ng th i
gian đến một mô hình dữ liệu quan hệ. Việc triển khai của các thể hiện đối
tượng, các quan hệ thời gian của chúng trong một CSDL hướng đối tượng có
thể được ghi lại bằng việc dùng hai phương thức chứa nhãn thời gian là:
instance timestamping và attribute timestamping. Một khai triển của một thể
hiện, chứa cả dữ ệ ả ế ế ợ ạ
li u mô t và các tham chi u k t h p, được ghi l i trong
đường thờ ổ ứ ữ ệ ờ ự
i gian chung. Các t ch c d li u th i gian d a trên hai phương
thức nhãn thời gian được trình bày b ng pháp
ằng phươ đồ thị với TOG và các
bảng trong hình 3.2.
Các trục thời gian đa chiều của một thể hiện trong thuộc tính phương thức
nhãn thời gian có thể được chuy ng các
ển đổi thành đường thời gian đơn bằ
thao tác time-alignment [SSH-98].
38. Trang - 37 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
Hình 3. 2 Thuộc tính nhãn th i gian trong t
ờ ổ chức dữ liệu thời gian
Hình 3. 3 Thể hiện nhãn thời gian trong tổ chức dữ liệu thời gian
Hình 3.4 Trình bày TOG trong phương pháp thuộc tính thời gian.
3.1.2.3 Hình thức hoá truy vấn th u
ời gian dựa mẫ
Kết hợp với các mô hình dữ liệu thời gian hướng đối tượng, một số ngôn ngữ
truy vấn thời gian đã được thiết kế bằ ệ ế ợ ấ ờ
ng vi c k t h p các c u trúc th i gian
vào m t s ang t
ộ ố ngôn ng i gian
ữ truy vấn phi thờ đ ồn tại. Chúng có thể được
phân chia thành một số nhóm như [SSH-98] nói tớ ộ ố
i m t s ngôn ngữ:
SQL/Quelbased (ví d : TOOSQL), PL-based (Ví d
ụ ụ: OODAPLEX), và
association-based (Ví dụ: OQL/T) . Các ngôn ng th
ữ ời gian có 3 thành phần
truy vấn cơ ả
b n:
- Các đặc tả thời gian
- i
Các đ ều kiện lựa chọn dữ liệu
- Các thao tác với CSDL
39. Trang - 38 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
Hình 3. 4 i gian
Đồ thị đối tượng thờ
Ư đ ể ủ ứ ấ ả ệ
u i m c a hình th c hóa truy v n này là đơn gi n trong vi c xác định các
truy vấ ứ
n ph c tạp mà chúng bao hàm các lớp phức [SSH-98]. Mẫu củ ế
a các k t
hợp đối tượng thời gian có thể được đặc tả bằ ộ ể ứ ố ờ
ng m t bi u th c đại s th i
gian có chứa các lớp đối tượng và các toán tử đại số mà chúng đã được kết
nối trong một cấu trúc tuyến tính, cây hoặc mạng lưới.
Ví dụ Q1: Tìm tất cả các trình độ củ ỹ
a các k sư ữ đ
nh ng người ã tham gia
trong các dự án khi đang làm tại phòng ban có số hiệu phong ban dept_no =
“1” trong thời gian T [15, 30]. Biểu thức tương ứng của OQL/ T là:
CONTEXT Engineer AND (* Work_On * Project, * Dept)
WHEN T [15, 30]
WHERE Dept.dept_no = “1”
RETRIEVE Engineer.degree
Một truy vấn có thể được trình bày bằng một Query Graph (QG). Một QG là
một đồ thị con của SG như trình bày trong Hình 3.4 và trình diễn ngữ nghĩa
truy vấ ữ
n gi a các thực thể/các lớp miền (entity/domain classes) được đặc tả
trong truy vấn.
Hình 3. 5 Đồ thị truy vấn của Q1
40. Trang - 39 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
3.2 Đại số kết hợp thời gian
Các toán tử củ ố ẫ ủ ế ợ
a đại s TA thao tác trên các m u c a các k t h p đối tượng
thời gian để sinh ra các mẫu. [SSH-98] định nghĩa các toán tử đại số TA dựa
trên lý thuyết t p, phép tr th
ập h p v
ợ ới phép giao, phép hợ ừ ời gian trên tập các
thành viên. T T-Join, T-OJoin, và T-
ương tự, các toán tử đại số - TA như
Divide (xem ph n 3.2.5.2), s
ầ ử dụ ữ ĩ ứ ư ử
ng các ng ngh a tương ng nh các toán t
quan hệ ẫ
cho các thao tác trên các m u thời gian của các kết hợp ng
đối tượ
(xem phần 3.2.2).
3.2.1 Các mẫu kết hợp thời gian nguyên thuỷ
Trong việc xử lý truy vấn dựa mẫu, một m t h
ẫu kế ợp phức tạp có thể được
phân tích dựa vào một tập các mẫu c u di
ơ ở
s và các biể ễn đại số ứ
tương ng có
th i
ể đ
được thao tác sau ó bằng các toán tử đại số. Trong Hình 3.6, các kết nố
kết hợp thời gian được trình bày bằng các mũi tên liền nét. Nếu hai thể hiện
đối tượng thờ ế
i gian không được k t hợp trong một số khoảng thời gian, một
kết nối bù (được ký hiệu bằng mũi tên chấm chấm) được vẽ giữa chúng. Nếu
một truy vấn tường minh yêu cầ ể ệ
u các th hi n đối tượng thì nó không được
kết hợp với các cái khác.
Hình 3. 6 Minh họa liên kết kết hợp thời gian
Năm mẫu nguyên thuỷ được mô tả trong TOG trình bày trong Hình 3.6.
1. Mẫu thời gian bên trong (Temporal Inner Pattern- TIP) là một vectơ
đơn trong mộ ể
t TOG, bi u diễ ộ ể
n m t th hiệ ờ
n th i gian, có ký hiệu là:
s e i
{[t ,t ]a }.
41. Trang - 40 -
Nguyễn Thị ộ
H i – Công nghệ thông tin 2004
2. Mẫu kết nối thời gian trong (Temporal Interpattern-TI) là một k t n
ế ối
giữa 2 thể hiện thời gian được kết nối trong, có ký hiệu là: s e i j
{[t ,t ]a b }.
3. Mẫu kết hợp bù thời gian (Temporal Complement Pattern- TCP) mô tả
một quan hệ phi kết hợp giữa hai TIP, có ký hiệu là s e i j
{[t ,t ]C(a b )}.
4. M p
ẫu kết nối thời gian trong gián tiế (Temporal Derived Interpattern-
TDP) đặc tả kế ợ ủ ơ ề ề ế ố
t h p c a hai vect không li n k , chúng được k t n i
thông qua một đường dẫn c u là
ủa các TI, có ký hiệ s e i j
{[t ,t ]D(a b )}. Nó
ký hi p không tr p v
ệu hai thể hiện được kết hợ ực tiế ới các cái khác.
5. M p
ẫu kết nối trong bù thời gian gián tiế (Temporal Derived
Complement Pattern- TDCP) ký hiệu là: s e i j
{[t ,t ]DC(a )}
c . Mô tả ế
phi k t
hợp giữa hai vectơ không liền kề được kết nối thông qua một đường
dẫn chứa ít nhất một TCP.
Các mẫu nguyên thuỷ được trình bày kiể ị
u đồ th vớ ấ ố
i tính ch t đại s trong
Hình 3.7. Các mẫu kết hợ ứ
p ph c có thể được trình bày đại số bằ ộ ậ
ng m t t p
các mẫu kết hợp thời gian nguyên thuỷ, được minh hoạ trong Hình 3.8
3.2.2 Th n m
ể hiệ ẫu th u th
ời gian và tậ ẫ
p m ời gian
Đại số ộ ả ấ ằ ộ ẫ ớ
TA đưa ra m t đặc t truy v n b ng m t m u đầ đủ
y các l p đối tượng
và một đặc tả khoảng thời gian (time-interval). TPI có thể được biểu di n ki
ễ ểu
đại số như mộ ậ ủ ẫ ế ợ ờ ỷ ư đ
t t p c a các m u k t h p th i gian nguyên thu nh ã trình
bày ở mục 3.2.1.
Một tập mẫu thời gian -Temporal Pattern Set (TPS) là mộ ậ ủ ấ ả
t t p c a t t c các
TPI thoả mãn đặc tả ẫ ả
m u đầy đủ và kho ng thời gian của một truy vấn. Do đó,
TPS là một đồ th con c t t t h
ị ủa TOG. Một TPS là mộ ập c u k
ủa các tập mẫ ế ợp
thời gian nguyên thuỷ (các TPI). Đ ề
i u này được trình bày trong Hình 3.10.
Các toán tử đại số TA thực hiện trên một hoặc hai TPS để sinh ra một TPS.
• Một TPS được coi là đồng nhất nế ấ ả ủ
u t t c các TPI c a nó đều có mẫu
hoàn toàn giống nhau.
42. Trang - 41 -
Nguyễn Thị H i – Công ngh
ộ ệ thông tin 2004
• Một TPS là không đồng nhất nế ồ ạ ộ ố
u có t n t i m t s TPI mà không có
mẫu hoàn toàn giống nhau. Một TPS không đồng nhất có thể là kết quả
từ mộ ố ữ ả
t thao tác đại s gi a hai TPS không có kh nă ế ợ
ng k t h p
(nonunion-compatible).
3.2.3 So sánh khoảng thời gian
Các TPI biểu di u k
ễn các mẫ ết hợp, chúng có hiệu lực trong các khoảng thời
gian khác nhau. Do đó, đại số TA cần phải thao tác trên các khoảng thời gian
cũng như trên các mẫu kết hợp để thoả mãn các ngữ nghĩa truy vấn khác
nhau. Ý ngh a so sánh kho
ĩ ảng có th i h
ể được đặc tả trong các giớ ạn của các từ
khoá trong một ngôn ngữ truy vấ ở ứ
n m c cao (xem mục 3.3.1).
Đại số ả ằ ệ
- TA trình bày các so sánh kho ng khác nhau b ng vi c so sánh các
thời t i
đ ể
i m bắ đầu và thờ đ ể
i m kết thúc của hai khoảng, nó có thể được định
danh bằng hai hàm thời gian tương ứng là s( ) và e( ). Ví dụ: “e T
( 1) < s T
( 2)”
biểu diễn “ thời đ ể
i m kết thúc của T1 nhỏ hơ ờ đ ể ắ ủ
n th i i m b t đầu c a T2”; và
“ ( ( ( (
s T1) = s T2) ^ e T1) > e T2)” biểu di n “ 2 t
ễ T1 chứa T ừ lúc bắt đầu và tiếp
tục sau đó cho đến kết thúc T2 .”
Hình 3. 7 Các m i gian nguyên th
ẫu kết hợp thờ ủy
Hình 3. 8 Các mẫu kết hợp thời gian phức tạp
43. Trang - 42 -
Nguyễn Thị H i – Công ngh
ộ ệ thông tin 2004
Hình 3. 9 Các TPI và một TPS
3.2.4 Ký hiệu
Các ký hiệu được dùng trong biểu diễn các toán tử đại số TA (Bảng 3.1).
Riêng hợp khoảng (interval-union ) ( t
∪ ) được dùng để gộp - coalesce hai
khoảng chồng nhau hay các khoảng liền kề khi các mẫu kết hợp của chúng
được định danh.
Ví dụ: Đưa ra hai khoảng liền kề ớ
v i dữ liệu được xác định như : {{[1,5]en1},
{[6, n]en1}} hoặc hai khoảng chồng nhau với d li
ữ ệu xác định như: {{[5,
9]d1}, {[7, 25]d1}}, chúng có th t h
ể được kế ợp tương ứng thành: {{[1,
n]en1}} và {{[5, 25]d1}}.
3.2.5 Toán tử
Các toán tử được chia thành 3 nhóm:
• Hình thứ ẫ ỷ
c hóa các m u nguyên thu
• Thao tác mẫ ế ợ
u k t h p đối tượng
• Thao tác mẫ ế ợ
u không k t h p đối tượng
3.2.5.1 Hình thức hóa mẫu nguyên thuỷ
Trong quá trình xử lý một CSDL thời gian hướ ượ
ng đối t ng được trình diễn
bằng một đồ thị lược đồ (SG) và một đồ thị đối tượng thời gian (TOG), chúng
ta cần xác định và định danh các thể hiện đối tượng trong một cặp lớp đối
t ng
ượng mà chúng được kết hợp hoặc không kết hợp được với các đối tượ
khác thành thể th t t
ức của mộ ập các TI nguyên thuỷ hoặc TCP (xem mục
3.2.1). Có 3 toán tử cho các mẫu hình thức này là: T- Associate, T-
Complement, T-Nonassociate
44. Trang - 43 -
Nguyễn Thị H i – Công ngh
ộ ệ thông tin 2004
Bảng 3. 1 Các ký hiệu biểu diễn trong biểu thức đại số TA
A, B Các lớp đối tượng như Engineer và Project
W, X, Y, Z Tập các lớp như: W={Engineer, Project}
R(A,B) Liên kết giữa hai lớp A và B
P{R(A,B)} Mẫu kết hợp của R(A,B)
, , ,
α β γ ω Các TPS là một tập của các TPI
, ,
i j k
α β γ Các TPI của α , β , γ , 1<=i,j,k<=n
( )
P α Tập mẫu kết hợp của α
( )
i
P α Một thành phần mẫu kết hợp của α
( )
l
P ω Mẫu kết hợp của ω , 1<=l<=n, đươc mô tả trong các lớp của W
T
Một khoảng thời
( )
i
T α
Một khoảng thời gian của α
, ,
t t t
∪ ∩ − Tập các toán tử: Kết hợ ừ ủ ả ờ
p, Giao và Tr c a các kho ng th i gian
,
t t
⊆ ⊇ Các toán tử ủ
c a tập con
Ba toán tử trong nhóm này được trình bày sau đây: (xem trong hình 3.10 )
1.Toán tử kế ợ ờ
t h p th i gian - | ( , )|
(* )
R A B
T Associate
− . Toán tử này xác định
các kết n i t thông qua m t k t h
ối trong giữa hai lớp đố ượng A và B ột liên kế ế ợp
đặc biệ ự ữ ệ
t R(A,B) d a trên d li u được lư ộ
u trong b nhớ ặ ố
chính ho c CSDL c
định trước đ ả
ó. Thao tác này tr về tậ ẫ ỷ
p các m u nguyên thu kế ố
t n i trong đến
các đối tượng thời gian của A và B. Công thức như sau:
Công thức:
|R(A,B)|
t k k i j m n
i j m n k i t j
*
{ |P( )=P( ) P( ) a b ,
P( ), b P( ), a b P{R(A,B)},T( )=T( ) T( ) }
m n
a
α β γ
γ γ γ α β
α β γ α β φ
=
= ∪ ∪ ∪
⊆ ⊆ ∈ ∩ ≠
Trong đó am là một IP trong ( )
i
P α , bn là một IP trong ( )
j
P β , k
γ được cấu trúc
bằng việc liên kết hai TPI i
α và j
β bằ ộ
ng m t IP và ambn có một liên kết k t h
ế ợp
R(A, B) trong mộ ả ờ
t kho ng th i gian chung T( k
γ ). Mỗi TPI được biểu di n b
ễ ằ ộ
ng m t
45. Trang - 44 -
Nguyễn Thị Hội – Công nghệ thông tin 2004
tập các mẫu thời gian nguyên thuỷ không chứa bản sao, khi đó k
γ là một tập các
mẫu nguyên thuỷ được cấu trúc bằng việc hợp của i
α , j
β , và ambn trên một khoảng
thời gian chung - common time-interval T( k
γ ) mà các kết quả từ ủ
giao c a các
khoảng interval-intersect ( t
∩ ) giữ ả ủ
a các kho ng c a i
α và j
β . t k
γ
∪ gộp các khoảng
liền kề có các mẫu kết hợp ã
đ đượ đị
c nh danh.
2. Toán tử bù thời gian - ( ,
- T Complement (|[R A B)]). T-Complement định
danh tất c i t
ả các cặp đố ượng trong các lớp A và B mà nó không được kết nối
thông qua một liên kết k t h t t
ế ợ ệ
p đặc bi t R A
( , B). Kết quả là mộ ập TCP. Các
phi k t h
ế ợp của cặp này cũng được bao gồm trong kết quả.
Công thức:
|R(A,B)|
k k i j m n
i j m n k i t j
|
{ |P( )=P( ) P( ) (a b ),
P( ), b P( ), C(a b ) P{R(A,B)},T( )=T( ) T( ) }
m n
C
a
α β γ
γ γ γ α β
α β γ α β φ
=
= ∪ ∪
⊆ ⊆ ∈ ∩ ≠
Trong trường hợp đặc biệt, khi α (hoặc β ) là rỗng hoặc không có một TIP (ví
d i
ụ: không có thể hiện nào thoả mãn một đ ều kiện lựa chọn), tất cả các TIP
β (hoặc α ) chứa trong kết quả hình thức TPS các liên kết bù thời gian -
Temporal Complement với các OID có giá trị null.
3. Toán tử - T-Nonassociate( [R (A ,B )]
! ). T-Nonassociate định danh tấ ả
t c các
cặp của các đối tượng trong hai lớp đặc tả A và B. Một đối tượng của một lớp
trong một c t k th i t
ặp không chứa bấ ỳ quan hệ ời gian nào với các đố ượng của
các lớp khác thông qua các liên k t k t h
ế ế ợp được mô tả là R A B
( , ) trong một
hay một s t t
ố khoảng thời gian. Do đ ế
ó, k t quả là mộ ập của các TCP.
Công thức:
i j
|R(A,B)| i |P( )| i |R(A,B)| j |R(A,B)| j |P( )| i |R(A,B)| j
! {( - ( * ) ( - ( * )
α β
α β α α β β α β
= Π Π
Biểu thức trên chứa cả toán tử T-Complement(|) và hai mệnh đề - terms. Mỗi vế
chứa một toán tử chiếu T - Project(Π ộ ử ừ
) và m t toán t tr T - Difference(-). Trong
vế đầu tiên, i
[P( )] [R(A,B)]
( )
i j
α
Π α β
∗ ∗ chiếu trên tất cả ủ
các TPI c a α các kết h i b
ợp vớ ất
kỳ TPI nào của β . Sau đó, một toán tử T ệ ừ
-Difference(-) li t kê các các TPI t α , do
đ ỉ ủ
ó ch bao hàm các TPI c a α và nó không được kết h t k
ợp với bấ ỳ TPI nào của
46. Trang - 45 -
Nguyễn Thị Hội – Công nghệ thông tin 2004
β . Thủ tụ ự
c tương t đưa ra cho β . Sau ó, toán t T-Complement(|)
đ ử định danh bù
các liên kết giữa các TPI của α và β thông qua R(A, B).
T- Nonassociate không là nguyên thuỷ. Tuy nhiên, thao tác này cũng rất đầy
đủ cho việ ứ ấ đ ả
c công th c hoá truy v n và do ó bao hàm c tậ ủ ử
p c a các toán t
đại số ụ đ ủ ử ứ ẫ
- TA. Ví d sau ây trình bày các thao tác c a ba toán t hình th c m u
và Hình 3.10 minh hoạ chúng trên phương diện đồ thị :
Hình 3. 10 Các toán tử T- Associate, T- Complement và T-Nonassociate
Toán tử T-Complement(|) có nghĩa là: “Tất cả các cặp không k p c
ết hợ ủa các
TPI của hai lớp”. Tạ đ
i ó, toán tử T-Nonassociate(!) có nghĩa là “Các cặp TPI,
mà mỗi một trong chúng không có bất kỳ sự kế ợ ớ ủ
t h p nào v i các TPI c a các
lớp khác”. Do đó, các kết quả sau đó là các tập con của kết qua được hình
thức trước đó.
3.2.5.2 Thao tác mẫu
Các toán tử thao tác mẫu t ng t
ươ ự các toán tử đại s i tr
ố quan hệ ngoạ ừ mộ ố
t s
tính chất như sau:
• Một số trong chúng cho phép đặc tả mô hình hoá của các kết hợp đối
tượng, để ý nghĩa các thuộc tính không bị mất mát khi xử lý .
• Tất cả các toán tử có thể thực hiện trên cả TPS không đồng nhất và TPS
47. Trang - 46 -
Nguyễn Thị Hội – Công nghệ thông tin 2004
đồng nhất.
• Thao tác trên các khoả ờ ĩ ủ ử đ
ng th i gian là ý ngh a c a các toán t ó.
1) T-Join ( [W]
〈〉 ). T-Join ràng buộ ộ ặ
c m t c p TPI, mộ ả
t trong chúng có hai mô t
toán hạng TPS đặc biệ ế
t, n u hai TPS có một đặc tả mô hình con chung bởi W
và các khoảng thời gian của chúng chồng nhau. Thao tác này thực hiện ý
nghĩa của một t
đặc tả nhánh AND trong mộ đồ thị truy vấn (Xem hình 3.4).
Trong cách thực hiện này, các cấu trúc cây và mạ ứ ạ ớ
ng lưới ph c t p v i các
nhánh AND biểu di n d
ễn trong ngôn ngữ truy vấ ựa mẫu có thể được thực thi.
T-Join tương đương chứ ă ế ố ờ ệ ạ ừ
c n ng phép k t n i th i gian trong quan h , ngo i tr
rằng T-Join giải quyết các cặp của TPI. Chúng có thể có các cấu trúc rất phức
tạp được hình thức hoá bằng nhiều lớp thay vì các cặp của các bộ phẳng của
hai quan hệ thời gian.
Công thức:
[W]
k k i j l i j i j
{ |P( )=P( ) P( ), P( ) (P( ) P( ) ), ( ) ( ) ( ) }
k t
T T T
α β γ
γ γ γ α β ω α β φ γ α β φ
〈〉 =
= ∪ ⊆ ∩ ≠ = ∩ ≠
Biểu thức ( ) ( ) ( )
k i j
P P P
γ α β
= + biểu di n s
ễ ự ế
k t nhập củ ẫ
a các m u i
α và j
β . Biểu
thức (w ) ( ( ) ( ) )
l i j
P P P
α β φ
⊆ ∩ ≠ đặc tả một mẫu con là chung cho tấ ả
t c các TPI.
Hình 3.11 trình bày trên phương diệ ạ
n đồ ho của thao tác T-Join. T-Join được
thay đổi và kết hợp n
đ ề
i u kiệ được trình bày trong phần tiếp theo.
Việc kết hợp không luôn luôn đúng bởi vì có những trường hợp trong nội
dung một mẫu củaβ (trình bày bởi Y) là có lỗi khi đối sánh với b t k
ấ ỳ mẫu
nào trong γ (trình bày bởi Z), có th ng phép giao
ể thành công bằ đầu tiên với
một mẫu trong α (được trình diễn bởi Z) trong thao tác [W]
〈〉 và sau ó b
đ ằng
việc giao với một mẫu của γ trong thao tác [W']
〈〉
48. Trang - 47 -
Nguyễn Thị Hội – Công nghệ thông tin 2004
2) T-OJoin ( [W]
•
〈 〉 ). T-OJoin là tương tự vớ ố ệ
i outer-join trong đại s quan h .
Nó là T-Joins các TPI của hai TPS mở rộ ẻ ả
ng khi chúng cùng chia s đặc t
mẫu con giống nhau trong W. Hơn nữa, nó cũng bao hàm các TPI của một
toán hạng chứa các mẫu con trong W, nh
được đặc tả ưng không tương ng
ứ
với TPI trong toán hạng còn lại, chúng có các mẫu con giống nhau. Thao tác
này thực hi a c c t
ện ý nghĩ ủa đặ ả nhánh OR trong một đồ thị truy vấn.
Công thức:
[W]
[W]
k
(1) ( )
{ | (2) ( ) ( ( ) ( ), ( ) ( )
(3) ( ) ( ( ) ( ), ( ) (
k
l k i k t i
l k j k t j
P P P T T
P P P T T
α β γ
γ α β
γ γ ω γ α γ α
ω γ β γ β
•
〈 〉 =
∈ 〈〉
= ⊆ = ⊆
⊆ = ⊆
Biểu thức (1) trình bày một kết qu u th
ả TPI từ ộ
m t T-Join. Biể ức (2) và (3) trình bày
các vị trí thời gian tương ứng của i
α và j
β .
Một T-OJoin giữa các kết quả 1
α và 1
β trong một T-Join TPI và hai TPI đ ề
i u
ki ng
ện là chúng không có các vị trí thời gian tươ ứng trong các cái khác…
3) T-Select ( [p]
δ ). T-Select trích ch n các TPI t
ọ ừ mộ ạ
t toán h ng TPS mà nó
thoả mãn biểu thức Boolean của các tính chất i
được biểu diễn bở p
. Biểu
thức Boolean được ước lượng dựa vào mỗi TPI. Nếu kết quả đánh giá là true,
thì TPI chứa các kết quả của TPS.
Công thức:
ˆ
| | k k k k
ˆ
( ) , { | = |p( )=True}
p
δ α γ γ γ γ α α
= =
Ở đây, ( )
k
p α
có thể là:
- Một so sánh giữa hai thuộc tính (hoặc giữa một thuộc tính và một giá trị
đặc biệt)
- Một sự xác minh của kết nối giữa hai thể hiện (nh p c
ư các kết hợ ủa
chúng - association(*) hoặc các phi kết hợp của chúng -
nonassociation(!))
- Một so sánh của hai khoảng thời gian 1 2 1 2 1 2
,( ) , ( ) ( )
T T T T s T s T
φ
⊆ ⊆ ≠ ⊆
(đã thảo luận ở mục 3.3.3).
49. Trang - 48 -
Nguyễn Thị Hội – Công nghệ thông tin 2004
Hình 3. 11 Toán tử T- Join
Hình 3. 12 Toán tử T-OJoin
Thao tác ở trên được trình diễn dạng đồ hoạ trong Hình 3.12. p
bi u di n v
ể ễ ới
các phép so sánh khoảng thời gian phức tạp h n s
ơ ẽ được trình bày trong mục
3.4.2.
4) T-Project ( [W,T]
Π ). T-Project trích chọ ẫ ủ ộ ả ờ
n các m u con c a m t kho ng th i
gian quan tâm hoặc c a m
ả hai tử các TPI củ ột toán hạng TPS. Các mẫu con và
kho u
ảng thời gian được chiế được mô tả tương ứ ằ
ng b ng W và T
. Trong đại
số TA, toán hạng TPS có thể không đồng nhất và thao tác T-Project có thể
được dùng để đồ đồ
trích chọ ấ
n các c u trúc ng nhấ ừ ấ
t t các c u trúc không ng
nhất.
Công thức:
t k k i k k
|W,T|
( ) , { |P( ) P( ),P( ) P( ),T( ) }
T
α γ γ γ γ α γ ω γ
Π = = ∪ ⊆ ⊆ ⊆
Thao tác này sinh ra các TPI có thời gian hiệu lực liền k ho
ề ặc chồ ấ
ng l p và có các
mẫu kết hợp định danh. Với các khoảng thời gian có thể được kết hợp bằng t k
γ
∪ mà
vẫn duy trì được các ý nghĩa của các khoảng thời gian (xem lại mục 3.3.4).
50. Trang - 49 -
Nguyễn Thị Hội – Công nghệ thông tin 2004
Hình 3.13, 3.14 trình bày đồ hoạ ủ
c a các thao tác trên.
Hình 3. 13 Toán tử T- Select
Hình 3. 14 Toán tử T- Project
5) T-Union (+).
Công thức:
t k k k
, { | or }
α β γ γ γ γ α γ β
+ = = ∪ ∈ ∈
T-Union xây dựng một TPS chứa tất cả các TPI mà xuất hiện trong một hoặc cả hai
toán hạng TPS. Các TPI trong kết quả ủ ẫ
TPS, c a các m u giố ả
ng nhau và các kho ng
thời gian là liền kề hoặc chồ ấ
ng l p, được kết hợp vào mộ ả ờ
t kho ng th i gian đơn
bằng thao tác liên kết khoảng. T-Union dựa trên khái niệm giống như thao tác
Union quan hệ được áp dụng vào một CSDL thời gian. Tuy nhiên, các toán hạng
không cần phải có khả ă
n ng có thể ế
k t hợp - unioncompatible.
Hình 3.14 trình bày dạ ạ
ng đồ ho củ ế
a thao tác trên. Thao tác T-Union trên k t
hợp tất cả các TPI của hai toán hạng để sinh ra một TPS không đồng nhất.
6) T-Intersect (•).
Công thức:
k k k k t i j
,
{ |P( ) P( ) and P( ) P( ), T( )=T( ) T( ) for P( )=P( )}
α β γ
γ γ γ α γ β γ α β α β
• =
= ∈ ∈ ∩
T-Intersect tạo thành m n trong c
ột TPS chứa tất cả các TPI mà chúng xuất hiệ ả hai
mô tả TPS trong các khoảng thời gian hiệu lự Đ ề
c. i u này là trự ế ừ ộ
c ti p t m t thao
tác giao tập h p c
ợp - set-intersection trên hai tậ ủa các mẫu thời gian .
Hình 3.15 trình bày các toán hạng trên phương diện đồ hoạ.
51. Trang - 50 -
Nguyễn Thị Hội – Công nghệ thông tin 2004
7) T-Difference (-). T-Difference liệt kê tất cả các TPI củ ạ
a toán h ng TPS thứ
nhất nếu các mẫu giống nhau xuất hiện trong toán hạng TPS thứ hai trong một
số khoảng hiệu lực chung. Giống như T-Union và T-Intersect, thao tác này có
thể tính toán trên các toán hạng có các cấu trúc đồng nhất hoặc không đồng
nh u
ất và union-compatibility giữa các toán hạng thì không có bất cứ yêu cầ
nào.
Công thức:
k k k k i t j
,
{ |P( )=P( ),T( ) P( ) for P( ) P( ),T( )=T( ) - T( )for P( ) =P( )}
i j i i
α β γ
γ γ γ α γ β α β γ α β α β
− =
= ∈ ≠
Đ ề ệ ệ
i u ki n trong m nh đề thứ hai trình bày rằng một mẫu của một TPI trong α
không tồn tại trong β , và đ ề
i u kiện trong mệnh đề thứ ba trình bày rằng một mẫu
giống hệt nhau tồn tại trong cả α và β .
Hình 3. 15 Toán tử T- Union
Hình 3. 16 Toán tử T-Intersect
Thao tác được trình bày dạ ạ
ng đồ ho trong hình 3.16.
8) T-Divide (÷[W]). T-Divide đị đặ
nh danh mộ ủ ớ ộ
t nhóm c a các TPI v i m t c
trưng dữ liệu chung chắc chắn (ví dụ như các mẫu con - subpattern) trong
toán hạng TPS thứ nhất mà chứa tất cả các TPI trong toán hạng TPS thứ hai.
Mẫu con chung được mô tả bằng một tập các lớp được ký hiệu W. Sau đó, các
mẫu con chung được trích chọn từ các TPI được định danh bởi một T-Project.
Nếu không
W được mô tả, thao tác giữ lại tấ ả ủ ạ
t c các TPI c a toán h ng TPS
thứ nhấ ỗ
t, m i một trong chúng chúa đựng ít nhất là mộ ủ
t TPI c a β , và chúng
cùng chứa tất cả các TPI của β ( T-Project không không liên quan đến).
52. Trang - 51 -
Nguyễn Thị Hội – Công nghệ thông tin 2004
Công thức:
|W | |W |
k k k k
l S j S S S t j
( )
{ |P( )=P( ),P( ) , P( ) P( ), T( )=T ( ) T ( ) }
S
k k k
S S S S
α β γ
γ γ γ γ ω α β α γ α β φ
÷ = Π
= ⊆ ⊆ ∩ ≠
S
α là một tập con của các TPI của α , các mẫu con chung của chúng có các lớp
được mô tả ứ ấ ả ủ
trong W và cùng ch a t t c các TPI c a β . T-Project trích chọn các
mẫu con
Các thao tác trên được trình bày dạ ạ
ng đồ ho trong hình 3.17.
3.2.5.3 Thao tác mẫu không tính toán thời gian
Trong việc xử lý truy vấn, các toán tử đại số dự ể ệ ử
a trên các th hi n được s
dụng y
đầ đủ để xử lý các truy vấn thời gian chứa các mẫu thời gian phức tạp,
không liên quan đến các sự ki y ra có liên quan
ện xả đến thời gian.
Ví d i v
ụ: “Tìm tất cả các kỹ ư
s những ngườ ừa either làm việ ự
c trên d án trong
thời gian T[0, 20] hoặ ộ ề
c or thu c v mộ ả ờ
t phòng ban trong kho ng th i gian
T[25, n],” không thể xác định ngữ nghĩa của các thao tác giao, hợp, trừ phi
bi ng
ết thời gian tươ ứng. Đại số TA nắm bắt tất các các ngữ nghĩa rõ ràng
bằng các toán tử đại số phi thời gian.
1) NT-Intersect ( D
[W]). NT-Intersect xây dự ộ ứ ấ ả
ng m t TPS ch a t t c các TPI,
mà chúng có một mẫ ả ẫ ế ợ ủ
u con chung được mô t trong W và các m u k t h p c a
chúng xu t hi
ấ ện trong c m tra các kho
ả hai toán hạng TPS, bỏ qua việc kiể ảng
thời gian của chúng.
Công thức:
|W| t k k k l k
, { | and , P( ) P( )}
α β γ γ γ γ α γ β ω γ
= = ∪ ∈ ∈ ⊆
D
Thông qua các thao tác không đánh giá các đặc tả ờ ủ
th i gian c a các TPI, các
thể hiện được định danh mang trên nó thời gian của chính các đặc tả và các
mẫu của chúng.
53. Trang - 52 -
Nguyễn Thị Hội – Công nghệ thông tin 2004
Hình 3. 17 Toán tử T- Difference
Hình 3. 18 Toán tử T-Divide(+)
Hình 3. 19 Các toán t NT-Intersect, NT-Union và NT-Difference
ử
Kết quả các TPI với các khoảng liền kề hoặc chồng lấp sau đó được kết hợp
với nhau bằng t k
γ
∪ để duy trì các tính chất ý nghĩa của khoảng được thảo
luận trong mục 3.3.4. NT-Intersect có thể được thay thế và kết hợp các đ ề
i u
kiện (tham khảo lại phần T-Join với các đ ề
i u kiện ).
2) NT-Union ( [W]
⊕ ). NT-Union xây dự ộ ứ ấ ả
ng m t TPS ch a t t c các TPI mà
chúng có một mẫu con được mô tả bở ẫ ế ợ ấ
i W và chúng có các m u k t h p xu t
hiện trong một hoặc cả hai toán hạng TPS, không kiểm tra các khoảng thời
gian của chúng.
Công thức:
|W| t k k k l k
, { | or , P( ) P( )}
α β γ γ γ γ α γ β ω γ
⊕ = = ∪ ∈ ∈ ⊆