SlideShare a Scribd company logo
1 of 57
多媒體系統
教師:陳志華博士
報告大綱-影像處理原理與技術
影像處理系統
影像應用
色彩深度與色彩降階
輪廓描繪
去除雜訊
影像識別
2
影像處理系統
影像處理系統是由影像輸入設備、保存影像的儲存設備,以及處理影像的電腦等硬體組成
電腦影像類型
依「色彩深度」分類
◦ 黑白:僅有黑色和白色
◦ 灰階:可顯示不同的灰色程度變化
◦ 真彩(true color):可顯示真實色彩
依「紀錄影像方式」分類
◦ 點陣式:以像素來紀錄影像
◦ 向量式:以數學運算方式紀錄影像
依「影像畫面張數」分類
◦ 靜態影像:單一影像畫面,圖片
◦ 動態影像:多個影像畫面,影片
黑白 灰階 真彩
點陣式,原圖等比例放大,
漸層色彩無法變化
向量式,原圖等比例放大,
漸層色彩等比例變化
運用內插法
3
影像處理系統
像素(或稱畫素)(Pixel)為組成畫面的基本單位;簡單地說,一個畫面是有多少個「點」所
組成;像素決定解析度(Resolution),畫素愈高解析度越高
解析度以每英寸有多少點(Dots Per Inch, DPI)來表示,數值越高表示越精細,常見解析度:
◦ 影像解析度:一般電腦圖片,解析度越高表示構成圖片的點數越多;例如:圖片由長寬各15點所
構成,可以說這張圖的解析度是「15 x 15 pixels」
◦ 螢幕解析度:電腦螢幕的解析度是800 x 600,表示螢幕目前桌面大小是由「800 x 600」點所構成
◦ 數位相機解析度:數位相機主要以「百萬像素」來區分等級;是以影像感測器成像後「長邊像素
x 寬像畫素」來表示
等級 像素(長邊像素 x 寬像畫素) 長寬比
300萬 2,048 x 1,536=3,145,728 4:3
500萬 2,560 x 1,920=4,915,200 4:3
700萬 3,072 x 2,304=7,077,888 4:3
900萬 3,456 x 2,592 = 8,957,952 4:3
1,200萬 4,000 x 3,000 = 12,000,000 4:3
參考資料來源:http://kcs.kcjh.ptc.edu.tw/~spt/computer/digital-image/Pixe-reaolution.htm
4
影像處理系統
像素值與影像
33 x 25 (1%)
66 x 49 (2%)
98 x 74 (3%) 653 x 490 (20%)
164 x 123 (5%) 3264 x 2448 (100%)
5
影像處理系統
點陣式繪圖工具
◦ Adobe Photoshop (付費軟體)
◦ Corel PaintShop (付費軟體)
◦ GIMP (GNU Image Manipulation Program)(開放軟體)
向量式繪圖工具
◦ Adobe Illustrator (付費軟體)
◦ CorelDraw (付費軟體)
◦ Inkscape (開放軟體)
3D繪圖工具
◦ Autodesk 3ds Max (付費軟體)
◦ Autodesk Maya (付費軟體)
◦ Blender (開放軟體)
6
影像應用
影像處理技術已應用於日常生活的許多方面
◦ 影片畫面中的特殊效果
◦ 車牌、郵遞區號的自動識別
◦ 醫療用X射線電腦斷層掃瞄(Computed Tomography, CT)
各種影像實例
參考資料來源:林明德、吳上立,C語言數位影像處理:Windows/X-Window,全華圖書,2010。
7
領域 實例
辦公用 文件、圖形、商標
醫療用 超音波影像、顯微鏡影像、X射線影像、電腦斷層掃瞄影像
遙控感測 地球資源衛星影像、氣象衛星影像、航空照片、地圖
工廠 建築設計圖、設備設計圖、IC設計圖
傳播、電影 各種資料照片和影片、攝影機影像
其他 教學和研究用影像、印刷用影像
影像應用
影像處理系統的應用大致可分成三大領域:
◦ 影像形成:從符號、數值、類比訊號等情報,產生影像,也稱為「電腦圖學(Computer Graphics,
CG)」
◦ 影像處理:影像形成所輸出的電腦圖學影像,可與其他影像進行合成和後製
◦ 影像辨別:擷取有意義的符號情報,再做輸出,也稱為「電腦視覺(Computer Vision, CV)」
參考資料來源:林明德、吳上立,C語言數位影像處理:Windows/X-Window,全華圖書,2010。
圖片資料來源:發現台灣 http://m.discoverytaiwan.com.tw/post.php?i=114
合成後影像
8
色彩深度與色彩降階
色彩深度是用「n位元顏色」(n-bit color)來說明的
若色彩深度是n位元,即有2n種顏色選擇,而儲存每像素所用的位元數目就是n,常見的有:
◦ 1位元:21 = 2種顏色,可顯示黑白
◦ 8位元:28 = 256種顏色,可顯示灰階
◦ 24位元:224 = 16,777,216色,真彩,運用紅(Red)、綠(Green)、藍(Blue)三種顏色元素搭配;紅綠
藍(RGB)每個元素各有8位元,即28 = 256種程度變化(值域為0~255)
◦ 32位元:基於24位元,另增加8個位元(即28 = 256種)「透明」程度變化
參考資料來源:https://zh.wikipedia.org/wiki/色彩深度
9
色彩深度與色彩降階
黑白 灰階 真彩
色彩深度和點陣式圖片儲存空間(以600 x 500像素(30萬像素)圖片為例)
◦ 1位元:黑白圖片所需儲存空間為1 bit x 600 x 500 = 300,000 bits = 37,500 Bytes = 約37 KB
◦ 8位元:灰階圖片所需儲存空間為8 bits x 600 x 500 = 2,400,000 bits = 300,000 Bytes = 約293 KB
◦ 24位元:真彩圖片所需儲存空間為24 bits x 600 x 500 = 7,200,000 bits = 900,000 Bytes = 約879 KB
10
色彩深度與色彩降階
點陣式 vs. 向量式
◦ 點陣式,原圖等比例放大,漸層色彩無法變化
◦ 向量式,原圖等比例放大,漸層色彩等比例變化
11
色彩深度與色彩降階
點陣式 vs. 向量式
◦ 向量式,原圖等比例放大,漸層色彩等比例變化
◦ 向量式採用「內插法」,內插法為「(最大值-最小值)/(像素長度-1)x(像素長度-像素位置)」四捨五入
◦ 本例為最大值為127、最小值為0
◦ 大小為5 x 5像素:像素長度為5,第1像素值為「(127-0)/(5-1)x(5-1)=127」,第2像素值為「(127-0)/(5-1)x(5-2)=95」,依此類推
◦ 大小為10 x 10像素:像素長度為10,第1像素值為「(127-0)/(10-1)x(10-1)=127」,第2像素值為「(127-0)/(10-1)x(10-2)=113」,依此類推
◦ 大小為15 x 15像素:像素長度為15,第1像素值為「(127-0)/(15-1)x(15-1)=127」,第2像素值為「(127-0)/(15-1)x(15-2)=118」,依此類推
向量式繪圖僅需儲存
最大值、最小值
12
色彩深度與色彩降階
24位元色彩儲存在電腦裡主要存成1個整數資料型態,編碼方式說明如下:
◦ 第16~23位元為紅色
◦ 第8~15位元為綠色
◦ 第0~7位元為藍色
◦ 顏色(255, 0, 0)的整數值 = 223 + 222 + 221 + 220 + 219 + 218 + 217 + 216 = 16,711,680
◦ 色彩編碼案例:
(R, G, B) 紅 綠 藍 整數值
2的次方數 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0
(255, 0, 0) 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 16,711,680
(0, 255, 0) 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 65280
(0, 0, 255) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 255
(0, 0, 0) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
(255, 255, 255) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 16,777,215
13
色彩降階:從高階色彩降為低階色彩
◦ 由灰階降為黑白
◦ 由真彩降為灰階
◦ 由真彩降為黑白
◦ 自訂降階維度
由灰階降為黑白的方式
◦ 灰階為8位元,黑白為1位元
◦ 方式一:8位元的值欲轉換為1位元的值,故需將8位元的值除以128 (即2的7次方(8 – 1 = 7))再取整數
◦ 方式二:二值影像處理法,設定一門檻值,當高於門檻於時為1,小於門檻值時為0
由真彩降為灰階的方式
◦ RGB值一樣時會產生灰色
◦ 真彩為24位元,紅綠藍各8位元,灰階為8位元
◦ 計算紅綠藍3個值的平均,並且取整數
色彩深度與色彩降階
由灰階降為黑白
可統計整張圖片的色彩
機率分析,來選定最佳
的門檻值
14
色彩深度與色彩降階
由真彩降為灰階的方式
◦ 計算紅綠藍3個值的平均,並且取整數
◦ (255, 255, 255) = (255 + 255 + 255) / 3 → 255
◦ (255, 0, 0) = (255 + 0+ 0) / 3 → 85
◦ (0, 255, 0) = (0+ 255 + 0) / 3 → 85
◦ (0, 0, 255) = (0+ 0+ 255) / 3 → 85
◦ (85, 85, 85) = (85+ 85+ 85) / 3 → 85
◦ (127, 1, 127) = (127+ 1+ 127) / 3 → 85
◦ (31, 31, 0) = (31+ 31+ 0) / 3 → 20
◦ (0, 31, 31) = (0+ 31+ 31) / 3 → 20
◦ (31, 0, 31) = (31+ 0+ 31) / 3 → 20
由真彩降為灰階
15
色彩深度與色彩降階
自訂降階維度
◦ 紅綠藍各8位元(值域為0~255) ,降階後為各1位元(值域為0~1)
◦ 8位元的值欲轉換為1位元的值,故需將8位元的值除以128 (即2的7次方(8 – 1 = 7))再取整數
◦ 255 / 128 → 1
◦ 127 / 128 → 0
◦ 85 / 128 → 0
◦ 31 / 128 → 0
◦ (255, 255, 255) → (1, 1, 1)
◦ (255, 0, 0) → (1, 0, 0)
◦ (0, 255, 0) → (0, 1, 0)
◦ (0, 0, 255) → (0, 0, 1)
◦ (85, 85, 85) → (0, 0, 0)
◦ (127, 1, 127) → (0, 0, 0)
自訂降階維度(由各8位元降到各1位元)
16
色彩深度與色彩降階
自訂降階維度
◦ 紅綠藍各8位元(值域為0~255) ,降階後為各2位元(值域為0~3)
◦ 8位元的值欲轉換為2位元的值,故需將8位元的值除以64 (即2的6次方(8 – 2 = 6))再取整數
◦ 255 / 64 → 3
◦ 127 / 64 → 1
◦ 85 / 64 → 1
◦ 31 / 64 → 0
◦ (255, 255, 255) → (3, 3, 3)
◦ (255, 0, 0) → (3, 0, 0)
◦ (0, 255, 0) → (0, 3, 0)
◦ (0, 0, 255) → (0, 0, 3)
◦ (85, 85, 85) → (1, 1, 1)
◦ (127, 1, 127) → (1, 0, 1)
自訂降階維度(由各8位元降到各2位元)
17
色彩深度與色彩降階
滑鼠左鍵連擊「程式執行檔click_me.bat」兩下執行影像處理程式
18
色彩深度與色彩降階
輸入圖檔路徑,本例為「C:UsersuserDesktop創夢工場.jpg」,並點擊Enter鍵
19
色彩深度與色彩降階
輸入色彩降階維度,本例假設紅綠藍各降階為1位元,輸入值為「128」,並點擊Enter鍵
20
色彩深度與色彩降階
輸入色彩差異度,後續說明此差異度用途,並點擊Enter鍵
21
色彩深度與色彩降階
程式執行完成後將自動關閉
可瀏覽紅綠藍3原色的值所搭配產生的圖檔內容
r.png檔
僅保留R值,而G值和B值設為0
g.png檔
僅保留G值,而R值和B值設為0
b.png檔
僅保留B值,而R值和G值設為0
22
色彩深度與色彩降階
程式執行完成後將自動關閉
可瀏覽紅綠藍3原色的值所搭配產生的圖檔內容
r+g.png檔
僅保留R值和G值,而B值設為0
r+b.png檔
僅保留R值B值,而G值設為0
g+b.png檔
僅保留B值和G值,而R值設為0
23
色彩深度與色彩降階
程式執行完成後將自動關閉
可瀏覽色彩降階產生的圖檔內容
灰階
自訂降階維度
(由各8位元降到各1位元)
自訂降階維度
(由各8位元降到各2位元)
24
色彩深度與色彩降階
程式執行完成後將自動關閉
可瀏覽色彩降階產生的圖檔內容
自訂降階維度
(由各8位元降到各4位元)
自訂降階維度
(由各8位元降到各5位元)
自訂降階維度
(由各8位元降到各3位元)
25
隨堂練習
請自己選擇喜歡的圖片,並執行「程式執行檔click_me.bat」執行影像處理程式
嘗試執行不同的色彩降維之維度,並瀏覽色彩降維後的結果
原始圖檔
自訂降階維度
(由各8位元降到各1位元)
自訂降階維度
(由各8位元降到各2位元)
26
色彩深度與色彩降階
取得紅色圖片之演算法虛擬碼(pseudocode)
◦ //height為圖片高度、width為圖片寬度
◦ //image.r為紅色元素、image.g為綠色元素、image.b為藍色元素
◦ //original為原始圖片、new為新增圖片
◦ for(int j = 0; j < height; j++){
◦ for(int i = 0; i < width; i++){
◦ original_image_p = original_image.getRGB(i, j);
◦ new_image_p.r = original_image_p.r;
◦ new_image_p.g = 0;
◦ new_image_p.b = 0;
◦ new_image.setRGB(i, j, new_image_p);
◦ }
◦ }
27
色彩深度與色彩降階
取得灰階圖片之演算法虛擬碼(pseudocode)
◦ //height為圖片高度、width為圖片寬度
◦ //image.r為紅色元素、image.g為綠色元素、image.b為藍色元素
◦ //original為原始圖片、new為新增圖片
◦ for(int j = 0; j < height; j++){
◦ for(int i = 0; i < width; i++){
◦ original_image_p = original_image.getRGB(i, j);
◦ mean = (original_image_p.r + original_image_p.g +
original_image_p.b) / 3
◦ new_image_p.r = mean;
◦ new_image_p.g = mean;
◦ new_image_p.b = mean;
◦ new_image.setRGB(i, j, new_image_p);
◦ }
◦ }
28
色彩深度與色彩降階
色彩降階之演算法虛擬碼(pseudocode)
◦ //height為圖片高度、width為圖片寬度
◦ //image.r為紅色元素、image.g為綠色元素、image.b為藍色元素
◦ //original為原始圖片、new為新增圖片
◦ for(int j = 0; j < height; j++){
◦ for(int i = 0; i < width; i++){
◦ original_image_p = original_image.getRGB(i, j);
◦ new_image_p.r = original_image_p.r / 128;
◦ new_image_p.g = original_image_p.g / 128;
◦ new_image_p.b = original_image_p.b / 128;
◦ new_image.setRGB(i, j, new_image_p);
◦ }
◦ }
29
輪廓描繪
輪廓定義和原理
◦ 影像中物體與物體,或者物體與背景的交界線,形成了所謂的「輪廓」
◦ 在影像的灰階濃度和色彩發生急劇變化之處,就可以見到「輪廓」
◦ 自然影像中,當色彩產生變化時,一定也伴隨著相當程度的灰階濃度變化
◦ 因此,在擷取輪廓時,首先應當著重於灰階濃度的變化
輪廓描繪方法
◦ 利用「微分」擷取影像的輪廓
◦ 輪廓是濃度急遽變化的部分,只要利用影像灰階濃度函數變化部分之微分運算,就能擷取輪廓
◦ 用來表示座標(x,y)濃度分配之微分值(也稱為梯度(gradient)),可用含有大小與方向之向量(vector),
G(x,y)=(fx, fy)表達;其中,fx為x方向的微分,fy為y方向的微分
x方向的微分:fx =f(x+1,y)-f(x,y)
y方向的微分:fy =f(x,y+1)-f(x,y)
參考資料來源:林明德、吳上立,C語言數位影像處理:Windows/X-Window,全華圖書,2010。
30
輪廓描繪
輪廓描繪方式一
◦ 先對影像進行色彩降階
◦ 再對降階後影像,判斷相鄰顏色是否相同,決定是否為輪廓
◦ 若顏色相同(即微分值小於0),則代表為同一個區塊,非輪廓
◦ 若顏色不同(即微分值大於0),則代表不為同一個區塊,是輪廓
自訂降階維度(由各8位元降到各1位元)
輪廓描繪結果
31
輪廓描繪
滑鼠左鍵連擊「程式執行檔click_me.bat」兩下執行影像處理程式
32
輪廓描繪
輸入圖檔路徑,本例為「C:UsersuserDesktop創夢工場.jpg」,並點擊Enter鍵
33
輪廓描繪
輸入色彩降階維度,本例假設紅綠藍各降階為1位元,輸入值為「128」,並點擊Enter鍵
34
輪廓描繪
輸入色彩差異度,後續說明此差異度用途,並點擊Enter鍵
35
輪廓描繪
程式執行完成後將自動關閉
可瀏覽基於色彩降階產生的輪廓圖檔「outlineWithReduce.png」
原始圖檔
自訂降階維度
(由各8位元降到各1位元)
基於色彩降階產生的輪廓圖檔
(由各8位元降到各1位元)
36
輪廓描繪
程式執行完成後將自動關閉
可瀏覽基於色彩降階產生的輪廓圖檔「outlineWithReduce.png」
基於色彩降階產生的輪廓圖檔
(由各8位元降到各2位元)
基於色彩降階產生的輪廓圖檔
(由各8位元降到各3位元)
基於色彩降階產生的輪廓圖檔
(由各8位元降到各4位元)
37
輪廓描繪
輪廓描繪方式二
◦ 先設定一色彩差異度門檻值
◦ 判斷相鄰顏色的差異度是否大於門檻值,決定是否為輪廓
◦ 若顏色相似,即差異度小於等於門檻值(即微分值小於等於差異度門檻值),則代表為同一個區塊,非輪廓
◦ 若顏色不相似,即差異度大於門檻值(即微分值大於差異度門檻值),則代表不為同一個區塊,是輪廓
原始圖檔 輪廓描繪結果
差異度門檻值設定為5
38
輪廓描繪
滑鼠左鍵連擊「程式執行檔click_me.bat」兩下執行影像處理程式
39
輪廓描繪
輸入圖檔路徑,本例為「C:UsersuserDesktop創夢工場.jpg」,並點擊Enter鍵
40
輪廓描繪
輸入色彩降階維度,本例假設紅綠藍各降階為1位元,輸入值為「128」,並點擊Enter鍵
41
輪廓描繪
輸入色彩差異度,將依差異度門檻值繪製輪廓,並點擊Enter鍵
42
輪廓描繪
程式執行完成後將自動關閉
可瀏覽基於色彩降階產生的輪廓圖檔「outlineWithRGB.png」
原始圖檔 色彩差異度為5 色彩差異度為1
43
輪廓描繪
程式執行完成後將自動關閉
可瀏覽基於色彩降階產生的輪廓圖檔「outlineWithRGB.png」
色彩差異度為10 色彩差異度為15 色彩差異度為20
44
輪廓描繪
將輪廓圖檔套疊於原始圖檔上進行影像合成,可產生畫作
可瀏覽影像合成後的圖檔「imageWithOutline.png」
原始圖檔 色彩差異度為5 影像合成後
45
輪廓描繪
將輪廓圖檔套疊於原始圖檔上進行影像合成,可產生畫作
可瀏覽影像合成後的圖檔「imageWithOutline.png」
原始圖檔 色彩差異度為5 影像合成後
圖片資料來源:發現台灣 http://m.discoverytaiwan.com.tw/post.php?i=114
46
隨堂練習
請自己選擇喜歡的圖片,並執行「程式執行檔click_me.bat」執行影像處理程式
嘗試執行不同的色彩降維之維度和色差異度門檻值,並輪廓繪製的結果
原始圖檔
基於色彩降階
產生輪廓圖檔
基於色彩差異度門檻值
產生輪廓圖檔
47
輪廓描繪
基於色彩降階產生輪廓圖檔之演算法虛擬碼(pseudocode)
◦ for(int j = 0; j < height - 1; j++){
◦ for(int i = 0; i < width - 1; i++){
◦ p = reduce_image.getRGB(i, j);
◦ right = reduce_image.getRGB(i+1, j);
◦ down = reduce_image.getRGB(i, j+1);
◦ if(p == right && p == down)
◦ new_image.setRGB(i, j, WHITE);
◦ else
◦ new_image.setRGB(i, j, BLACK);
◦ }
◦ }
48
輪廓描繪
基於色彩差異度門檻值產生輪廓圖檔之演算法虛擬碼(pseudocode)
◦ //diff為色彩差異度
◦ for(int j = 0; j < height - 1; j++){
◦ for(int i = 0; i < width - 1; i++){
◦ p = reduce_image.getRGB(i, j);
◦ right = reduce_image.getRGB(i+1, j);
◦ down = reduce_image.getRGB(i, j+1);
◦ if(|p.r - right.r| < diff && |p.g - right.g| < diff &&
|p.b - right.b| < diff && |p.r - down.r| < diff &&
|p.g - down.g| < diff && |p.b - down.b| < diff)
◦ new_image.setRGB(i, j, WHITE);
◦ else
◦ new_image.setRGB(i, j, BLACK);
◦ }
◦ }
49
去除雜訊
所謂「雜訊」的本意,是外界所有干擾的總稱
◦ 在收視的影像上面,出現各種形式的干擾斑點、條紋等等,此即為影像雜訊(noise)
雜訊性質
◦ 畫面上雜訊出現的位置,呈現不規則分佈
◦ 雜訊的大小不規則
「隨機雜訊」是最難理出頭緒,也是最常見的雜訊
◦ 當我們對某個靜止物體進行連續拍攝時,雜訊也會不定時地隨機出現
◦ 各個瞬間雜訊出現的位置和大小也會產生變化
參考資料來源:林明德、吳上立,C語言數位影像處理:Windows/X-Window,全華圖書,2010。
50
去除雜訊
利用平滑化去除雜訊的方法
◦ 雜訊,因為有急遽變化的灰階濃度差異,所以相
當刺眼
◦ 讓這種灰階濃度差異平滑,藉以除去雜訊的方法,
一般稱之為平滑化(smoothing)
◦ 移動平均法是最簡單的雜訊去除法
51
參考資料來源:林明德、吳上立,C語言數位影像處理:Windows/X-Window,全華圖書,2010。
影像識別
影像識別
◦ 擷取有意義的符號情報,再做輸出
◦ 深度學習「卷積神經網路」為
有效的影像識別方法
在卷積層經由過濾
器擷取出資料特徵
經由過濾器計算後
的特徵圖
在池層進行資料降
維,節省計算量
經由神經網路對
應目標學習結果
機器人圖片來源:
Eyebot Chat Room.
Url: https://goo.gl/gpMrK9
A
52
假設過濾器為3x3大小
取出原始資料左上角的3x3
區塊與過濾器做矩陣相乘
先往右移動,並進行矩陣相乘
整列完成後,再往下一列移動
移動到最右下角之
3x3區塊計算完成後
即結束卷積層計算
卷積層適用於分析
空間相依
影像識別
卷積層計算─特徵擷取
53
影像識別
池層計算─資料降維
每2x2大小矩陣取
最大值進行降維
54
影像識別
神經網路計算─資料估計(分類)
神經網路
A
B
經由神經網路對
應目標學習結果
55
影像識別
深度的意涵? 原始資料 卷積層1
過濾器 分析結果
直線
橫線
正斜線
反斜線
弧線
曲線
有/無
直線
有/無
橫線
有/無
正斜線
有/無
反斜線
有/無
弧線
有/無
曲線
卷積層2
過濾器 分析結果
直線
橫線
正斜線
反斜線
弧線
曲線
有/無
正方形
有/無
長方形
有/無
三角形
有/無
菱形
有/無
圓形
有/無
橢圓形
卷積層3
過濾器 分析結果
直線
橫線
正斜線
反斜線
弧線
曲線
有/無
立方體
有/無
長方體
有/無
錐體
有/無
菱面體
有/無
球體
有/無
橢球體
神經網路
是否為
拱橋
是否為
湖泊
是否為
彩虹
是否為
Logo
第1層可找出
線條特徵
第2層可找出
平面特徵
第3層可找出
立體特徵 56
影像識別
為什麼傳統神經網路較難解決空間相依性問題?
◦ 直接把像素值攤開,不易取得特徵
◦ 直接從像素值對應到分類結果,不易學習
卷積神經網路的優勢
◦ 運用過濾器分析空間特徵
如:直線、橫線、斜線、曲線
◦ 運用多層卷積層拆解不同維度空間特徵
如:線段、平面、立體、外觀
◦ 最後再依拆解出特徵對應到分類結果
神經網路
A
B
…
輸入層 隱藏層 輸出層
傳統神經網路不易
分析出神經元3和
神經元8是斜線關聯
傳統神經網路把每
個像素值攤開來看,
不易分析特徵
模仿人類辨識物件的方式,先拆解出外觀特徵,再從
外觀特徵來評估目標物件的類別
57

More Related Content

More from Fuzhou University

More from Fuzhou University (20)

人工智慧09_神經網路(TensorFlow+Keras)
人工智慧09_神經網路(TensorFlow+Keras)人工智慧09_神經網路(TensorFlow+Keras)
人工智慧09_神經網路(TensorFlow+Keras)
 
多媒體系統08_Inkscape繪製圖形與漸層
多媒體系統08_Inkscape繪製圖形與漸層多媒體系統08_Inkscape繪製圖形與漸層
多媒體系統08_Inkscape繪製圖形與漸層
 
機器學習工具_微軟Azure Machine Learning Studio
機器學習工具_微軟Azure Machine Learning Studio機器學習工具_微軟Azure Machine Learning Studio
機器學習工具_微軟Azure Machine Learning Studio
 
論文導讀03_集成神經網路(智慧交通)
論文導讀03_集成神經網路(智慧交通)論文導讀03_集成神經網路(智慧交通)
論文導讀03_集成神經網路(智慧交通)
 
論文導讀02_神經網路(智慧交通)
論文導讀02_神經網路(智慧交通)論文導讀02_神經網路(智慧交通)
論文導讀02_神經網路(智慧交通)
 
論文導讀01_k個最近鄰居(行動定位)
論文導讀01_k個最近鄰居(行動定位)論文導讀01_k個最近鄰居(行動定位)
論文導讀01_k個最近鄰居(行動定位)
 
人工智慧08_神經網路
人工智慧08_神經網路人工智慧08_神經網路
人工智慧08_神經網路
 
多媒體系統07_Android App影音互動擴增實境
多媒體系統07_Android App影音互動擴增實境多媒體系統07_Android App影音互動擴增實境
多媒體系統07_Android App影音互動擴增實境
 
多媒體系統06_影音編輯軟體Movie Maker
多媒體系統06_影音編輯軟體Movie Maker多媒體系統06_影音編輯軟體Movie Maker
多媒體系統06_影音編輯軟體Movie Maker
 
多媒體系統05_Android App圖形元件
多媒體系統05_Android App圖形元件多媒體系統05_Android App圖形元件
多媒體系統05_Android App圖形元件
 
多媒體系統04_GIMP繪圖、特效、動畫
多媒體系統04_GIMP繪圖、特效、動畫多媒體系統04_GIMP繪圖、特效、動畫
多媒體系統04_GIMP繪圖、特效、動畫
 
多媒體系統03_GIMP影像合成與圖層應用
多媒體系統03_GIMP影像合成與圖層應用多媒體系統03_GIMP影像合成與圖層應用
多媒體系統03_GIMP影像合成與圖層應用
 
多媒體系統01_安裝開發環境
多媒體系統01_安裝開發環境多媒體系統01_安裝開發環境
多媒體系統01_安裝開發環境
 
人工智慧02_大數據分析與機器學習概論
人工智慧02_大數據分析與機器學習概論人工智慧02_大數據分析與機器學習概論
人工智慧02_大數據分析與機器學習概論
 
人工智慧07_迴歸方法(智慧交通)
人工智慧07_迴歸方法(智慧交通)人工智慧07_迴歸方法(智慧交通)
人工智慧07_迴歸方法(智慧交通)
 
人工智慧06_決策樹
人工智慧06_決策樹人工智慧06_決策樹
人工智慧06_決策樹
 
人工智慧05_k個最近鄰居(醫療旅遊)
人工智慧05_k個最近鄰居(醫療旅遊)人工智慧05_k個最近鄰居(醫療旅遊)
人工智慧05_k個最近鄰居(醫療旅遊)
 
人工智慧04_貝氏分類和貝氏網路
人工智慧04_貝氏分類和貝氏網路人工智慧04_貝氏分類和貝氏網路
人工智慧04_貝氏分類和貝氏網路
 
人工智慧03_關聯規則
人工智慧03_關聯規則人工智慧03_關聯規則
人工智慧03_關聯規則
 
人工智慧01_安裝機器學習開發環境
人工智慧01_安裝機器學習開發環境人工智慧01_安裝機器學習開發環境
人工智慧01_安裝機器學習開發環境
 

多媒體系統02_影像處理原理與技術