SlideShare a Scribd company logo
1 of 7
自聯想神經網路之企業危機預測<br />The Business Failure Prediction by Autoassociative Neural Networks<br />陳明華<br />嶺東科技大學 資訊管理系 <br />Email:mhc@teamail.ltu.edu.tw<br />摘要<br />    自聯想神經網路(Autoassociative Neural Networks, AANN)大多應用於資料壓縮、故障偵測或資料插補,其應用於企業危機預測(Business Failure Prediction, BFP)尚未有文獻著墨。本研究以AANN搭配基因演算法(Genetic Algorithm, GA)建構一BFP分類預測模型,並使用主成份分析(Principle Component Analysis, PCA)對自變數作因次縮減(Dimensionality Reduction, DR),整合模型稱PCA-AANNGA,並與傳統前饋多層感知器網路(Feedforward Multilayer Perceptron Networks, FMPN)模型做比較。本研究以1996至2005年間於中國上海與深圳掛牌上市公司,共884家,其中268家危機公司與616家正常公司,為本研究訓練與測試樣本,所得結果顯示,PCA-AANNGA模型預測正確率稍優於FMPN模型,故本研究主要貢獻在提供一較佳之PCA-AANNGA模型,可作為企業危機預測之另一可行模型。<br />關鍵字:自聯想神經網路、企業危機預測、基因演算法、主成份分析<br />Abstract<br />The applications of autoassociative neural networks (AANN) are mostly addressed on the issue of data compression, fault diagnosis or data imputation, but it has not been applied for the business failure prediction (BFP) yet so far. In this paper, the AANN is combined with genetic algorithm (GA) and principle component analysis (PCA), by which the dimensionalities of independent variables are condensed, to construct a classification model for BFP, so called PCA-AANNGA model. The sample in this study includes 884 Chinese companies listed in Shanghai Stock Exchange or in Shenzhen Stock Exchange during 1996 to 2005, which contains 268 failure companies and 616 health companies. In Comparison with the conventional feedforward multilayer perceptron network (FMPN) model, the proposed PCA-AANNGA model performs better either with a higher correct rate for predicting the failure of company, or with a higher AUC value. This empirical result shows that the PCA-AANNGA model is superior to the FMPN model as an alternative to predict business failure.         <br />Keywords:Autoassociative neural networks, <br />Business failure prediction, Genetic algorithm,<br />Principle component analysis <br />簡介<br />由於現代企業環境諸多不確定性及企業必須面對全球競爭,若企業經營不善或景氣驟變,很容易就發生企業危機(Business Failure),企業危機造成公司與員工極大的經濟損失,因此企業危機預測(Business Failure Prediction,BFP)(以下簡稱為BFP)受到包括投資者、經理人、員工、政府官員及學術界的高度關心與興趣。所以,如何預測企業危機或提昇BFP的正確率,便成為一重要且熱門的研究主題 (Li, Sun, 2009)。<br />因為至今沒有關於BFP的成熟經濟理論,對於BFP之相關研究流於試誤(trial-and error)選擇關鍵屬性的迭代過程(Bryant, 1997)。事實上,企業危機不是瞬間發生,而是經過一段時間的變化而發生的(Altman,1968; Lincoln,1984; Lin, McClean, 2001)。因此如果有一套模型能夠預警企業即將危機,才能夠及時做出預防措施,並降低財產損失。<br />隨著統計學、資訊科學、電腦科學、決策科學與人工智慧等領域的不斷進步與發展,有許多統計方法與計算智慧方法被引用於BFP之研究。而過去尚未見有文獻結合自聯想神經網路(AANN)與基因演算法(GA),以下簡稱為PCA-AANNGA模型,應用於企業危機之預測,本研究將嘗試此新方法,建構一分類模型,以便進行企業危機預警。<br />類神經網路(Artificial Neural Networks, ANN)是由許多處理神經元相互連結的複雜計算模型。ANN具有學習非線性系統的能力。基於要有比較對象,本研究也根據ANN模型,建構一前饋多層感知網路(FMPN),其網路架構如圖1所示(Bishop, 1995)。已經有許多文獻使用FMPN對BFP進行研究(Odom, Sharda, 1990; Tam, 1991; Salchenberger, etc., 1992; Tam, Kiang, 1992; Wilson, Sharda, 1994; Lee, etc., 1996; Leshno, Spector, 1996; Tasi, Wu, 2008),結果顯示與傳統之統計方法如羅吉斯回歸(Logistic Regression, LR)或多元區別分析(Multiple Discriminant Analysis, MDA)比較,FMPN有較佳效能表現。更多關於ANN與FMPN介紹可參考(Svozil, etc., 1997; Rafiq, etc., 2001)。<br />過去文獻已有許多使用FMPN模型,進行BFP的研究(Odom, Sharda, 1990; Tam, 1991; Salchenberger, etc., 1992; Tam, Kiang, 1992; Wilson, Sharda, 1994; Lee, etc., 1996; Leshno, Spector, 1996; Tasi, Wu, 2008)。但並未見有文獻使用自聯想神經網路(AANN),做相關BFP 之研究,但有文獻用AANN進行愛滋病毒(HIV)分類(Betechuoh, etc., 2006),其研究結果指出AANN分類正確率92%,高於FMPN的84%,因此,本研究擬使用AANN對BFP作分類預測,並與FMPN模型做比較。另外,本研究使用之AANN需搭配基因演算法(GA)完成,GA為一最佳化方法,啟發自達爾文之自然演化理論 (Holland, 1975; Goldberg, 1989),以程式實做一群染色體進行演化模擬,尋求最佳染色體,而每條染色體是由許多基因組成。本研究中此基因即代表遺失之輸入變數 (即欲求取之企業危機屬性類別值),GA使用適應函數以篩選正確之遺失變數值,雖然不保證一定可得全域最佳解,但GA可很有效率的趨近於全域最佳解,更多關於GA可參考文獻(Davis, 1991; Michalewicz, 1996)。 <br />因面對的問題特性隨領域差異而稍有不同,HIV分類研究中自變數只有8個,而BFP問題通常至少有30個以上的自變數,而且這些自變數極可能存在相依關係,故本研究以主成份分析(PCA) (Shlens, 2009)對自變數作前處理,除可去除其線性相依關係,並可減少後續網路訓練與測試時間。本研究最後採用PCA與結合自聯想神經網路(AANN)與基因演算法(GA),即PCA-AANNGA模型,應用於企業危機之預測,並與FMPN模型做性能比較。<br />理論基礎<br />2.1 自相關神經網路( AANN)<br /> AANN是監督式類神經網路(ANN)模型之一,其訓練之期望輸出與網路輸入相同。因此訓練完之AANN,當有輸入時,AANN將輸出與輸入相近的值(Frolov, etc, 1995; Atalla, Inman, 1998; Hines, etc, 1998; Smauoi, Al-Yakoob, 2003)。AANN之輸入層與輸出層有相同數目之神經元,中間的隱藏層神經元數目較少(Lu, Hsu, 2002)。隱藏層試圖重建輸入值,而於輸出層輸出,其較窄的隱藏層可強迫去除輸入的冗餘,但仍然保有非冗餘數據。但必須注意的是,本研究是利用AANN模型做缺漏數據推定,隱藏層神經元數目不應如資料壓縮應用中盡可能小,為求精確,應做最佳化選擇。AANN網路架構如圖2所示。<br />2.2 傳統統計模型分類<br />本研究目的是正確識別危機企業,若使用傳統統計模型(Statistical Pattern Classification, SPC),所需變數包含了企業各財務指標{x},及企業危機類別值。若SPC輸出設為{y},則SPC模型被要求將輸入{x},映射到輸出{y},當使用數學函數描述此映射關係,可表為下式<br />y=fx,w     ,                           (1)<br />其中{w}是映射權重,{x} 與{y}分別表示輸入與輸出變數,分類模型目的是設計一決策超平面對新的輸入做正確類別判定(Bishop, 1995)。<br />2.3 AANN模型分類<br />本研究使用多層感知器(Multi-layer Perceptron, MLP)來建構AANN。已有研究指出MLP能夠模擬任何複雜變數間的非線性關係(Bishop, 1995),網路架構如圖2所示。當訓練網路時,輸入層輸入包括有企業各財務指標、當時總經指標及此企業危機狀態類別值,而輸出層的期望輸出與輸入相同。此AANN映射關係也如方程式 (1),當測試網路時,其輸出向量{y}會趨近等於輸入向量{x},兩者存在誤差e,可寫成下式<br />e=x-y,                                  (2)<br />將(1)代入(2)得出<br />e=x-fx,w,                                  (3)<br />因最小的非負誤差為目標函數,故(3)兩邊取平方和,可得<br />E=i=1dx-fx,w2,       (4)                <br />其中d 為輸入向量大小。當預測企業危機狀態類別BF時,其於輸入向量{x}中是未知的,而其餘企業財務指標與總經指標是已知的。此時{x}可被分割成已知部分{xk}與未知部分{xu},(4)式可改寫為<br />E=i=1dxuxk-fxuxk,w2,   (5)               <br />其中{xu}代表企業危機狀態BF是未知的,而{xk}代表企業財務指標與總經指標是已知的,而{w}是先前用訓練數據集於AANN中將{x}映射至{x}的網路收斂權重值集合。待預測BF之值,是使用GA以(5)式為適應函數值所求得,其流程架構如圖3所示。所求得之BF值,是一連續值,須將其轉換為二元類別值。<br />2.4 FMPN模型分類 <br />網路架構如圖1所示,當訓練網路時,輸入層輸入為企業各財務指標與當時總經指標,而輸出層輸出為此企業危機狀態類別值。此FMPN映射關係也如方程式 (1),此網路模型訓練目的是模擬企業各財務指標及當時總經指標,與輸出層輸出企業危機狀態類別值之間關係。於訓練期間,實際企業危機狀態類別值與訓練所得企業危機狀態類別值會有誤差,能以此誤差之平方均值(Mean Square Error, MSE)來估計模型訓練階段之性能。<br />2.5模型準確度評估 <br />分類預測模型之優劣,並不是由MSE大小決定,而應是在模型測試階段對測試樣本之辨識準確率(Correct Rate, CorrRate),其定義如下<br />CorrRate=TN+TPTN+TP+FN+FP        (6)                      <br />其中TN=真正常公司(True Negative)、TP=真危機公司(True Positive)、FN=偽正常公司(False Negative)、FP =偽危機公司(False Positive),為混淆矩陣(Confusion Matrix)組成中四個性能參數(Fawcett, 2006),此矩陣樣式如表1。但必須提醒的是,此四個性能參數是基於一分割門檻值TH,本研究TH值取1 (表示危機公司)與2(表示正常公司)之中間值1.5。<br />但門檻值TH取中間值1.5是有爭議的,根據研究指出(Fawcett, 2006),這些準確度評估指數會受到被預測公司出現廣泛度(Prevalence),即出現頻率的影響。因此有接受者操作特徵(Receiver Operating Characteristics, ROC)曲線的提出,ROC曲線的的繪製是以敏感度(Sensitivity)與特異度(Specificity)作圖,分別定義為(Fawcett, 2006)<br />Sensitivity=TPTP+FN                 (7)                     Specificity=TNTN+FP                 (8)<br />                             <br />以(1-specifity)為橫軸,Sensitivity為縱軸, 將門檻值從1開始慢慢調到2,每一門檻值可分別得出Sensitivity與Specificity,為在圖中的一點,這樣有很多點連接起來,即是ROC曲線。若是有效的預測模型,那麼其ROC曲線下的面積(Area Under Curve, AUC)會大於0.5,越好的預測模式其AUC越高,大致上在 0.5~0.7之間的預測準確度不佳,0.7~0.9為中等預測準確度,0.9~1.0則表示預測準確度很高,所以說ROC(或AUC)是預測模型準確度評估的非門檻值依賴指標(Threshold-independent index)。本研究也使用AUC,就各模型之預測性能做討論。 <br />2.6 主成份分析( PCA)<br /> PCA是一統計方法,通常被用來找尋高維度數據集之模式(Patterns) (Shlens, 2009),可得較低維度但保有大部分數據集變異的維度壓縮結果,這對AANN訓練有幫助,可減少輸入神經元數目,進而減少計算時間。PCA進行步驟簡述如下:首先對數據集中各屬性之樣本做正規化,具體作法為減去平均值後除以其標準差;第二步驟求出共變異矩陣(Convariance Matrix, CM);第三步驟求CM之特徵值與其對應之特徵向量,最大特徵值對應之特徵向量為主成份,而這也是資料壓縮之觀念來源;第四步驟將原始數據依特徵向量組成之主成份矩陣進行方向旋轉與伸縮,則可得保有主成份,但維度減少之降維數據集矩陣。以數學方程式表示如下<br />Tn×a=Dn×m×Pm×a                     (9)<br />其中D為原始數據集矩陣,P是主成份矩陣,而T是轉換後之數據矩陣,n為數據樣本數,m為原始數據集之屬性數目,a為轉換後數據之屬性數目,且a<m。把 T當作接下來分類模型之輸入,其輸入維度降低,分類模型訓練與測試速率可增快。所得T是將原始D的數據間線性相依關係去除,但仍保有數據間之非線性關係。本研究使用之AANN模型以及與其比較之FMPN模型,分別對原始數據D進行學習訓練之外,並另外對PCA轉換後之數據T進行學習訓練,最後就測試結果加以分析比較。<br />結果與討論<br />    本研究以1996至2005年間,於中國上海或深圳上市之一般產業公司為樣本,以一家危機公司搭配二至三家正常公司為配對樣本,其中有268家危機公司,616家正常公司,合計884家。危機公司定義為特別處理公司、會計師(CPA)意見公司、重整、重大影響事件以及淨值為負公司。配對樣本的搜集,則由危機公司基本屬性中取得該公司之產業別後,找出二至三家與危機公司相同產業且規模最為相近之健全公司,為其配對樣本,而金融業經營性質異於一般產業,故未納入本研究樣本中,有關樣本分配如表2,樣本來源分布如表3。<br />    本研究模型中總樣本884家公司,以其中60%為訓練樣本,15%為驗證樣本,25%為測試樣本,使用38項財務指標變數及4項總經指標變數共42項變數,於發生危機前一年的資料進行預測,財務變數由TEJ中國大陸財務(FINANCE)模組的中國_財務_PRC合併中搜集,總體經濟資料由中國基本屬性資料庫蒐集而得,自變數資料如表4。<br />    本研究中之模型皆於Matlab (Mathworks, 2007)環境中建立,使用了類神經網路工具箱(Neural Networks Toolbox)與基因演算法工具箱(Genetic Algorithm and Direct Search Toolbox),共建立AANNGA,PCA-AANNGA與FMPN三個模型。此三個模型在訓練階段,使用之數值方法為比例共軛梯度(Scaled Conjugate Gradient, SCG)法(Moller,1993),搭配使用倒傳遞(Back-propagation)演算法。GA參數設定:族群大小=30,交配率=0.75,執行代數=150,突變採均勻突變。<br />第一個數值實驗採用AANAGA模型,此模型包含43個輸入與43個輸出,而隱藏層神經元是從2至20個依序被測試,其均平方誤差(Mean Square Error)變化如圖4所示。依文獻(Kramer, 1991),最佳之AANN模型應是具有最小可能之隱藏層神經元架構,依圖4我們選擇10,故為43×10×43網路架構。此模型共執行10次,其預測性能如表5所示。CorrRate 是門檻值TH定為0.5之模型準確率,平均(Avg)為83%,型I誤差稍大於型II 誤差,平均分別為9.3% 與7.6%。由標準差(Std)顯示,型I與型II 誤差變異性大於準確率CorrRate,此訊息蘊含以準確率CorrRate衡量模型績效較可靠。<br />進一步從ROC曲線下面積AUC指標發現,其平均值接近平均準確率CorrRate_avg,每一次執行結果AUC值稍大於CorrRate值,但也有 AUC小於 CorrRate之情況發生,此表示AUC與CorrRate不是單純單調函數關係。 AUC其變異性雖較CorrRate_avg大,但應較CorrRate_avg可靠,這在前面2-5節已介紹過,主要原因是,CorrRate只是TH=0.5之性能指標,而 AUC是所有可能TH 之平均性能指標。其中執行第3次之ROC曲線,如圖5所示。<br />第二個預測模型為PCA-AANNGA,此模型是在AANNGA模型訓練前先將42個自變數作PCA之因次縮減,經此前處理後,在保有原始數據96%變異情況下,42個自變數縮減剩下22個,為便於比較,隱藏層神經元仍取10個,故本模型為23×10×23網路架構。訓練後之模型對測試數據進行預測,所得績效與ROC曲線分別如表6與圖6所示。結果顯示相較於AANAGA模型,PCA-AANNGA性能均提升,其中CorrRate提升4%,AUC提高5%,且變異性皆降低。此結果表示主成份分析的因次縮減,不但可降低AANNGA模型訓練時間,並可提升AANNGA模型預測能力。<br />第三個預測模型為傳統前饋多層感知器網路(FMPN),為42×10×1網路架構。其預測結果與ROC曲線分別如表7與圖7所示。結果顯示其CorrRate_avg與AUC_avg比AANNGA優,但較PCA-AANAGA模型性能差。<br />總結比較三個模型,不管AUC或CorrRate,其優劣順序為:PCA-AANNGA > FMPN >  AANNGA。分別是AUC部分:0.895 >0.8875 >0.849;CorrRate部分:86.92% > 85.48% >  83.08%。<br />總之,本研究以中國危機企業為對象,提出PCA-AANNGA整合模型進行危機公司預測之可行性,結果發現PCA-AANNGA整合模型準確率優於傳統前饋多層感知器網路模型。<br />結論<br />    本論文將自聯想神經網路(AANN)、基因演算法(GA)及主成份分析(PCA),結合形成一稱為PCA-AANNGA分類模型,就中國上市公司,進行危機預測,結果顯示準確率優於傳統前饋多層感知器網路(FMPN)模型,本文主要貢獻在提供企業危機診斷或預警之另一較優可行預測模型。本研究所提出之PCA-AANNGA整合模型,未來可進一步就其他領域之分類問題,進行驗證測試,以擴展本模型之推廣應用能力。<br />參考文獻<br />陳俊佑,中國大陸上市公司財務危機事件之探討,貨幣觀測與信用評等,2007年3月。<br />Altman, E.I. “Financial ratios discriminant analysis and the prediction of corporate bankruptcy” Journal of Finance (23:4) 1968, pp: 589-609.<br />Atalla, M.J. and Inman, D.J. “On model updating using neural networks” Mech. Syst. Signal Proc. (12)1998, pp:135-161.<br />Betechuoh, B.L., Marwala, T. and Tettey, T. “Autoencoder networks for HIV classification” Current Science (91)2006, pp:1467-1473.<br />Bishop, C.M. Neural Networks for Pattern Recognition, Oxford University Press, Oxford, 1995.<br />Bryant, S.M. “A case-based reasoning approach to bankruptcy prediction modeling, Intelligent Systems in Accounting” Finance and Management (6)1997, pp: 195-214.<br />Davis, L., Handbook of Genetic Algorithms, Van Nostrand, New York, 1991.<br />Fawcett, T. “An introduction to ROC analysis, Pattern Recognition Letters (27)2006, pp:861 -874.<br />Frolov, A., Kartashov, A., Goltsev, A. and Folk, R. “Quality and efficiency of retrieval for Willshaw-like autoassociative networks. II. Recognition” Network: Computat. Neural Syst. (6)1995, pp:535-549.<br />Goldberg, D.E., Genetic Algorithms in Search Optimization and Machine Learning, Addison- Wesley, Reading, 1989.<br />Hines, J.W., Robert, E.U. and Wrest, D.J. “Use of autoassociative neural networks for signal validation” J. Intell. Rob. Syst. (21) 1998, pp: 143-154.<br />Holland, J., Adaptation in Natural and Artificial Systems, University of Michigan Press, Ann Arbor, 1975.<br />Kramer, M.A. “Nonlinear principal component analysis using autoassociative neural Networks” AIChE J. (37)1991, pp: 233-234.<br />Lee, K.C., Han, I. and Kwon, Y. “Hybrid neural network models for bankruptcy predictions” Decision Support Systems (18) 1996, pp:63-72.<br />Leshno, M. and Spector, Y. “Neural network prediction analysis: the bankruptcy case” Neurocomputing (10) 1996, pp:125-147.<br />Li, H. and Sun, J. “Gaussian Case-based reasoning for business failure prediction with empirical data in China” Information Sciences (179) 2009, pp:89-108.<br />Lincoln, M. “An empirical study of the usefulness of accounting ratios to describe levels of insolvency risk” Journal of Banking and Finance (8)1984, pp: 321-340.<br />Lin, F.-Y. and McClean, S. “A data mining approach to the prediction of corporate failure ” Knowledge-Based Systems (14) 2001, pp: 189 -195.<br />Lu, P.J. and Hsu, T.C. “Application of autoassociative neural network on gas-path sensor data validation” J. Propul. Power (18)2002, pp: 879-888.<br />MATLAB 7.4 Manual, Matlab and Simulink for Technical Computing, Release 2007a, Mathworks, 2007.<br />Michalewicz, Z., Genetic Algorithms + Data Structures = Evolution Programs. Berlin, Springer, 1996, 3rd edn.<br />Moller, M.F., “A scaled conjugate gradient algorithm for fast supervised learning” Neural Networks(6)1993, pp:525-533. <br />Odom, M. and Sharda, R. “A neural networks model for bankruptcy prediction” in: Proceedings of International Joint Conference on Neural Networks, SanDiego, CA, 1990, pp: 163-168.<br />Rafiq, M.Y., Bugmann, G. and Easterbrook, D.J. “Neural network design for engineering applications” J. Comput. Struct. (79)2001, pp:1541-1552.<br />Salchenberger, L., Mine, C. and Lash, N. “Neural networks: a tool for predicting thrift failures” Decision Sciences (23)1992, pp: 899-916.<br />Shlens, J., A Tutorial on Principle Component Analysis, Unpublished, version 3.01, 2009.<br />Smauoi, N. and Al-Yakoob, S. “Analyzing the dynamics of cellular flames using Karhunen-Loeve decomposition and autoassociative neural networks” Soc. Ind. Appl. Math. (24)2003, pp:1790-1808.<br />Svozil, D., Kvasnicka, V. and Pospichal, J. “Introduction to multilayer feed-forward neural networks” J. Chemometrics Intell. Lab. Syst. (39) 1997, pp:43-62.<br />Tam, K.-Y. “Neural network models and the prediction of bank bankruptcy”  Omega (19:5) 1991, pp: 429-445.<br />Tam, K.-Y. and Kiang, M. “Managerial applications of neural networks: the case of bank failure predictions” Management Science (38 :7) 1992, pp: 926-947.<br />Tsai, C.-F. and Wu, J.-W. “Using neural network ensembles for bankruptcy prediction and credit scoring” Expert Systems with Applications (34:4) 2008, pp:2639-2649.<br />Wilson, R.L. Sharda, R. “Bankruptcy prediction using neural networks” Decision Support Systems (11)1994, pp:545-557.<br />表 1 混淆矩陣<br />混淆矩陣實際情形危機公司正常公司預測情形危機公司TPFP正常公司FNTN<br />表 2 樣本分配表正常公司危機公司小計總計訓練樣本370161531884驗證樣本9240132測試樣本15467221<br />表 3 樣本產業分佈表產業別危機公司正常公司樣本總數農林漁牧業122335採掘業61016製造業食品飲料132740紡織服裝皮毛112738木材家具123造紙印刷71623石油化學塑膠塑料215677電子41115金屬、非金屬礦業275683機械設備儀表51122173 醫藥生物製品194564電力煤氣及水生產供應61723建築業71219交通運輸倉儲業61420信息技術業214667批發和零售貿易224971社會服務業91928傳播及文化產業61319綜合業195170合計樣本總數268616884<br />表 4 自變數資料表資產報酬率(稅後息前)%流動比率%淨值報酬率(稅後)%速動比率%營業毛利率(常續性利益)%總負債/總淨值%營業利益率%負債比率%稅前淨利率%淨值/總資產%稅後淨利率%長期資金適合率(A)%業外收支率%借款依存度%營業費用率%存貨及應收帳款/淨值稅率(A)%總資產週轉率(次)每股淨值(A)(元)應收帳款週轉率(次)常續性EPS(元)存貨週轉率(次)每股營業額(元)固定資產週轉率(次)每股營業利益(元)淨值週轉率(次)每股稅前淨利(元)淨營業週期(天)營收成長率%折舊性固定資產成長率%營業毛利成長率%資產(Asset)營業利益成長率%中國地區失業率稅前淨利成長率%貿易出超稅後淨利成長率%年貿易出超總資產成長率%CPI消費者物價指數淨值成長率%D1危機公司虛擬變數<br />表5 AANNGA模型(43×10×43網路架構)預測結果<br />CorrRateType I ErrorType II ErrorAUCRun 183.71%7.24%9.05%0.8815Run 281.90%8.60%9.50%0.8255Run 385.07%9.95%4.98%0.8700Run 484.16%12.67%3.17%0.7744Run 581.90%9.05%9.05%0.8634Run 683.71%11.76%4.53%0.8318Run 784.16%8.60%7.24%0.8586Run 881.90%6.79%11.31%0.8564Run 982.81%11.76%5.43%0.8606Run 1081.45%6.79%11.76%0.8677Avg83.08%9.32%7.60%0.8490Std1.25%2.15%2.97%0.0312<br />表6 PCA-AANNGA模型(23×10×23網路架構)預測結果<br />CorrRateType I ErrorType II ErrorAUCRun 185.97%8.15%5.88%0.9038 Run 287.33%6.79%5.88%0.8774 Run 386.43%9.05%4.52%0.9234 Run 487.33%5.88%6.79%0.9071 Run 587.78%7.24%4.98%0.9183 Run 685.52%9.50%4.98%0.8358 Run 787.78%9.05%3.17%0.9055 Run 887.33%8.60%4.07%0.8978 Run 986.43%9.50%4.07%0.8816 Run 1087.33%8.60%4.07%0.8989 Avg86.92%8.24%4.84%0.8950 Std0.78%1.22%1.09%0.0252 <br />表7 FMPN模型(42×10×1網路架構)預測結果<br />CorrRateType I ErrorType II ErrorAUCRun 185.97%9.05%4.98%0.9063Run 285.07%9.50%5.43%0.8810Run 386.42%10.41%3.17%0.8692Run 483.26%8.60%8.14%0.8728Run 585.07%7.24%7.69%0.8907Run 684.16%14.03%1.81%0.8836Run 785.52%10.41%4.07%0.9006Run 884.62%10.86%4.52%0.8608Run 986.88%7.24%5.88%0.9176Run 1087.78%7.24%4.98%0.8926Avg85.48%9.46%5.07%0.8875Std1.34%2.12%1.90%0.0176<br />圖1 前饋多層感知器網路(FMPN)模型<br />圖2 自聯想神經網路(AANN)模型<br />圖 3 推定企業危機狀態BF流程架構<br />圖4 AANNGA模型中隱藏層神經元數目與訓練誤差關係圖<br />圖5 AANNGA模型ROC曲線<br />圖6 PCA-AANNGA模型ROC曲線<br />355606450330圖7 FMPN模型ROC曲線<br />
自聯想神經網路之企業危機預測 - ltu
自聯想神經網路之企業危機預測 - ltu
自聯想神經網路之企業危機預測 - ltu
自聯想神經網路之企業危機預測 - ltu
自聯想神經網路之企業危機預測 - ltu
自聯想神經網路之企業危機預測 - ltu

More Related Content

Viewers also liked (9)

Ray+Keshavan | The Brand Union – Healthcare
Ray+Keshavan | The Brand Union – HealthcareRay+Keshavan | The Brand Union – Healthcare
Ray+Keshavan | The Brand Union – Healthcare
 
Seznam.cz email
 Seznam.cz email Seznam.cz email
Seznam.cz email
 
Ray+Keshavan | The Brand Union – Financial Services
Ray+Keshavan | The Brand Union – Financial ServicesRay+Keshavan | The Brand Union – Financial Services
Ray+Keshavan | The Brand Union – Financial Services
 
Ray+Keshavan | The Brand Union – Manufacturing
Ray+Keshavan | The Brand Union – ManufacturingRay+Keshavan | The Brand Union – Manufacturing
Ray+Keshavan | The Brand Union – Manufacturing
 
Moodleを活用していると思われる大学のリスト
Moodleを活用していると思われる大学のリストMoodleを活用していると思われる大学のリスト
Moodleを活用していると思われる大学のリスト
 
Android IPC Mechanism
Android IPC MechanismAndroid IPC Mechanism
Android IPC Mechanism
 
Billionaire
BillionaireBillionaire
Billionaire
 
Irish Artisan Food Brands
Irish Artisan Food BrandsIrish Artisan Food Brands
Irish Artisan Food Brands
 
Dubai Airport & City Guide
Dubai Airport & City GuideDubai Airport & City Guide
Dubai Airport & City Guide
 

Similar to 自聯想神經網路之企業危機預測 - ltu

Similar to 自聯想神經網路之企業危機預測 - ltu (9)

8.植基於網路服務之雲端資料探勘資訊代理系統 楊勝源
8.植基於網路服務之雲端資料探勘資訊代理系統 楊勝源8.植基於網路服務之雲端資料探勘資訊代理系統 楊勝源
8.植基於網路服務之雲端資料探勘資訊代理系統 楊勝源
 
Kaiti
KaitiKaiti
Kaiti
 
上市公司分部报告信息有用性的实证研究 来自沪市54家上市公司的证据
上市公司分部报告信息有用性的实证研究 来自沪市54家上市公司的证据上市公司分部报告信息有用性的实证研究 来自沪市54家上市公司的证据
上市公司分部报告信息有用性的实证研究 来自沪市54家上市公司的证据
 
Struct免費入口不限量免費下載論文的方法ural equationmodeling
Struct免費入口不限量免費下載論文的方法ural equationmodelingStruct免費入口不限量免費下載論文的方法ural equationmodeling
Struct免費入口不限量免費下載論文的方法ural equationmodeling
 
教材摘要版 -Big data-海量資料的資料採礦方法-三星課程網陳景祥顧問-20130521
教材摘要版 -Big data-海量資料的資料採礦方法-三星課程網陳景祥顧問-20130521教材摘要版 -Big data-海量資料的資料採礦方法-三星課程網陳景祥顧問-20130521
教材摘要版 -Big data-海量資料的資料採礦方法-三星課程網陳景祥顧問-20130521
 
QM-024-QC改善工具
QM-024-QC改善工具QM-024-QC改善工具
QM-024-QC改善工具
 
1 Dmaic D
1 Dmaic D1 Dmaic D
1 Dmaic D
 
KAMERA Data Prediction
KAMERA Data PredictionKAMERA Data Prediction
KAMERA Data Prediction
 
管理資訊系統之資訊架構
管理資訊系統之資訊架構管理資訊系統之資訊架構
管理資訊系統之資訊架構
 

More from butest

EL MODELO DE NEGOCIO DE YOUTUBE
EL MODELO DE NEGOCIO DE YOUTUBEEL MODELO DE NEGOCIO DE YOUTUBE
EL MODELO DE NEGOCIO DE YOUTUBE
butest
 
1. MPEG I.B.P frame之不同
1. MPEG I.B.P frame之不同1. MPEG I.B.P frame之不同
1. MPEG I.B.P frame之不同
butest
 
LESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIALLESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIAL
butest
 
Timeline: The Life of Michael Jackson
Timeline: The Life of Michael JacksonTimeline: The Life of Michael Jackson
Timeline: The Life of Michael Jackson
butest
 
Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...
Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...
Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...
butest
 
LESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIALLESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIAL
butest
 
Com 380, Summer II
Com 380, Summer IICom 380, Summer II
Com 380, Summer II
butest
 
The MYnstrel Free Press Volume 2: Economic Struggles, Meet Jazz
The MYnstrel Free Press Volume 2: Economic Struggles, Meet JazzThe MYnstrel Free Press Volume 2: Economic Struggles, Meet Jazz
The MYnstrel Free Press Volume 2: Economic Struggles, Meet Jazz
butest
 
MICHAEL JACKSON.doc
MICHAEL JACKSON.docMICHAEL JACKSON.doc
MICHAEL JACKSON.doc
butest
 
Social Networks: Twitter Facebook SL - Slide 1
Social Networks: Twitter Facebook SL - Slide 1Social Networks: Twitter Facebook SL - Slide 1
Social Networks: Twitter Facebook SL - Slide 1
butest
 
Facebook
Facebook Facebook
Facebook
butest
 
Executive Summary Hare Chevrolet is a General Motors dealership ...
Executive Summary Hare Chevrolet is a General Motors dealership ...Executive Summary Hare Chevrolet is a General Motors dealership ...
Executive Summary Hare Chevrolet is a General Motors dealership ...
butest
 
Welcome to the Dougherty County Public Library's Facebook and ...
Welcome to the Dougherty County Public Library's Facebook and ...Welcome to the Dougherty County Public Library's Facebook and ...
Welcome to the Dougherty County Public Library's Facebook and ...
butest
 
NEWS ANNOUNCEMENT
NEWS ANNOUNCEMENTNEWS ANNOUNCEMENT
NEWS ANNOUNCEMENT
butest
 
C-2100 Ultra Zoom.doc
C-2100 Ultra Zoom.docC-2100 Ultra Zoom.doc
C-2100 Ultra Zoom.doc
butest
 
MAC Printing on ITS Printers.doc.doc
MAC Printing on ITS Printers.doc.docMAC Printing on ITS Printers.doc.doc
MAC Printing on ITS Printers.doc.doc
butest
 
Mac OS X Guide.doc
Mac OS X Guide.docMac OS X Guide.doc
Mac OS X Guide.doc
butest
 
WEB DESIGN!
WEB DESIGN!WEB DESIGN!
WEB DESIGN!
butest
 

More from butest (20)

EL MODELO DE NEGOCIO DE YOUTUBE
EL MODELO DE NEGOCIO DE YOUTUBEEL MODELO DE NEGOCIO DE YOUTUBE
EL MODELO DE NEGOCIO DE YOUTUBE
 
1. MPEG I.B.P frame之不同
1. MPEG I.B.P frame之不同1. MPEG I.B.P frame之不同
1. MPEG I.B.P frame之不同
 
LESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIALLESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIAL
 
Timeline: The Life of Michael Jackson
Timeline: The Life of Michael JacksonTimeline: The Life of Michael Jackson
Timeline: The Life of Michael Jackson
 
Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...
Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...
Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...
 
LESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIALLESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIAL
 
Com 380, Summer II
Com 380, Summer IICom 380, Summer II
Com 380, Summer II
 
PPT
PPTPPT
PPT
 
The MYnstrel Free Press Volume 2: Economic Struggles, Meet Jazz
The MYnstrel Free Press Volume 2: Economic Struggles, Meet JazzThe MYnstrel Free Press Volume 2: Economic Struggles, Meet Jazz
The MYnstrel Free Press Volume 2: Economic Struggles, Meet Jazz
 
MICHAEL JACKSON.doc
MICHAEL JACKSON.docMICHAEL JACKSON.doc
MICHAEL JACKSON.doc
 
Social Networks: Twitter Facebook SL - Slide 1
Social Networks: Twitter Facebook SL - Slide 1Social Networks: Twitter Facebook SL - Slide 1
Social Networks: Twitter Facebook SL - Slide 1
 
Facebook
Facebook Facebook
Facebook
 
Executive Summary Hare Chevrolet is a General Motors dealership ...
Executive Summary Hare Chevrolet is a General Motors dealership ...Executive Summary Hare Chevrolet is a General Motors dealership ...
Executive Summary Hare Chevrolet is a General Motors dealership ...
 
Welcome to the Dougherty County Public Library's Facebook and ...
Welcome to the Dougherty County Public Library's Facebook and ...Welcome to the Dougherty County Public Library's Facebook and ...
Welcome to the Dougherty County Public Library's Facebook and ...
 
NEWS ANNOUNCEMENT
NEWS ANNOUNCEMENTNEWS ANNOUNCEMENT
NEWS ANNOUNCEMENT
 
C-2100 Ultra Zoom.doc
C-2100 Ultra Zoom.docC-2100 Ultra Zoom.doc
C-2100 Ultra Zoom.doc
 
MAC Printing on ITS Printers.doc.doc
MAC Printing on ITS Printers.doc.docMAC Printing on ITS Printers.doc.doc
MAC Printing on ITS Printers.doc.doc
 
Mac OS X Guide.doc
Mac OS X Guide.docMac OS X Guide.doc
Mac OS X Guide.doc
 
hier
hierhier
hier
 
WEB DESIGN!
WEB DESIGN!WEB DESIGN!
WEB DESIGN!
 

自聯想神經網路之企業危機預測 - ltu

  • 1. 自聯想神經網路之企業危機預測<br />The Business Failure Prediction by Autoassociative Neural Networks<br />陳明華<br />嶺東科技大學 資訊管理系 <br />Email:mhc@teamail.ltu.edu.tw<br />摘要<br /> 自聯想神經網路(Autoassociative Neural Networks, AANN)大多應用於資料壓縮、故障偵測或資料插補,其應用於企業危機預測(Business Failure Prediction, BFP)尚未有文獻著墨。本研究以AANN搭配基因演算法(Genetic Algorithm, GA)建構一BFP分類預測模型,並使用主成份分析(Principle Component Analysis, PCA)對自變數作因次縮減(Dimensionality Reduction, DR),整合模型稱PCA-AANNGA,並與傳統前饋多層感知器網路(Feedforward Multilayer Perceptron Networks, FMPN)模型做比較。本研究以1996至2005年間於中國上海與深圳掛牌上市公司,共884家,其中268家危機公司與616家正常公司,為本研究訓練與測試樣本,所得結果顯示,PCA-AANNGA模型預測正確率稍優於FMPN模型,故本研究主要貢獻在提供一較佳之PCA-AANNGA模型,可作為企業危機預測之另一可行模型。<br />關鍵字:自聯想神經網路、企業危機預測、基因演算法、主成份分析<br />Abstract<br />The applications of autoassociative neural networks (AANN) are mostly addressed on the issue of data compression, fault diagnosis or data imputation, but it has not been applied for the business failure prediction (BFP) yet so far. In this paper, the AANN is combined with genetic algorithm (GA) and principle component analysis (PCA), by which the dimensionalities of independent variables are condensed, to construct a classification model for BFP, so called PCA-AANNGA model. The sample in this study includes 884 Chinese companies listed in Shanghai Stock Exchange or in Shenzhen Stock Exchange during 1996 to 2005, which contains 268 failure companies and 616 health companies. In Comparison with the conventional feedforward multilayer perceptron network (FMPN) model, the proposed PCA-AANNGA model performs better either with a higher correct rate for predicting the failure of company, or with a higher AUC value. This empirical result shows that the PCA-AANNGA model is superior to the FMPN model as an alternative to predict business failure. <br />Keywords:Autoassociative neural networks, <br />Business failure prediction, Genetic algorithm,<br />Principle component analysis <br />簡介<br />由於現代企業環境諸多不確定性及企業必須面對全球競爭,若企業經營不善或景氣驟變,很容易就發生企業危機(Business Failure),企業危機造成公司與員工極大的經濟損失,因此企業危機預測(Business Failure Prediction,BFP)(以下簡稱為BFP)受到包括投資者、經理人、員工、政府官員及學術界的高度關心與興趣。所以,如何預測企業危機或提昇BFP的正確率,便成為一重要且熱門的研究主題 (Li, Sun, 2009)。<br />因為至今沒有關於BFP的成熟經濟理論,對於BFP之相關研究流於試誤(trial-and error)選擇關鍵屬性的迭代過程(Bryant, 1997)。事實上,企業危機不是瞬間發生,而是經過一段時間的變化而發生的(Altman,1968; Lincoln,1984; Lin, McClean, 2001)。因此如果有一套模型能夠預警企業即將危機,才能夠及時做出預防措施,並降低財產損失。<br />隨著統計學、資訊科學、電腦科學、決策科學與人工智慧等領域的不斷進步與發展,有許多統計方法與計算智慧方法被引用於BFP之研究。而過去尚未見有文獻結合自聯想神經網路(AANN)與基因演算法(GA),以下簡稱為PCA-AANNGA模型,應用於企業危機之預測,本研究將嘗試此新方法,建構一分類模型,以便進行企業危機預警。<br />類神經網路(Artificial Neural Networks, ANN)是由許多處理神經元相互連結的複雜計算模型。ANN具有學習非線性系統的能力。基於要有比較對象,本研究也根據ANN模型,建構一前饋多層感知網路(FMPN),其網路架構如圖1所示(Bishop, 1995)。已經有許多文獻使用FMPN對BFP進行研究(Odom, Sharda, 1990; Tam, 1991; Salchenberger, etc., 1992; Tam, Kiang, 1992; Wilson, Sharda, 1994; Lee, etc., 1996; Leshno, Spector, 1996; Tasi, Wu, 2008),結果顯示與傳統之統計方法如羅吉斯回歸(Logistic Regression, LR)或多元區別分析(Multiple Discriminant Analysis, MDA)比較,FMPN有較佳效能表現。更多關於ANN與FMPN介紹可參考(Svozil, etc., 1997; Rafiq, etc., 2001)。<br />過去文獻已有許多使用FMPN模型,進行BFP的研究(Odom, Sharda, 1990; Tam, 1991; Salchenberger, etc., 1992; Tam, Kiang, 1992; Wilson, Sharda, 1994; Lee, etc., 1996; Leshno, Spector, 1996; Tasi, Wu, 2008)。但並未見有文獻使用自聯想神經網路(AANN),做相關BFP 之研究,但有文獻用AANN進行愛滋病毒(HIV)分類(Betechuoh, etc., 2006),其研究結果指出AANN分類正確率92%,高於FMPN的84%,因此,本研究擬使用AANN對BFP作分類預測,並與FMPN模型做比較。另外,本研究使用之AANN需搭配基因演算法(GA)完成,GA為一最佳化方法,啟發自達爾文之自然演化理論 (Holland, 1975; Goldberg, 1989),以程式實做一群染色體進行演化模擬,尋求最佳染色體,而每條染色體是由許多基因組成。本研究中此基因即代表遺失之輸入變數 (即欲求取之企業危機屬性類別值),GA使用適應函數以篩選正確之遺失變數值,雖然不保證一定可得全域最佳解,但GA可很有效率的趨近於全域最佳解,更多關於GA可參考文獻(Davis, 1991; Michalewicz, 1996)。 <br />因面對的問題特性隨領域差異而稍有不同,HIV分類研究中自變數只有8個,而BFP問題通常至少有30個以上的自變數,而且這些自變數極可能存在相依關係,故本研究以主成份分析(PCA) (Shlens, 2009)對自變數作前處理,除可去除其線性相依關係,並可減少後續網路訓練與測試時間。本研究最後採用PCA與結合自聯想神經網路(AANN)與基因演算法(GA),即PCA-AANNGA模型,應用於企業危機之預測,並與FMPN模型做性能比較。<br />理論基礎<br />2.1 自相關神經網路( AANN)<br /> AANN是監督式類神經網路(ANN)模型之一,其訓練之期望輸出與網路輸入相同。因此訓練完之AANN,當有輸入時,AANN將輸出與輸入相近的值(Frolov, etc, 1995; Atalla, Inman, 1998; Hines, etc, 1998; Smauoi, Al-Yakoob, 2003)。AANN之輸入層與輸出層有相同數目之神經元,中間的隱藏層神經元數目較少(Lu, Hsu, 2002)。隱藏層試圖重建輸入值,而於輸出層輸出,其較窄的隱藏層可強迫去除輸入的冗餘,但仍然保有非冗餘數據。但必須注意的是,本研究是利用AANN模型做缺漏數據推定,隱藏層神經元數目不應如資料壓縮應用中盡可能小,為求精確,應做最佳化選擇。AANN網路架構如圖2所示。<br />2.2 傳統統計模型分類<br />本研究目的是正確識別危機企業,若使用傳統統計模型(Statistical Pattern Classification, SPC),所需變數包含了企業各財務指標{x},及企業危機類別值。若SPC輸出設為{y},則SPC模型被要求將輸入{x},映射到輸出{y},當使用數學函數描述此映射關係,可表為下式<br />y=fx,w ,      (1)<br />其中{w}是映射權重,{x} 與{y}分別表示輸入與輸出變數,分類模型目的是設計一決策超平面對新的輸入做正確類別判定(Bishop, 1995)。<br />2.3 AANN模型分類<br />本研究使用多層感知器(Multi-layer Perceptron, MLP)來建構AANN。已有研究指出MLP能夠模擬任何複雜變數間的非線性關係(Bishop, 1995),網路架構如圖2所示。當訓練網路時,輸入層輸入包括有企業各財務指標、當時總經指標及此企業危機狀態類別值,而輸出層的期望輸出與輸入相同。此AANN映射關係也如方程式 (1),當測試網路時,其輸出向量{y}會趨近等於輸入向量{x},兩者存在誤差e,可寫成下式<br />e=x-y,      (2)<br />將(1)代入(2)得出<br />e=x-fx,w, (3)<br />因最小的非負誤差為目標函數,故(3)兩邊取平方和,可得<br />E=i=1dx-fx,w2,  (4)    <br />其中d 為輸入向量大小。當預測企業危機狀態類別BF時,其於輸入向量{x}中是未知的,而其餘企業財務指標與總經指標是已知的。此時{x}可被分割成已知部分{xk}與未知部分{xu},(4)式可改寫為<br />E=i=1dxuxk-fxuxk,w2, (5)     <br />其中{xu}代表企業危機狀態BF是未知的,而{xk}代表企業財務指標與總經指標是已知的,而{w}是先前用訓練數據集於AANN中將{x}映射至{x}的網路收斂權重值集合。待預測BF之值,是使用GA以(5)式為適應函數值所求得,其流程架構如圖3所示。所求得之BF值,是一連續值,須將其轉換為二元類別值。<br />2.4 FMPN模型分類 <br />網路架構如圖1所示,當訓練網路時,輸入層輸入為企業各財務指標與當時總經指標,而輸出層輸出為此企業危機狀態類別值。此FMPN映射關係也如方程式 (1),此網路模型訓練目的是模擬企業各財務指標及當時總經指標,與輸出層輸出企業危機狀態類別值之間關係。於訓練期間,實際企業危機狀態類別值與訓練所得企業危機狀態類別值會有誤差,能以此誤差之平方均值(Mean Square Error, MSE)來估計模型訓練階段之性能。<br />2.5模型準確度評估 <br />分類預測模型之優劣,並不是由MSE大小決定,而應是在模型測試階段對測試樣本之辨識準確率(Correct Rate, CorrRate),其定義如下<br />CorrRate=TN+TPTN+TP+FN+FP   (6)    <br />其中TN=真正常公司(True Negative)、TP=真危機公司(True Positive)、FN=偽正常公司(False Negative)、FP =偽危機公司(False Positive),為混淆矩陣(Confusion Matrix)組成中四個性能參數(Fawcett, 2006),此矩陣樣式如表1。但必須提醒的是,此四個性能參數是基於一分割門檻值TH,本研究TH值取1 (表示危機公司)與2(表示正常公司)之中間值1.5。<br />但門檻值TH取中間值1.5是有爭議的,根據研究指出(Fawcett, 2006),這些準確度評估指數會受到被預測公司出現廣泛度(Prevalence),即出現頻率的影響。因此有接受者操作特徵(Receiver Operating Characteristics, ROC)曲線的提出,ROC曲線的的繪製是以敏感度(Sensitivity)與特異度(Specificity)作圖,分別定義為(Fawcett, 2006)<br />Sensitivity=TPTP+FN (7) Specificity=TNTN+FP (8)<br /> <br />以(1-specifity)為橫軸,Sensitivity為縱軸, 將門檻值從1開始慢慢調到2,每一門檻值可分別得出Sensitivity與Specificity,為在圖中的一點,這樣有很多點連接起來,即是ROC曲線。若是有效的預測模型,那麼其ROC曲線下的面積(Area Under Curve, AUC)會大於0.5,越好的預測模式其AUC越高,大致上在 0.5~0.7之間的預測準確度不佳,0.7~0.9為中等預測準確度,0.9~1.0則表示預測準確度很高,所以說ROC(或AUC)是預測模型準確度評估的非門檻值依賴指標(Threshold-independent index)。本研究也使用AUC,就各模型之預測性能做討論。 <br />2.6 主成份分析( PCA)<br /> PCA是一統計方法,通常被用來找尋高維度數據集之模式(Patterns) (Shlens, 2009),可得較低維度但保有大部分數據集變異的維度壓縮結果,這對AANN訓練有幫助,可減少輸入神經元數目,進而減少計算時間。PCA進行步驟簡述如下:首先對數據集中各屬性之樣本做正規化,具體作法為減去平均值後除以其標準差;第二步驟求出共變異矩陣(Convariance Matrix, CM);第三步驟求CM之特徵值與其對應之特徵向量,最大特徵值對應之特徵向量為主成份,而這也是資料壓縮之觀念來源;第四步驟將原始數據依特徵向量組成之主成份矩陣進行方向旋轉與伸縮,則可得保有主成份,但維度減少之降維數據集矩陣。以數學方程式表示如下<br />Tn×a=Dn×m×Pm×a      (9)<br />其中D為原始數據集矩陣,P是主成份矩陣,而T是轉換後之數據矩陣,n為數據樣本數,m為原始數據集之屬性數目,a為轉換後數據之屬性數目,且a<m。把 T當作接下來分類模型之輸入,其輸入維度降低,分類模型訓練與測試速率可增快。所得T是將原始D的數據間線性相依關係去除,但仍保有數據間之非線性關係。本研究使用之AANN模型以及與其比較之FMPN模型,分別對原始數據D進行學習訓練之外,並另外對PCA轉換後之數據T進行學習訓練,最後就測試結果加以分析比較。<br />結果與討論<br /> 本研究以1996至2005年間,於中國上海或深圳上市之一般產業公司為樣本,以一家危機公司搭配二至三家正常公司為配對樣本,其中有268家危機公司,616家正常公司,合計884家。危機公司定義為特別處理公司、會計師(CPA)意見公司、重整、重大影響事件以及淨值為負公司。配對樣本的搜集,則由危機公司基本屬性中取得該公司之產業別後,找出二至三家與危機公司相同產業且規模最為相近之健全公司,為其配對樣本,而金融業經營性質異於一般產業,故未納入本研究樣本中,有關樣本分配如表2,樣本來源分布如表3。<br /> 本研究模型中總樣本884家公司,以其中60%為訓練樣本,15%為驗證樣本,25%為測試樣本,使用38項財務指標變數及4項總經指標變數共42項變數,於發生危機前一年的資料進行預測,財務變數由TEJ中國大陸財務(FINANCE)模組的中國_財務_PRC合併中搜集,總體經濟資料由中國基本屬性資料庫蒐集而得,自變數資料如表4。<br /> 本研究中之模型皆於Matlab (Mathworks, 2007)環境中建立,使用了類神經網路工具箱(Neural Networks Toolbox)與基因演算法工具箱(Genetic Algorithm and Direct Search Toolbox),共建立AANNGA,PCA-AANNGA與FMPN三個模型。此三個模型在訓練階段,使用之數值方法為比例共軛梯度(Scaled Conjugate Gradient, SCG)法(Moller,1993),搭配使用倒傳遞(Back-propagation)演算法。GA參數設定:族群大小=30,交配率=0.75,執行代數=150,突變採均勻突變。<br />第一個數值實驗採用AANAGA模型,此模型包含43個輸入與43個輸出,而隱藏層神經元是從2至20個依序被測試,其均平方誤差(Mean Square Error)變化如圖4所示。依文獻(Kramer, 1991),最佳之AANN模型應是具有最小可能之隱藏層神經元架構,依圖4我們選擇10,故為43×10×43網路架構。此模型共執行10次,其預測性能如表5所示。CorrRate 是門檻值TH定為0.5之模型準確率,平均(Avg)為83%,型I誤差稍大於型II 誤差,平均分別為9.3% 與7.6%。由標準差(Std)顯示,型I與型II 誤差變異性大於準確率CorrRate,此訊息蘊含以準確率CorrRate衡量模型績效較可靠。<br />進一步從ROC曲線下面積AUC指標發現,其平均值接近平均準確率CorrRate_avg,每一次執行結果AUC值稍大於CorrRate值,但也有 AUC小於 CorrRate之情況發生,此表示AUC與CorrRate不是單純單調函數關係。 AUC其變異性雖較CorrRate_avg大,但應較CorrRate_avg可靠,這在前面2-5節已介紹過,主要原因是,CorrRate只是TH=0.5之性能指標,而 AUC是所有可能TH 之平均性能指標。其中執行第3次之ROC曲線,如圖5所示。<br />第二個預測模型為PCA-AANNGA,此模型是在AANNGA模型訓練前先將42個自變數作PCA之因次縮減,經此前處理後,在保有原始數據96%變異情況下,42個自變數縮減剩下22個,為便於比較,隱藏層神經元仍取10個,故本模型為23×10×23網路架構。訓練後之模型對測試數據進行預測,所得績效與ROC曲線分別如表6與圖6所示。結果顯示相較於AANAGA模型,PCA-AANNGA性能均提升,其中CorrRate提升4%,AUC提高5%,且變異性皆降低。此結果表示主成份分析的因次縮減,不但可降低AANNGA模型訓練時間,並可提升AANNGA模型預測能力。<br />第三個預測模型為傳統前饋多層感知器網路(FMPN),為42×10×1網路架構。其預測結果與ROC曲線分別如表7與圖7所示。結果顯示其CorrRate_avg與AUC_avg比AANNGA優,但較PCA-AANAGA模型性能差。<br />總結比較三個模型,不管AUC或CorrRate,其優劣順序為:PCA-AANNGA > FMPN > AANNGA。分別是AUC部分:0.895 >0.8875 >0.849;CorrRate部分:86.92% > 85.48% > 83.08%。<br />總之,本研究以中國危機企業為對象,提出PCA-AANNGA整合模型進行危機公司預測之可行性,結果發現PCA-AANNGA整合模型準確率優於傳統前饋多層感知器網路模型。<br />結論<br /> 本論文將自聯想神經網路(AANN)、基因演算法(GA)及主成份分析(PCA),結合形成一稱為PCA-AANNGA分類模型,就中國上市公司,進行危機預測,結果顯示準確率優於傳統前饋多層感知器網路(FMPN)模型,本文主要貢獻在提供企業危機診斷或預警之另一較優可行預測模型。本研究所提出之PCA-AANNGA整合模型,未來可進一步就其他領域之分類問題,進行驗證測試,以擴展本模型之推廣應用能力。<br />參考文獻<br />陳俊佑,中國大陸上市公司財務危機事件之探討,貨幣觀測與信用評等,2007年3月。<br />Altman, E.I. “Financial ratios discriminant analysis and the prediction of corporate bankruptcy” Journal of Finance (23:4) 1968, pp: 589-609.<br />Atalla, M.J. and Inman, D.J. “On model updating using neural networks” Mech. Syst. Signal Proc. (12)1998, pp:135-161.<br />Betechuoh, B.L., Marwala, T. and Tettey, T. “Autoencoder networks for HIV classification” Current Science (91)2006, pp:1467-1473.<br />Bishop, C.M. Neural Networks for Pattern Recognition, Oxford University Press, Oxford, 1995.<br />Bryant, S.M. “A case-based reasoning approach to bankruptcy prediction modeling, Intelligent Systems in Accounting” Finance and Management (6)1997, pp: 195-214.<br />Davis, L., Handbook of Genetic Algorithms, Van Nostrand, New York, 1991.<br />Fawcett, T. “An introduction to ROC analysis, Pattern Recognition Letters (27)2006, pp:861 -874.<br />Frolov, A., Kartashov, A., Goltsev, A. and Folk, R. “Quality and efficiency of retrieval for Willshaw-like autoassociative networks. II. Recognition” Network: Computat. Neural Syst. (6)1995, pp:535-549.<br />Goldberg, D.E., Genetic Algorithms in Search Optimization and Machine Learning, Addison- Wesley, Reading, 1989.<br />Hines, J.W., Robert, E.U. and Wrest, D.J. “Use of autoassociative neural networks for signal validation” J. Intell. Rob. Syst. (21) 1998, pp: 143-154.<br />Holland, J., Adaptation in Natural and Artificial Systems, University of Michigan Press, Ann Arbor, 1975.<br />Kramer, M.A. “Nonlinear principal component analysis using autoassociative neural Networks” AIChE J. (37)1991, pp: 233-234.<br />Lee, K.C., Han, I. and Kwon, Y. “Hybrid neural network models for bankruptcy predictions” Decision Support Systems (18) 1996, pp:63-72.<br />Leshno, M. and Spector, Y. “Neural network prediction analysis: the bankruptcy case” Neurocomputing (10) 1996, pp:125-147.<br />Li, H. and Sun, J. “Gaussian Case-based reasoning for business failure prediction with empirical data in China” Information Sciences (179) 2009, pp:89-108.<br />Lincoln, M. “An empirical study of the usefulness of accounting ratios to describe levels of insolvency risk” Journal of Banking and Finance (8)1984, pp: 321-340.<br />Lin, F.-Y. and McClean, S. “A data mining approach to the prediction of corporate failure ” Knowledge-Based Systems (14) 2001, pp: 189 -195.<br />Lu, P.J. and Hsu, T.C. “Application of autoassociative neural network on gas-path sensor data validation” J. Propul. Power (18)2002, pp: 879-888.<br />MATLAB 7.4 Manual, Matlab and Simulink for Technical Computing, Release 2007a, Mathworks, 2007.<br />Michalewicz, Z., Genetic Algorithms + Data Structures = Evolution Programs. Berlin, Springer, 1996, 3rd edn.<br />Moller, M.F., “A scaled conjugate gradient algorithm for fast supervised learning” Neural Networks(6)1993, pp:525-533. <br />Odom, M. and Sharda, R. “A neural networks model for bankruptcy prediction” in: Proceedings of International Joint Conference on Neural Networks, SanDiego, CA, 1990, pp: 163-168.<br />Rafiq, M.Y., Bugmann, G. and Easterbrook, D.J. “Neural network design for engineering applications” J. Comput. Struct. (79)2001, pp:1541-1552.<br />Salchenberger, L., Mine, C. and Lash, N. “Neural networks: a tool for predicting thrift failures” Decision Sciences (23)1992, pp: 899-916.<br />Shlens, J., A Tutorial on Principle Component Analysis, Unpublished, version 3.01, 2009.<br />Smauoi, N. and Al-Yakoob, S. “Analyzing the dynamics of cellular flames using Karhunen-Loeve decomposition and autoassociative neural networks” Soc. Ind. Appl. Math. (24)2003, pp:1790-1808.<br />Svozil, D., Kvasnicka, V. and Pospichal, J. “Introduction to multilayer feed-forward neural networks” J. Chemometrics Intell. Lab. Syst. (39) 1997, pp:43-62.<br />Tam, K.-Y. “Neural network models and the prediction of bank bankruptcy” Omega (19:5) 1991, pp: 429-445.<br />Tam, K.-Y. and Kiang, M. “Managerial applications of neural networks: the case of bank failure predictions” Management Science (38 :7) 1992, pp: 926-947.<br />Tsai, C.-F. and Wu, J.-W. “Using neural network ensembles for bankruptcy prediction and credit scoring” Expert Systems with Applications (34:4) 2008, pp:2639-2649.<br />Wilson, R.L. Sharda, R. “Bankruptcy prediction using neural networks” Decision Support Systems (11)1994, pp:545-557.<br />表 1 混淆矩陣<br />混淆矩陣實際情形危機公司正常公司預測情形危機公司TPFP正常公司FNTN<br />表 2 樣本分配表正常公司危機公司小計總計訓練樣本370161531884驗證樣本9240132測試樣本15467221<br />表 3 樣本產業分佈表產業別危機公司正常公司樣本總數農林漁牧業122335採掘業61016製造業食品飲料132740紡織服裝皮毛112738木材家具123造紙印刷71623石油化學塑膠塑料215677電子41115金屬、非金屬礦業275683機械設備儀表51122173 醫藥生物製品194564電力煤氣及水生產供應61723建築業71219交通運輸倉儲業61420信息技術業214667批發和零售貿易224971社會服務業91928傳播及文化產業61319綜合業195170合計樣本總數268616884<br />表 4 自變數資料表資產報酬率(稅後息前)%流動比率%淨值報酬率(稅後)%速動比率%營業毛利率(常續性利益)%總負債/總淨值%營業利益率%負債比率%稅前淨利率%淨值/總資產%稅後淨利率%長期資金適合率(A)%業外收支率%借款依存度%營業費用率%存貨及應收帳款/淨值稅率(A)%總資產週轉率(次)每股淨值(A)(元)應收帳款週轉率(次)常續性EPS(元)存貨週轉率(次)每股營業額(元)固定資產週轉率(次)每股營業利益(元)淨值週轉率(次)每股稅前淨利(元)淨營業週期(天)營收成長率%折舊性固定資產成長率%營業毛利成長率%資產(Asset)營業利益成長率%中國地區失業率稅前淨利成長率%貿易出超稅後淨利成長率%年貿易出超總資產成長率%CPI消費者物價指數淨值成長率%D1危機公司虛擬變數<br />表5 AANNGA模型(43×10×43網路架構)預測結果<br />CorrRateType I ErrorType II ErrorAUCRun 183.71%7.24%9.05%0.8815Run 281.90%8.60%9.50%0.8255Run 385.07%9.95%4.98%0.8700Run 484.16%12.67%3.17%0.7744Run 581.90%9.05%9.05%0.8634Run 683.71%11.76%4.53%0.8318Run 784.16%8.60%7.24%0.8586Run 881.90%6.79%11.31%0.8564Run 982.81%11.76%5.43%0.8606Run 1081.45%6.79%11.76%0.8677Avg83.08%9.32%7.60%0.8490Std1.25%2.15%2.97%0.0312<br />表6 PCA-AANNGA模型(23×10×23網路架構)預測結果<br />CorrRateType I ErrorType II ErrorAUCRun 185.97%8.15%5.88%0.9038 Run 287.33%6.79%5.88%0.8774 Run 386.43%9.05%4.52%0.9234 Run 487.33%5.88%6.79%0.9071 Run 587.78%7.24%4.98%0.9183 Run 685.52%9.50%4.98%0.8358 Run 787.78%9.05%3.17%0.9055 Run 887.33%8.60%4.07%0.8978 Run 986.43%9.50%4.07%0.8816 Run 1087.33%8.60%4.07%0.8989 Avg86.92%8.24%4.84%0.8950 Std0.78%1.22%1.09%0.0252 <br />表7 FMPN模型(42×10×1網路架構)預測結果<br />CorrRateType I ErrorType II ErrorAUCRun 185.97%9.05%4.98%0.9063Run 285.07%9.50%5.43%0.8810Run 386.42%10.41%3.17%0.8692Run 483.26%8.60%8.14%0.8728Run 585.07%7.24%7.69%0.8907Run 684.16%14.03%1.81%0.8836Run 785.52%10.41%4.07%0.9006Run 884.62%10.86%4.52%0.8608Run 986.88%7.24%5.88%0.9176Run 1087.78%7.24%4.98%0.8926Avg85.48%9.46%5.07%0.8875Std1.34%2.12%1.90%0.0176<br />圖1 前饋多層感知器網路(FMPN)模型<br />圖2 自聯想神經網路(AANN)模型<br />圖 3 推定企業危機狀態BF流程架構<br />圖4 AANNGA模型中隱藏層神經元數目與訓練誤差關係圖<br />圖5 AANNGA模型ROC曲線<br />圖6 PCA-AANNGA模型ROC曲線<br />355606450330圖7 FMPN模型ROC曲線<br />