ZETA評分模型的構(gòu)建數(shù)理方法
作者: 來源: 文字大小:[大][中][小]
ZETA評分模型的構(gòu)建中的數(shù)理方法,綜合以來,主要有以下幾種:
1.判別分析法(discriminant analysis)
判別分析法(discriminant analysis,簡稱da ) 是根據(jù)觀察到的一些統(tǒng)計數(shù)字特征,對客觀事物進行分類,以確定事物的類別。它的特點是已經(jīng)掌握了歷史上每個類別的若干樣本,總結(jié)出分類的規(guī)律性,建立判別公式。當(dāng)遇到新的事物時,只要根據(jù)總結(jié)出來的判別公式,就能判別事物所屬的類別。
da的關(guān)鍵就在于建立判別函數(shù)。目前,統(tǒng)計學(xué)建立判別函數(shù)常用方法有:一是未知總體分布情況下,根據(jù)個體到各個總體的距離進行判別的距離判別函數(shù);二是已知總體分布的前提下求得平均誤判概率最小的分類判別函數(shù),也稱距離判別函數(shù),通常稱為貝葉斯(bayes)判別函數(shù);三是未知總體分布或未知總體分布函數(shù)前提下的根據(jù)費歇(fisher) 準則得到的最優(yōu)線性判別函數(shù)。
2.多元判別分析法(multivariate discriminant analysis)
多元判別分析法(mda)是除美國外的其他國家使用最多的統(tǒng)計方法。多元線性判別分析法,可以具體為一般判別分析(不考慮變量篩選)和定量資料的逐步判別分析(考慮變量篩選)。但應(yīng)用多元判別分析(mda)有三個主要假設(shè):變量數(shù)據(jù)是正態(tài)分布的;各組的協(xié)方差是相同的;每組的均值向量、協(xié)方差矩陣、先驗概率和誤判代價是已知的。
該種方法的不足之處是必須建立在大量的、可靠的歷史統(tǒng)計數(shù)據(jù)的基礎(chǔ)之上,這在發(fā)展中國家如中國是難以具備的前提條件。
3.logit 分析判別方法
logit 分析與判別分析法的本質(zhì)差異在于前者不要求滿足正態(tài)分布或等方差, 從而消除了mda 模型的正態(tài)分布假定的局限性。其模型主要采用了logistic 函數(shù)。
該模型的問題在于當(dāng)樣本點存在完全分離時,模型參數(shù)的最大似然估計可能不存在,模型的有效性值得懷疑,因此在正態(tài)的情況下不滿足其判別正確率高于判別分析法的結(jié)果。另外該方法對中間區(qū)域的判別敏感性較強,導(dǎo)致判別結(jié)果的不穩(wěn)定。
4.神經(jīng)網(wǎng)絡(luò)分析法(artificial neural network,簡稱ann)
神經(jīng)網(wǎng)絡(luò)分析法是從神經(jīng)
心理學(xué)和認知科學(xué)研究成果出發(fā),應(yīng)用數(shù)學(xué)方法發(fā)展起來的一種具有高度并行計算能力、自學(xué)能力和容錯能力的處理方法。它能有效解決非正態(tài)分布、非線性的信用評估問題,其結(jié)果介于0與1之間,在信用風(fēng)險的衡量下,即為違約概率。神經(jīng)網(wǎng)絡(luò)分析方法應(yīng)用于信用風(fēng)險評估的優(yōu)點在于其無嚴格的假設(shè)限制且具有處理非線性問題的能力。altman、marco和varetto(1994)在對意大利公司財務(wù)危機預(yù)測中應(yīng)用了神經(jīng)網(wǎng)絡(luò)分析法;coats及fant(1993)trippi采用神經(jīng)網(wǎng)絡(luò)分析法分別對美國公司和銀行財務(wù)危機進行預(yù)測,取得較好效果。然而,要得到一個較好的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),需要人為隨機調(diào)試,需要耗費大量人力和時間,加之該方法結(jié)論沒有統(tǒng)計理論基礎(chǔ),解釋性不強,所以應(yīng)用受到很大限制。
5.聚類分析法(cluster analysis)
聚類分析(cluster analysis)屬于非參數(shù)統(tǒng)計方法。信用風(fēng)險分析中它根據(jù)由借款人的指標計算出的在樣本空間的距離,將其分類。這種方法一個主要優(yōu)點是不要求總體的具體分布;可對變量采用名義尺度,次序尺度,因此該方法可用于定量研究,也可對現(xiàn)實中的無法用數(shù)值精確表述的屬性進行分析。這很適用于信用風(fēng)險分析中按照定量指標(盈利比、速動比等) 和定性指標(管理水平、信用等級等) 對并不服從一定分布特性的數(shù)據(jù)信息分類的要求。例如,lundy運用該方法對消費貸款申請者的典型信用申請數(shù)據(jù)及年齡、職業(yè)、婚否、居住條件進行處理分成 6類并對每類回歸評分,它不僅將借款人進行有效的分類而且?guī)椭虡I(yè)銀行確定貸款方式策略。
6.k近鄰判別法(k nearest neighbor)
k近鄰判別法在一定距離概念下按照若干定量變量從樣本中選取與確定向量距離最短k個樣本為一組,適用于初始分布和數(shù)據(jù)采集范圍限制較少時,減小了以函數(shù)形式表達內(nèi)容的要求。另外,knn 通過將變量在樣本整體范圍內(nèi)分為任意多決策區(qū)間,而近似樣本分布。tametal將之用于信用風(fēng)險分析,取馬氏距離,從流動性、盈利性、資本質(zhì)量角度選出的19 個變量指標,對樣本分類,經(jīng)比較其分類結(jié)果的準確性不如lda、lg以及神經(jīng)網(wǎng)絡(luò)。原因在于在同樣的樣本容量下,若對具體問題的確存在特定的參數(shù)模型并可能找出時,非參數(shù)方法不及參數(shù)模型效率高。
7.層次分析法(ahp)
該方法強調(diào)人的思維判斷在決策過程中的作用,通過一定模式使決策思維過程規(guī)范化,它適用于定性與定量因素相結(jié)合、特別是定性因素起主導(dǎo)作用的問題,企業(yè)信用等級綜合評價就是這種定性因素起主導(dǎo)作用的問題。ahp法的基本步驟是:建立遞階層次結(jié)構(gòu),構(gòu)造判斷矩陣,求此矩陣的最大特征根及其對應(yīng)的特征向量,確定權(quán)重,并進行一致性檢驗。
8.其他方法
此外還存在著其他眾多的方法:probit法、因子(logistic)法、模糊數(shù)學(xué)方法、混沌法及突變級數(shù)法、灰關(guān)聯(lián)熵、主成分分析綜合打分法、主成分分析與理想點的結(jié)合方法、原蟻群算法、數(shù)據(jù)包絡(luò)判別法等等。關(guān)于這些方法的應(yīng)用,將在后面的實證部分進行探討。