優(yōu)化個人信用評價 促進社會治理創(chuàng)新

欄目:信用研究 發(fā)布時間:2019-07-28
分享到:
優(yōu)化個人信用評價 促進社會治理創(chuàng)新

——來源:《社會治理》

 

  傳統(tǒng)的個人信用評分,主要是針對商業(yè)銀行個人信貸客戶的違約風險進行評價。近年來我國互聯(lián)網(wǎng)金融的發(fā)展催生出各種信用產(chǎn)品,基于互聯(lián)網(wǎng)的個人信用評分成為了新的熱點。更重要的是,隨著人們社會生活方式的日益多樣化,除金融業(yè)務以外的各類經(jīng)濟行為也帶來了新的信用問題,這就使個人信用逐漸向社會信用發(fā)展,社會信用評分的重要性日漸凸顯。因此,個人信用評分方法的科學性、可操作性及其評分結(jié)果在社會治理中的運用日益廣泛。本文通過對個人信用評分方法的發(fā)展及未來趨勢的分析,以闡述個人信用評價對社會治理的作用。

  一、個人信用評分模型的發(fā)展

  個人信用評分模型實質(zhì)是基于客觀的數(shù)學模型,根據(jù)已掌握的客戶相關(guān)信息對其將來可能的信用情況進行判斷。隨著國內(nèi)外對信用評分研究的不斷深入,個人信用評分模型經(jīng)歷了由統(tǒng)計學方法到非參數(shù)方法、運籌學方法再到人工智能方法的演變,同時由單一模型到組合模型逐漸演進。由此形成了種類繁多的評分方法并構(gòu)成了一個相對完整的體系。

  (一)統(tǒng)計學方法

  判別分析Discriminant Analysis,DA)源于Fisher對三種鳶尾屬植物的分類實驗并被DavidDurand首次用來區(qū)分信用客戶的好壞。判別分析是基于某些分類方法來使同類之間距離最小,異類之間距離最大,通過建立一個或多個判別方程,來判斷某一變量的類別歸屬。當變量服從多元橢球面分布(多元正態(tài)分布是其特例)時,線性判別無疑是最優(yōu)的選擇(忽略樣本抽樣偏差)。BillFair和Earl Isaac于1956年采用判別分析法建立了著名的FICO(Fair Isaac Corporation)信用評分系統(tǒng),由此帶來了判別分析作為經(jīng)典方法在個人信用評分領(lǐng)域的廣泛運用。近年來,HsiangChen于2010年將最新的判別分析方法——SNDA、STDA、SDA、Sparse DA、FDA、MDA分別應用于個人信用評分,以總精確度及錯分率為判別指標,指出SNDA、STDA和SDA在個人信用評分領(lǐng)域表現(xiàn)良好。

  回歸分析法Regression Analysis,RA)是起源于Francis Galton遺傳學研究的經(jīng)典統(tǒng)計學方法之一。是在大量已知數(shù)據(jù)的基礎上,來探究一種變量(自變量)對另外一種變量(因變量)的影響,并建立描述二者間相關(guān)關(guān)系的回歸方程,根據(jù)已知的自變量的值對因變量的值進行預測。在回歸分析法中,應用較為廣泛的有Logistic回歸分析、Probit回歸分析及多元線性回歸。與判別分析相比,回歸分析的魯棒性較低,但回歸分析對數(shù)據(jù)分布的要求相對寬松,而且能夠提供客戶的違約概率,因此獲得了大多數(shù)學者和銀行業(yè)的青睞。目前為止,Logistic回歸已經(jīng)成為最常用的統(tǒng)計方法之一。Srinivasan和Kim得出了Logistic回歸在分類效果上要優(yōu)于判別分析的結(jié)論。

  (二)非參數(shù)方法

  最近鄰法Nearest Neighbors, NNs)是由Fix和Hodges于1952年提出的用于分類問題的標準非參數(shù)方法,并由紐約銀行最早應用于信用評分領(lǐng)域。其中最常用的是由Hart和Cover于1968年提出的KNN模型,因其能夠很好的解決概率密度函數(shù)的分類和估計問題,在個人信用評分研究中取得了較好的效果。KNN模型通過計算尋找與待判樣本點距離最近的k個信用樣本,再根據(jù)k個樣本的表現(xiàn),以投票的方式確定待判樣本的信用情況。由于最近鄰法不用提前學習和訓練模型,允許動態(tài)地更改客戶信息,從而能很好地解決人口漂移問題,而較近的應用研究中則關(guān)注了“維數(shù)禍根”(Curseof Dimensionality)問題,指出最近鄰法在應用于高維數(shù)據(jù)時,即使樣本量很大,散落在高維空間內(nèi)的樣本點仍十分稀疏,難以找到相鄰的樣本。研究進一步指出,可以通過非線性的數(shù)據(jù)投影法來降低數(shù)據(jù)維度或者使用基于排序的最近鄰法來解決這一問題。

  決策樹法Decision Tree, DT)由Breiman和Friedman于1973年提出,用以解決一般的分類問題,隨后該方法被引入信用評分領(lǐng)域。決策樹法以違約的可能上同質(zhì)性更強為劃分標準,將信用申請者劃分為兩個子類,每個子類再次劃分為同質(zhì)性更強的子類,整個遞歸過程直到子類達到預設的終止條件為止。決策樹算法支持多個參數(shù),會對所生成的挖掘模型的性能和準確性產(chǎn)生影響。Porter首次將決策樹用于個人信用評估方法中。考慮到樣本屬性中包括了數(shù)值型數(shù)據(jù)及非數(shù)值型數(shù)據(jù),近年來有學者將Boosting算法技術(shù)嵌入決策樹中,該嘗試取得了更好的判別效果。

  數(shù)據(jù)包絡分析法Data Envelopment Analysis,DEA)是在相對效率評價基礎上發(fā)展的系統(tǒng)分析方法。它是以相對效率概念為基礎,根據(jù)多指標投入和多指標產(chǎn)出對相同類型的單位進行相對有效性或效益評價的一種新方法。將數(shù)據(jù)包絡分析法應用于個人信用評估,可將個人的特征向量視為投入指標,個人的信用情況視為產(chǎn)出指標進行分類。數(shù)據(jù)包絡分析法的優(yōu)點在于能夠有效避免主觀因素,減少誤差,且建立模型前無須對數(shù)據(jù)進行無量綱化處理,與個人信用指標的特征一致。Cheng于2007年將DEA模型應用于私人融資計劃中借款人的信用評分,指出DEA有著能夠自動生成相對權(quán)重等優(yōu)點。

  (三)運籌學方法

  在個人信用評分中應用的運籌學方法主要是線性規(guī)劃法((Linear Programming, LP)。Mangasarian于1965年將線性規(guī)劃方法應用于分類問題。1981年,F(xiàn)reed闡明了線性規(guī)劃在判別及分類上的應用之后,該方法才引起了更多的關(guān)注。線性規(guī)劃模型通過找到一組權(quán)重值,在給定的臨界值的條件下,使得所有“好客戶”的得分都在該臨界值之上,而所有“壞客戶”的得分都在這個臨界值之下從而實現(xiàn)個人信用樣本的分類。

  (四)人工智能方法

  專家系統(tǒng)Expert System),作為人工智能方法應用于個人信用評分的成功嘗試,其核心為通過一個包含某特定領(lǐng)域知識的數(shù)據(jù)庫和對信息進行遞推的規(guī)則,分析新情況并給出專家級的解決方案。Talebzadeh,Mandutianu和Winner于1995年介紹了CLUES專家系統(tǒng)的構(gòu)建,該系統(tǒng)可以決策是否批準住房抵押貸款申請,后被美全國金融公司采用。

  神經(jīng)網(wǎng)絡Artificial Neural Networks, ANNs)作為對變量進行線性組合和非線性變化,然后循環(huán)修正的一種方法,能夠模擬人類大腦的決策過程,利用神經(jīng)元相互觸發(fā),建立一種學習機制。Wolpert于1992年在信用風險評測中引入神經(jīng)網(wǎng)絡的方法,2000年Moody's公司公布了一套上市公司的信用風險評估模型,這套模型的主要方法為神經(jīng)網(wǎng)絡。至此,研究者和實踐者開始廣泛關(guān)注神經(jīng)網(wǎng)絡這一方法,很多學術(shù)期刊將傳統(tǒng)的參數(shù)和非參數(shù)方法和五種不同的神經(jīng)網(wǎng)絡算法(包括混合專家系統(tǒng)、失真適應響應和多層感知器等)進行了比較分析,其結(jié)果是神經(jīng)網(wǎng)絡的穩(wěn)定性較好。

  支持向量機Support Vector Machine, SVM)于1995年由Corinna Cortes和Vapnik提出,其核心是通過某種事先選擇的非線性映射將輸入向量映射到一個高維特征空間,在此空間中根據(jù)區(qū)域中的樣本計算該區(qū)域的決策曲面,由此確定該區(qū)域中未知樣本的類別。

  SVM的出現(xiàn)解決了以往學習方法中存在的小樣本、非線性、過學習、高維數(shù)、局部極小等實際問題,在個人信用評分中,支持向量機方法評分精度較高,預測能力強,且受變量限制少,具有很強的泛化能力,因此支持向量機不僅在手寫數(shù)字識別、文本分類、語音辨識等問題上得到了廣泛應用,在個人信用評分領(lǐng)域也成為了研究的熱點。Huang于2009年指出SVM算法能夠更好地捕捉變量間的非線性關(guān)系,并在SVM的基礎上提出了混合支持向量機算法,通過實證驗證了混合支持向量機算法有著更高的精確度,并有效降低了第二誤判率。

  (五)組合評分方法

  上述的單一信用評分方法各有優(yōu)勢,由此引發(fā)了對組合方法的嘗試。Bates和Granger于1969年開始系統(tǒng)地對組合方法進行研究。Clemen于1989年總結(jié)了不同領(lǐng)域的大量相關(guān)研究,得出組合模型能夠取得更高預測精度的結(jié)論,這也成為了組合預測研究的一個里程碑。組合方法主要分為線性組合和非線性組合。其中權(quán)重的確定是問題的關(guān)鍵,權(quán)重的確定可分為固定權(quán)重和可變權(quán)重。到目前為止,比較常用的方法有簡單平均法、勝出法、最優(yōu)法和回歸法。

  近年來國內(nèi)在個人信用評分組合方法的研究上也取得了不少成果。既發(fā)揮了這些具有代表性的單一模型優(yōu)勢,同時減少了由于權(quán)重確定產(chǎn)生的誤差。

  二、個人信用評分模型應用中的問題及發(fā)展趨勢

  (一)信用樣本有效性及完整性問題

  樣本有效性是評分模型在我國信用數(shù)據(jù)中進行應用面對的首要問題。由于我國消費信用貸款業(yè)務發(fā)展較晚,信用體系尚未完善,現(xiàn)有的信用數(shù)據(jù)相當有限,且由于信用信息的提交仍不規(guī)范,灰色收入等紕漏的存在,造成信用樣本數(shù)據(jù)的權(quán)威性和有效性面臨挑戰(zhàn)。

  在信用樣本的完整性上,已有的個人信用評分模型都面對著一個不可忽視的數(shù)據(jù)問題——樣本偏差(Biased Sample)。樣本偏差來自于非隨機性的樣本獲取過程,表現(xiàn)為樣本和總體分布的非一致性,其本質(zhì)是一種樣本選擇問題(SampleSelection)。在個人信用評分上,樣本偏差表現(xiàn)為拒絕推論(Reject Inference)。拒絕推論就是指在個人信用評分的過程中,評估模型是建立在已接受的信用樣本之上的,而缺少那些申請被拒絕的樣本(拒絕樣本)的相應數(shù)據(jù)。這就導致了信用評分模型所用數(shù)據(jù)不是隨機樣本,不能代表整個申請者的“入門總體”(Through-the-doorPopulation),從而導致評估的偏差。

  樣本有效性和完整性對個人評分精度有重要影響,因此個人信用樣本及樣本結(jié)構(gòu)的優(yōu)化是未來發(fā)展的重要方向。一方面,需要在現(xiàn)有的樣本下對結(jié)構(gòu)進行優(yōu)化;另一方面,要考慮如何擴大樣本的規(guī)模,使樣本更接近總體。這事實上對評分模型的處理能力提出了新的要求,既要保證模型具有對大樣本數(shù)據(jù)的處理能力,同時又要保證模型的運算速度。

  (二)信用指標體系合理性問題

  信用評分指標體系的確定是個人信用評分的第一步,對整個信用評分的精確性及信用風險的有效識別至關(guān)重要。但我國尚未建立有效的、權(quán)威的指標體系。而我國的文化習慣和道德標準與國外相差較大,國內(nèi)不同地區(qū)間經(jīng)濟發(fā)展水平、人口結(jié)構(gòu)和生活方式,各民族間文化及道德標準也有著較大差異,這就導致同一指標在不同的實際應用中顯著性有著較大的變化,因此針對不同的數(shù)據(jù)樣本,對指標體系中的特征變量及變量的權(quán)重有所調(diào)整,充分適應實際業(yè)務需求十分必要。

  從目前來看,信用指標體系中的人口統(tǒng)計變量較多,而信用記錄的變量較少,因此解決這一問題的關(guān)鍵是增加信用記錄的相關(guān)變量。顯然,由于商業(yè)銀行的信用記錄就是單純的個人信貸還款記錄,因此需要從商業(yè)銀行系統(tǒng)以外尋求信用記錄的來源。一方面,隨著互聯(lián)網(wǎng)的不斷發(fā)展和人們基于網(wǎng)絡的經(jīng)濟、社會行為的不斷豐富,相關(guān)信用記錄種類的數(shù)據(jù)也在不斷豐富。

  比如各類交易軟件的廣泛使用,由此形成的契約關(guān)系下當事雙方行為構(gòu)成的履約和違約,是非常重要的信用記錄。與此同時,在社交網(wǎng)絡中的個體行為也是對個人信用很重要的衡量尺度。另一方面,隨著公共信息的不斷完善和政府相關(guān)部門間的信息融合,包括個人婚姻、生育、交通、納稅和社保等表征個人信用的信息不斷完善,這為從社會信用記錄角度去充實相關(guān)變量和指標提供了重要支持。

  與此同時,上述來源的信息還可以用來充實和補充個人統(tǒng)計變量。因此,個人信用指標體系包括了三個組成部分,即個人統(tǒng)計變量、包括銀行信貸和網(wǎng)絡交易行為的信用記錄、社會信用信息,三個方面的指標使信用評價更具完整性,而且可以相互印證,進一步提高信用數(shù)據(jù)的質(zhì)量。

  (三)模型選擇及適用性問題

  目前,無論是學術(shù)研究還是商業(yè)銀行的實踐都致力于提高個人信用評分模型的精確性、穩(wěn)定性及解釋性,以便有效地進行風險識別并降低信用風險。但已有的模型各具優(yōu)缺點。

  結(jié)合互聯(lián)網(wǎng)和社會信用體系建設的發(fā)展,面對大數(shù)據(jù)下的評分模型的選擇既是對原有方法的繼承,同時又面臨新的突破,尤其是隨著算法的不斷完善和處理數(shù)據(jù)能力的提高,各種模型的集成和融合將成為未來發(fā)展方向。

  一方面,由于信用樣本的增加,與待評分樣本相近樣本的數(shù)量增加,這就為尋找與之更為匹配的樣本集提供了條件,由此可以解決過去一直困擾信用評分的人口漂移問題。例如,可以考慮運用案例推理的方法,通過聚類建立與待評分樣本相近的樣本集,通過對這一特定的樣本集的訓練獲得更為精準的模型用來進行預測。另一方面,由于人工智能方法的發(fā)展,可以充分運用機器學習的優(yōu)勢將不同的模型進行集成,通過集成算法來選擇評分精度更高的模型并規(guī)避單一模型的缺陷。

  很重要的一點在于,當個人信用評分的范圍擴大到商業(yè)銀行以外的網(wǎng)絡信用、社會信用之后,評分的目的也就不僅僅限于對違約概率的預測。例如,網(wǎng)絡評分除對違約進行預測外,會更注重于個體的商業(yè)價值尤其是潛在價值,而社會信用評分則會側(cè)重考慮個體行為對社會積極或消極的影響。而社會信用評分的發(fā)展會衍生出不同的評分使用者,他們各自的訴求也有所不同。例如,招聘單位會看重評分中的個人素質(zhì)和品德等因素,甚至會關(guān)注其社會資源和人脈,網(wǎng)絡監(jiān)管部門則更重視其在上網(wǎng)過程中的不良行為;各類金融產(chǎn)品的提供者則在判斷違約概率的同時關(guān)注其償還能力。

  三、個人信用評分方法的發(fā)展對社會治理的作用

  (一)提高社會治理的針對性

  隨著個人信用評分方法的不斷優(yōu)化,更多的商業(yè)銀行個人信用評分模型被應用到社會信用評分中,這些成熟的方法結(jié)合社會信用相關(guān)數(shù)據(jù)資源的不斷豐富,能夠更加有效地識別影響社會信用的主要因素,從而有利于推進社會信用體系建設,提高我國社會信用水平。

  如何有效地識別影響我國社會信用的主要因素,建立具有我國特色的社會信用評分指標體系,是我國在開展社會信用體系建設中存在的主要問題。

  隨著個人信用評分方法的發(fā)展,包括統(tǒng)計方法、人工智能方法等越來越多有效的數(shù)據(jù)挖掘方法應用到信用評分領(lǐng)域并得到完善,如模糊集算法、粒子群優(yōu)化算法、粗糙集算法等。能夠有效地挖掘影響信用的主要因素,從而更好地指導我國開展有針對性的社會信用體系建設,同時也能夠輸出社會信用建設中的薄弱因素,使社會治理的目標更加明確,更具有針對性。

  (二)提高社會治理的有效性

  個人信用評分精度不斷提高,可以以違約概率作為輸出變量用以區(qū)分信用度的高低,也可以表示為一個評分值。這就使評分方法在社會信用評分中具有很好的適用性。可以依據(jù)社會信用評分的特點和要求,將各類被證明有效的方法進行篩選、修正、組合和優(yōu)化,應用于個人的社會信用評分,并可以向政府信用、行業(yè)信用、企業(yè)信用進行擴展,從而使評分更加科學準確,同時提高評分方法對不同類別人群的適用性和針對性,這將極大地加強社會治理的有效性。

  優(yōu)化的個人信用評分方法可以通過制定統(tǒng)一的評價標準,對個人的信用狀況進行準確評價,從而通過采取有效的社會治理措施并形成社會氛圍,提高對個人行為的約束力,并對失信者進行有效治理,從而構(gòu)建“鼓勵守信、懲戒失信”的社會治理機制,進而有效地提升社會治理效率。

  一方面,在諸如市場準入、資質(zhì)認定、行政審批、政策扶持等領(lǐng)域,通過實行信用分類管理,并在依法行政的前提下采取優(yōu)先辦理、簡化程序等激勵措施,在社會治理領(lǐng)域強化正向激勵機制。另一方面,使對失信行為的治理能夠有據(jù)可依,例如建立黑名單制度和警告制度,同時通過信用評分的比較使不同個體在面對金融、就業(yè)、社保等業(yè)務和社會資源分配過程中,享受到守信帶來的利益。

  (三)推動社會治理的發(fā)展與創(chuàng)新

  大數(shù)據(jù)不僅是一場技術(shù)變革,在本質(zhì)上也是一場社會變革,這種社會變革伴隨并呼喚著社會治理體制和社會治理方式的創(chuàng)新。個人信用評分方法在發(fā)展的過程中與大數(shù)據(jù)技術(shù)不斷地融合發(fā)展,多種數(shù)據(jù)挖掘算法被應用到個人信用評分中。

  通過各地圍繞智慧城市的信用信息管理平臺建設,可以實現(xiàn)個人信用數(shù)據(jù)和信用評分等與數(shù)字城市“一級平臺”的互聯(lián)互通,同時通過數(shù)據(jù)挖掘和深度分析達到各系統(tǒng)之間的功能協(xié)同和聯(lián)動,對于防范來自特定個體的安全隱患、開展實時監(jiān)督預警和社會治理提供支持。

  個人信用評分方法的發(fā)展,還能夠促進社會治理的信息體系建設,為社會治理模式提供科學技術(shù)手段支撐,極大豐富社會治理模式的內(nèi)涵和外延,有利于促進新興的生產(chǎn)力和生產(chǎn)關(guān)系的和諧。個人信用評分中的識別技術(shù)、智能信息技術(shù)、云計算技術(shù)等都將應用于社會治理,以更加精細和主動的方式實現(xiàn)社會治理,使得社會治理的各個子系統(tǒng)之間更加融合,有利于社會的長期和諧發(fā)展,有利于社會治理體系的不斷完善,有利于推動社會治理的發(fā)展與創(chuàng)新。