大數(shù)據挖掘技術創(chuàng)新 提升人崗匹配效率

欄目:大數(shù)據 發(fā)布時間:2020-03-03
分享到:
大數(shù)據挖掘技術創(chuàng)新 提升人崗匹配效率

——來源:科技日報


    美國時間8月4日—8日在阿拉斯加州召開的KDD2019(國際數(shù)據挖掘與知識發(fā)現(xiàn)大會)上,我國數(shù)據挖掘領域的創(chuàng)新技術以論文的形式獲得發(fā)表。

    “很多時候靜態(tài)文本無法充分表達人們內心最深層的需求,而動態(tài)交互行為的文本偏好信息恰能輔助你理清內心真實的需求?!北本┐髮W計算機科學技術研究所研究員嚴睿表示,為了更好地為求職者和崗位之間達成匹配,北大團隊與BOSS直聘自然語言處理中心通過引入記憶模塊,首次利用簡歷文檔和崗位描述文檔歷史交互行為下的信息來學習潛在偏好的信息,把人類求職經歷中的“偏好”體現(xiàn)在數(shù)據的“記憶”中。

    人類的記憶是有偏好的,讓數(shù)據也長出“記憶”,能更準確地挖出大數(shù)據中有用的信息。之前的研究集中于對比“簡歷與崗位”在文本上的匹配度,而在現(xiàn)實世界中,除了靜態(tài)文本信息外,動態(tài)行為交互信息(例如求職招聘雙方各自的面試歷史記錄)中蘊含著對預測匹配更有幫助的因素。

    “我們發(fā)現(xiàn),雙方的偏好也決定著匹配的準確度?!彼窝蟊硎?,團隊利用記憶網絡對面試歷史記錄這一外部知識進行學習,并加入到模型參數(shù)中去,從而提升人崗匹配效果。

    讓數(shù)據長出“記憶”,是不是符合人類群體的“記憶”?這個方法究竟能不能提高匹配準確度呢?這些都需要實踐檢驗。

    “我們基于數(shù)據集采用5個評測指標對模型進行驗證?!彼窝蠼忉?,社會公共類的調查沒有真人實驗,但可以固定一個時間窗口來取求職者和招聘者雙方的歷史面試記錄,用來預測之后一段時間樣本集合內的求職者和招聘者雙方是否發(fā)生匹配,這與實際情況是一致的,實驗結果也證明全新的數(shù)據挖掘技術優(yōu)于當前最優(yōu)的人崗匹配方法。

     相關專家認為,中國由于人口基數(shù)大、互聯(lián)網應用發(fā)展成熟等特點,是大數(shù)據的主要產出國,如何有效地利用數(shù)據,提高現(xiàn)有諸如職位對接、商務對接等的有效率,將真實世界的特點融入到大數(shù)據向知識的轉化中,亟待大數(shù)據挖掘技術的創(chuàng)新。例如,互聯(lián)網上存在著數(shù)億規(guī)模的求職者簡歷以及崗位招聘信息,有效的數(shù)據挖掘技術將大大提升人崗匹配效率,減少耗費比,對國民經濟帶來良性作用的同時,讓每個人都能發(fā)揮出自己的價值。(記者 張佳星