核心技術
Core Technology


PFG在中文語義識別方面,自建了大規模的語料庫,通過對語料庫的新詞發現,結合行業詞匯,整合成專業詞匯,網絡詞匯豐富的本體,還加入了大量的汽車行業,網絡等的特定規則,十分適用于汽車行業的中文語義分析。 PFG每周都采集數以萬計的網頁語料,不斷擴大本體的規模,使之更貼近實際應用場景。在模型方面,PFG采用了半監督學習的CRF模型,對語料進行訓練,獲得汽車行業的語義分析模型。此外,PFG還改進了分詞器,研發出新詞發現技術,并構建了基于汽車行業的情感分析技術,自動識別消費者對汽車的評論對象和評論情感傾向,并能夠自動對熱點討論話題實現聚類。 |
![]() |