靈玖Lingjoin(www.lingjoin.com)采用基于語義的統(tǒng)計語言模型,所處理的文檔不受行業(yè)領(lǐng)域限制,能夠有效地挖掘出新出現(xiàn)的特征詞匯,所輸出的詞匯可以配以權(quán)重。
靈玖特征詞發(fā)現(xiàn)組件的主要特色在于:
1、速度快:可以處理海量規(guī)模的網(wǎng)絡(luò)文本數(shù)據(jù),平均每小時處理至少60萬篇文檔; 2、處理精準:Top N的分析結(jié)果往往能反映出當時的時事流行語和熱點實體,適合于輿情熱點計算;與國際上著名廠商的技術(shù)相比,靈玖的各項指標遠遠領(lǐng)先,或許是靈玖更懂中文吧; 3、精準排序:特征詞匯按照影響權(quán)重排序,可以輸出權(quán)重值; 5、開放式接口:靈玖特征詞發(fā)現(xiàn)組件作為LJParser的一部分,采用靈活的開發(fā)接口,可以方便地融入到用戶的業(yè)務(wù)系統(tǒng)中,可以支持各種操作系統(tǒng),各類調(diào)用語言。
靈玖特征詞發(fā)現(xiàn)組件可以應(yīng)用于文本挖掘、知識管理、詞典編輯、輿情監(jiān)測等多種應(yīng)用中。