軟件介紹
![](/img/pic/17019487.jpg)
LJCorpus中文語(yǔ)料庫(kù)分析軟件是一套專門(mén)針對(duì)中文生語(yǔ)料庫(kù)的加工、抽取、統(tǒng)計(jì)與翻譯全自動(dòng)的綜合語(yǔ)料分析系統(tǒng),應(yīng)用了領(lǐng)先的漢語(yǔ)詞法分析技術(shù)、新詞發(fā)現(xiàn)技術(shù)、統(tǒng)計(jì)挖掘技術(shù)以及詞語(yǔ)翻譯對(duì)齊技術(shù),目前,東北師范大學(xué)中文系已經(jīng)成功應(yīng)用該軟件對(duì)新加坡的語(yǔ)言進(jìn)行了分析,極大提高了研究的效率。相似軟件版本說(shuō)明軟件地址漢語(yǔ)拼音學(xué)習(xí)2015 最新版查看練字游戲2.0 官方版查看記乎卡編器2.4.1 最新版查看搜的成語(yǔ)1.1 中文版查看 LJCorpus中文語(yǔ)料庫(kù)分析軟件的四大功能主要包括: 1. 新詞發(fā)現(xiàn): 從給定的大規(guī)模文本文件集合中,挖掘出內(nèi)涵的新詞語(yǔ)列表,可以用于用戶專業(yè)詞典的編撰。識(shí)別出的新詞結(jié)果還可以進(jìn)一步編輯標(biāo)注,編輯好的新詞詞典,可以作為專業(yè)知識(shí)庫(kù)導(dǎo)入分詞詞典中,從而提高分詞系統(tǒng)的準(zhǔn)確度,并適應(yīng)新的語(yǔ)言變化情況。 2. 分詞標(biāo)注: 對(duì)生語(yǔ)料進(jìn)行分詞、自動(dòng)識(shí)別人名地名機(jī)構(gòu)名等未登錄詞、新詞標(biāo)注以及詞性標(biāo)注。并可在分析過(guò)程中,導(dǎo)入用戶定義的詞典。 3. 統(tǒng)計(jì)分析 針對(duì)切分標(biāo)注結(jié)果,系統(tǒng)可以自動(dòng)地進(jìn)行統(tǒng)計(jì)分析,分析結(jié)果包括:一元詞頻統(tǒng)計(jì)(統(tǒng)計(jì)結(jié)果可以按照詞頻、詞語(yǔ)兩種方式排序;并給出具體的一元概率)、二元詞語(yǔ)轉(zhuǎn)移概率統(tǒng)計(jì)(統(tǒng)計(jì)兩個(gè)詞左右連接的頻次即概率)。 4. 術(shù)語(yǔ)翻譯 針對(duì)常用的術(shù)語(yǔ),系統(tǒng)會(huì)自動(dòng)給出相應(yīng)的英文解釋。