可以在一堆文章中按照某種標(biāo)準(zhǔn)(軟件里的篩選設(shè)置)篩選出原創(chuàng)文章來(lái)。
篩選過(guò)程是:隨機(jī)抽樣出一篇文章的指定數(shù)量的句子,然后使用百度搜索來(lái)判斷句子是否被收錄,最后綜合起來(lái)就可以判斷出是否原創(chuàng)文章。比如一般抽10句來(lái)篩選,然后設(shè)定判斷比例60%,(按未收錄率)也就是10句里有6句沒(méi)有收錄就判斷為原創(chuàng)。篩選出的原創(chuàng)文章的準(zhǔn)確性取決于篩選設(shè)置。
1.5 版開(kāi)始新增聯(lián)眾自動(dòng)打碼功能,可以 24 小時(shí)自動(dòng)應(yīng)付百度驗(yàn)證碼。試用版不能使用自動(dòng)打碼功能,需手動(dòng)打碼。
概念說(shuō)明:
“按收錄率判斷”,只要被檢測(cè)的句子收錄比率達(dá)到設(shè)定值,即不是原創(chuàng)文章。
“按未收錄率判斷”,只要被檢測(cè)的句子未收錄比率達(dá)到設(shè)定值,即是原創(chuàng)文章。
句子的收錄比率或未收錄比率是相對(duì)于用于檢測(cè)的句子總數(shù)的百分比。
下面以“按收錄率判斷”為例:
隨機(jī)抽選 10 句,收錄率為10%,則只要有 1 句在百度中找到,就不是原創(chuàng)文章,同樣,若收錄率為20%,只要有2句在百度中找到就不是原創(chuàng)文章,3句(30%)、4句(40%)……
也就是說(shuō),設(shè)置的收錄率越低或未收錄率越高,判斷原創(chuàng)的要求就越高,原創(chuàng)精準(zhǔn)度就越高(但是也要適當(dāng)控制,否則可能導(dǎo)致檢測(cè)不到原創(chuàng)文章)。