Logo
line decor
   創應所介紹民生實驗園區技術層面實測密技訪問與問卷研究成員參考資料
line decor
?
 
 
 

 
 
SMADJA 的模型

把斷詞拿去選擇,然後以變異數與平均數的方式挑最好的詞。以擷取搭配詞,如:

SMAJA

簡單的來說,如果輸入「我的國家」,經過bi-gram斷詞系統處理之後,會拆成「我的」、「的國」、「國家」三個斷詞,再從資料庫中,擷取使用可能性最高的詞比對,如同上面的圖示,「我的」和「國家」經過系統比對後,為正確即打V,「的國」為錯誤打X,當然,如果電腦在資料庫中找不到可相比對的語料,就會把這句話列為老師批改的部分。