Text Analytics Toolbox の分かち書きで、カスタム辞書を追加できますか?

2 visualizzazioni (ultimi 30 giorni)
Text Analytics Toolbox では、日本語の辞書として MeCab を使用しているようですが、既存の辞書にカスタム辞書を追加させる方法を教えてください。
例えば、現代文ではなく、古文の解析を行うための辞書や医療系用語の辞書を追加したいです。
 

Risposta accettata

MathWorks Support Team
MathWorks Support Team il 13 Apr 2023
Modificato: MathWorks Support Team il 13 Apr 2023
カスタム辞書を追加させたい場合、mecabOptions 関数を使用することが可能です。
・mecabOptions
以下は、中古和文Unidic を用いた例です。辞書の保存先を、"C:\temp\dict\UniDic-wabun_1603" としています。
str = "いづれの御時にか、女御、更衣あまたさぶらひたまひけるなかに、いとやむごとなき際にはあらぬが、すぐれて時めきたまふありけり。"
options = mecabOptions('Model','C:\temp\dict\UniDic-wabun_1603'); % カスタム辞書のフォルダ指定
documents = tokenizedDocument(str,'TokenizeMethod',options)
tkns = tokenDetails(documents)

Più risposte (0)

Categorie

Scopri di più su Convert Image Type in Help Center e File Exchange

Prodotti


Release

R2020a

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!