サンプルスクリプトの使いかた
使用するモジュールに応じたサンプルスクリプトを示します。
マシン環境に応じて、UNIX用とWindows用のいずれかをお選びください。
TermExtract::Chasen (「茶筅」)
ex_chasen.pl (UNIX用はEUC, Windows用はSJIS)
TermExtract::MeCab (「和布蕪」)
ex_mecab.pl (UNIX用はEUC, Windows用はSJIS)
TermExtract::JapanesePlainTextEUC (和文[EUC])
ex_JPTE.pl (EUC)
TermExtract::JapanesePlainTextSJIS (和文[SJIS])
ex_JPTS.pl (SJIS)
TermExtract::EnglishPlainText (英文そのもの)
ex_EPT.pl
TermExtract::BrillsTagger ("Brill's Tagger"、"Monty Tagger")
ex_BT.pl
TermExtract::ChainesPlainTextGB (中文[GBコード])
ex_CPT_GB.pl (GB)
TermExtract::ChainesPlainTextUC (中文[UTF-8])
ex_CPT_UC.pl (UTF-8)
TermExtract::ICTCLAS (中文ICTCLAS)
ex_ICT.pl (GB)
サンプルスクリプトを見ればわかりますが、専門用語の重要度の計算方式で、いく
つものオプション指定ができます。
オプションの設定方法は、各モジュールのドキュメントをご覧ください。