”専門用語(キーワード)自動抽出システム”
新着情報アーカイブ
トップページに戻る
- 2022.3.9 Python版TermExtractについて、Windows環境に合わせインストール手順を修正しました。python setup.py installからpip install .に変更します。ドキュメントの修正に合わせバージョンを0.02にアップしました。
- 2023.10.23 "言選Web" 静的サイト(JavaScript)版 - 和文のみ をリリースしました。
- 2023.10.23 日本語専門用語抽出Node.jsライブラリ termextract-kuromojijs のβバージョン(0.02b)をリリースしました。
- 2022.3.9 Python版TermExtractについて、Windows環境に合わせインストール手順を修正しました。python setup.py installからpip install .に変更します。ドキュメントの修正に合わせバージョンを0.02にアップしました。
- 2021.2.1 Perl版のツール termex, termex lite, termex(中文版), termmiについて、現状のWindows環境に合わせ修正しました。
主な変更点は次のとおりです。
Windows版PerlをStrawberry Perlに絞りました
Windows版での日本語形態素解析システムをMeCab(和布蕪)に絞りました
IE Trapperのオプション機能を取り下げました
- 2016.12.29 Python用termextractβ版におけるTF*IDFの説明を訂正しました。バージョンは0.12bにアップしました。
- 2016.12.28 Python用termextractβ版におけるchineseのスペルミスを修正しました。バージョンを0.11bにアップしました。
- 2016.12.28 Python用termextractのβ版を公開しました。
- 2016.6.20 言選Webで「URL指定」の処理ができなくなっていましたが、復旧しました。ご迷惑をおかけしました。
- 2016.6.20 TermExtractのバージョン4.11をリリースしました。MeCab.pmを和布蕪の未知語の扱いの変更に合わせています。またBrillsTager.pm及びICTCLAS.pmで扱う記号扱いにする文字に"["と"]"を追加しました。
- 2016.6.19 Python版TermExtractのα版を公開しました。
- 2016.4.22 termexとtermmiのConfigure.pl (初期設定プログラム)を和布蕪の「「Program Files(x86)」へのインストールに対応させました
- 2016.4.12 平成27年度の統計を更新しました
- 2015.4.4 平成26年度の統計を更新しました
- 2013.06.16 言選Webの中文版を復旧しました。これで全てのサービスを復旧しました。長らくお待たせをいたしました。
- 2013.06.16 言選Webの多言語版を復旧しました。中文版はしばしお待ちください。
- 2013.06.15 言選Webの日本語版を復旧しました。多言語版と中文版はしばしお待ちください。
- 2013.06.12 言語判定器Lingua-LanguageGuesserのページを復旧しました
- 2013.06.12 統計データのページを復旧しました
- 2013.06.12 termex lite, terex_cnのソフトウエア配信を再開しました
- 2013.06.12 TermExtract, termex, termmiのソフトウエア配信を再開しました
- 2013.06.12 TermExtract, termex, termmiのソフトウエア配信を再開しました
- 2013.06.09 システムトラブルにより言選WebのWebページがダウンしておりました。現在、機能を順次復旧中です。
- 2013.02.14 「蔵書選定のための学位論文タイトルマイニング」 KH Coderと「言選Web」、termmiとR言語によるキーワードマッピング例のスライドです。
- 2013.02.13 termmiをバージョン0.44にアップしました。バージョン0.43における英文処理のバグを修正しています
- 2013.02.05 TermExtractのインストーラーをWindows Active Perl 5.16に対応させました。Perl 5.6以下のバージョン用のインストーラーも残してあります。
- 2012.11.07 当システムの問い合わせ先メールアドレスをに変更しました。
- 2012.03.15 日本語テキスト中の難しい語をレポートするサービス難語レポーターを公開しました。用語の取り出しに言選Webのコードを使っています。旧「レアゴン」の拡張・発展サービスです。
- 2012.03.10 termmiを含むすべての配付プログラムがStrawberry Perl v.5.14でも動作することを確認できました。インストール方法は個々の製品ページにて確認ください。
- 2012.02.27 日本語テキスト中のレア用語を抽出するサービスレアゴンを公開しました。レア用語候補の取り出しに言選Webのコードを使っています。
- 2012.02.25 TermExtract及びtermexがStrawberry Perlでも動作することを確認できました。なお、termexではPerlの"Win32::Shortcut"モジュールの事前インストールが必要です。
- 2011.11.21 書籍リストのブラウジングサービスBe-ビブリオを公開しました。書籍関連語の提示に「言選Web」(TermExtract)を使用しています。
- 2011.11.12 ブクリス [ニュース×カーリル×OPAC! [『気になる本』と出会える図書館サイト] では、言選Web(TermExtract)を活用されています。
- 2011.07.06 専門用語コレ・モカモを公開しました。個々の学術分野に特化した日本語の関連語提示を行います。「言選Web」カスタマイズ版を組み込んでいます。
- 2011.01.04 「ことわけWeb」のサービスを停止しています。これはサーバのハードディスク障害によるものです。
- 2010.09.28 termexに英文(高精度版)のオプションを追加しました。
- 2010.09.28 termex,termex_lite、termex中文版のドキュメントを2010年9月の現状に合わせ修正しました。
- 2009.08.15 「東京大学OPAC Plus "言選Web"」をリニューアル! 新たに、CiNII API, TSUBAKI API, 国会図書館件名標目(NDLSH), 日本語WordNetをマッシュアップしました。
- 2009.08.12 テキストマイニングツールtermmi付属ツール"termdocument.pl"に用語を重要度上位に限定するオプションをつけました。
- 2009.06.23 中文版「言選Web」で利用しているICTCLASを新版(ver 1.0)に差し替えました。
- 2009.05.20 テキストマイニングツールtermmiに「用語・文書行列」を出力するツール"termdocument.pl"を追加しました。
- 2009.05.13 テキストマイニングツールtermmiのTF*IDFモードにおける計算値不具合(LRの情報が含まれる)を対策(新バージョン"0.36"を公開)しました。大変ご迷惑をおかけしました。
- 2009.04.03 当サイトのテキストマイニングツールtermmiが、「安藤 俊幸. “テキストマイニングと統計解析言語Rによる特許情報の可視化”. 情報管理. Vol. 52, No. 1, (2009), 20-31 .」にて紹介されました。
- 2009.01.10 当サイトのテキストマイニングツールtermmiが、「自分でできる解析手法セミナー ―特許情報の解析例― 」(2009年2月6日 INFOSTA主催)にて紹介されます。
- 2008.11.28 バージョン 0.9系のWindows版「和布蕪」で、termexとtermmiが動作しない不具合を対策しました。
- 2008.07.31 「東京大学OPAC Plus "言選Web"」を公開しました。「言選Web」、 「東京大学OPAC」、「Yahoo! Webサービス」を組み合わせたシステムです
- 2008.05.20 前田朗 : "キーワード自動抽出システム「言選Web」", 漢字文献情報処理研究 第6号 pp.124-133, 2005.10 の著者最終稿 (査読前)を掲載しました
- 2008.04.25 フリーソフトウェアのテキストマイニングツール「KH Coder」にTermExtactが組み込まれました
- 2008.01.25 「言選Web」プロジェクトメンバーが関与した新プロジェクト「図書系のためのアプリケーション開発講習会」講習会成果のページを公開しました。
- 2007.10.21 termmi のデフォルトの学習DBをSDBMに変更。また、termmiの英文モードの起動不具合を修正しました。
- 2007.08.05 Active Perl 5.8 用DB_File(バークレーDB)が正常に動作しない不具合が見つかっています。当面、TermExtractで学習機能を使う場合には、BD_Fileの代わりにSDBMを使う(use_SDBMメソッド)か、Perl 5.6をお使いくださるようお願いします。
- 2007.08.04 "termmiがバージョン 5.8 系のActive Perlで動作しない不具合が見つかっています。現在対策中ですが、応急措置として、Perl 5.6 (少し前のバージョン)を使うことで応急措置が可能です。対策までしばらくお待ちください。
- 2007.05.20 「言選Web」を使った"用語クラスタリング試行サービス"「ことわけWeb」を公開しました
- 2007.05.20 第三回文学と情報技術国際会議 (第三届文学与信息技术国际研讨会) 2007年3月19-20日(於東京学芸大学) での中文版「言選Web」の発表を、関連文献リストに載せました。
- 2006.09.21 西欧言語版「言選Web」の言語の自動判定機能は自作の言語判定Perlモジュール
Lingua::LanguageGuesser を使っています。デモページとLingua::LanguageGuesser はいかにして生まれたのか(説明文)をぜひご覧ください。
- 2006.09.21 西欧言語版「言選Web」に言語の自動判定機能を付与しました。
- 2006.08.28 西欧言語版「言選Web」において、UTF8 のHPを正しく処理できない不具合を解決しました
- 2006.06.11 「言選Web」英文(POS Tagger版)[高精度版]の速度が飛躍的に向上しました。
これは「言選Web」内部で使用している英文POS TaggerをPerlモジュール Lingua::EN::Taggerに変更したことによるものです。
- 2006.02.17 日本語版「言選Web」と西欧言語版「言選Web」においてみなさまのWindows上のローカルファイル(テキスト or PDF)を入力にできるようになりました
- 2006.02.01 西欧言語版「言選Web」において、Latin 1 のPDFを処理する際に、文字化けが発生する不具合を解決しました
- 2006.02.01 中国語版「言選Web」が新しくなりました。1)旧来のストップワード方式版とICTCALS方式版がひとつの画面になりました。2)ICTCALSをサーバ内に内蔵したことにより、別途ICTCLASで処理した結果を流用する必要がなくなりました。
- 2005.12.09 お問合せ先のメールアドレスを変更いたしました。
- 2005.11.02 漢字文献情報処理研究 第6号で人文科学と自然言語処理の特集があり、「言選Web」の記事が掲載されました。
それに合わせ、関連文献リストを修正しました。
- 2005.10.24 お問合せ先のメールアドレスを変更いたしました。
- 2005.09.30 情報処理学会 情報学基礎研究会 自然言語処理研究会 合同研究会(横浜国立大学, 2005.9)にて"中文版「言選Web」の発表を行いました。
論文は情報処理学会研究報告に掲載されました。また、発表スライド(パワーポイント2003資料)を”専門用語(キーワード)自動抽出システム”関連文献リスト に掲載しました
- 2005.09.23 termex
のマニュアルに「茶筅」ver
2.3.3以上で英語を扱う方法について載せました。
また、termexパッケージ内のマニュアルも改訂し、ver 4.19 に上げました
- 2005.09.19 termmi の類似度計算スクリプト
vector_space.pl において、total.txt
をOUTPUTフォルダ中の任意の文献に差し替えて任意の文献との類似度を出す使い方をした際に、正しい計算を行うようにしました
- 2005.09.06 形態素解析ソフト「和布蕪」をtermex, termmi でお使いになる場合は、バージョン 0.76以前をお選びください。
- 2005.07.21 TermExtractをはじめとする配布ソフトに仕様の変更、新機能の追加、バグ対策を行いました詳細はこちらをご覧ください。
バグレポートをお送りくださった方々に感謝いたします。今後とも問題があれば
までご連絡いただければ幸いです。
- 2005.05.23 "Gensen
Web"にフランス語、ドイツ語、イタリア語、スペイン語、フィンランド語、スェーデン語の処理機能を追加しました。
- 2005.05.11 "termex, "termex_lite,
"中文版termex
のそれぞれで、パープレキシティによる重要度計算を可能にしました。
また、中文版termexはUnicode(UTF-8)による処理ができない不具合を対策しました。
- 2005.05.11 "TermExtract"のコードを整理しました。バージョンを
3.05 に上げました。
- 2005.05.09 "Gensen
Web"(「言選Web」の英文ページ)にパープレキシティによる重要度計算モードを用意しました
- 2005.05.02 "TermExtract"にパープレキシティによる重要度計算モードを用意しました
- 2005.04.22 「言選Web」の上部タブメニューで各言語を選べるようにしました。
- 2005.04.18 第51回日本図書館情報学会研究大会発表「キーワード(専門用語)自動抽出システムの構想とその展開」発表スライドを関連文献リストに載せました
- 2005.04.15 「言選Web」にパープレキシティによる重要度計算モードを用意しました「言選Web」(日本語版) パープレキシティは、情報学における情報の多様性を示す指標です。TermExtractでの配布はしばらくお待ちください。
- 2005.01.30 Perlモジュール"TermExtract"のプログラムコードを整理(仕様変更やバグ修正ではありません)しました。バージョンを
2.45 にアップしました。
- 2005.01.26 「言選Web」の和文(茶筅)の処理結果もTermExtract ver
2.44のバージョンアップ(バグ修正)にあわせて、仕様どおりに出るよう修正しました。
- 2005.01.26 TermExtract中のTermExtract::Chasen
TermExtract::MeCab
で、「名詞ー形容動詞語幹」、「名詞-ナイ形容詞語幹」を正しく扱えない不具合を修正しました。また、パッケージ中にサンプルスクリプトも含めるようにしました。バージョンを
2.44 に直しました。
- 2005.01.20 termex中文版のダウンロードができなくなっていたのを復旧しました。ご迷惑をおかけしました。
- 2004.12.20 termmiの最新版
0.28をリリースしました
「ベクトル空間法」による類似度計算結果を類似度でソートするようにしました。また、結果の評価法の記述を追加しました。
- 2004.11.24 termmiに「ベクトル空間法」による類似度計算プログラムを追加しました
- 2004.08.19 当システムについての査読付国際会議論文 2nd Annual Meeting of the Association for
Computational Linguistics "Chinese Term
Extraction from Web Pages Based on Compound word
Productivity"を関連文献リストに載せました。
- 2004.07.21 当システムの紹介記事"「言選Web」の世界"が
「図書館の窓」に載りました
- 2004.07.20 「言選Web」
のURL指定ボックスでPDFファイルを扱えるようになりました
- 2004.07.12 当システムをメタデータ入力補助につかった
東京大学経済学部図書館サブジェクトゲートウエイサービス"Engel"
が一般公開されました。
- 2004.07.12 termexの軽量版 "termex liteを公開しました
標準のtermexとは違った結果を出したい、インストールを楽に済ませたいかたにはお薦めです。
- 2004.07.12 termex
(中文版)インストール手順中の、「重要度計算」アイコンの移動についての記述に手違いがあり、修正しました。
また、上記ドキュメントの修正に合わせて、termex
(中文版)をバージョン 0.21 にアップしました。
- 2004.07.10
termex及びtermmiのインストール手順中の、「重要度計算」アイコンの移動についての記述に手違いがあり、修正しました。
また、上記ドキュメントの修正に合わせて、termexをバージョン
2.45 にtemmi を バージョン 0.26 にアップしました。
- 2004.07.01 平成16年度の利用統計(4月から6月まで)を掲載しました。
- 2004.06.23
「言選Web」で和文「カタカナ・漢字抽出方式」による専門用語抽出を選べるようにしました。
また、TermExtractにも和文「カタカナ・漢字抽出方式」を追加し、バージョンを2.42にあげました
- 2004.06.16 「言選Web」の入力データにASCIIの制御文字が含まれていた場合に正しく動作しない不具合を修正しました
- 2004.04.01 当システムの利用統計を掲載しました
- 2004.03.09 中文版「言選Web」、中文版termexを公開しました。
また、TermExtractも中文に対応しバージョンが
2.37 になりました。
(中文版「言選Web」には別バージョンのICTCLAS版もあります。)
- 2004.02.23 「言選Web」の処理結果に「重要度」の数値を表示するオプションを追加しました。
- 2004.01.15 当システムをメタデータ入力補助につかった
東京大学経済学部図書館サブジェクトゲートウエイサービス"Engel"(東京大学内限定)
が公開されました。
- 2004.01.13 zip形式のTermExtract ver 2.06
で学習機能をOFFにした際に出るワーニングを抑止しました。また、英文ストップワード方式のドキュメントを修正しました。
- 2003.10.31 当システムの関連文献リストを掲載しました
- 2003.10.19 termmi において処理するフォルダ名に2バイト目が0x5Cの文字を含む場合に動作しない不具合を対策しました
修正版のtermmi ver
0.25をお使いください
- 2003.10.14 termmi ver 0.23におけるsummry,
uniqueの結果が出力されない不具合を修正しました。
- 2003.10.09 Windows用テキストマイニングツール"termmi"を公開しました。
トップページに戻る