|
バックナンバー > 本文
2001年9月18日
ユーザが協力してネットで育てる機械翻訳システムを開発
〜MT Summit VIIIで論文発表、 翻訳ポータルサイト「訳してねっと」をネット上でデモ実演〜
沖電気工業株式会社(社長 篠塚勝正)は、ネットユーザの協調作業により翻訳精度を向上させるWebサイト型の機械翻訳システムを開発し、今週スペイン・サンチアゴで行なわれる MT Summit VIII(機械翻訳サミットVIII)に論文発表を行ないます。
またMT Summit VIIIへの論文発表に合わせて、9月18日から翻訳ポータルサイト「訳してねっと」のデモ実演をインターネット上(http://yakushite.net/)で公開いたします。本サイトでは今後も、トップページにおいて開発状況を順次公開していくとともに、本システムの検証と精度向上を目的として、大学等の限定ユーザによる実験を行っていきます。
Web上のさまざまな分野の情報に対して、機械翻訳システムが精度良く翻訳するためには、翻訳する分野に応じた辞書の増強、および恒常的な辞書の管理が不可欠になります。従来のWeb上の機械翻訳サービスでは、翻訳サービス会社やユーザ個人が辞書の増強及び管理を行なっているため、管理できる分野には限界があり、きめ細かい辞書作成サービスが行なえないのが現状でした。
一方、インターネット上では、翻訳のプロではない各技術の専門家がネット上で仲間を募り、翻訳作業を協力して行っています。
本システムでは、インターネット上でのユーザの協調作業という点に着目し、辞書の作成・管理を翻訳する分野単位に行ない、その分野に精通したユーザが辞書登録することで、それぞれの分野において精度の高い辞書を作成することを可能にしました。
さらに、訳語が付与されていない用語を公開し他のユーザに辞書登録してもらう等、辞書と翻訳結果の仲間同士での共有・修正・発信を可能としたことで、ユーザが協力して翻訳精度を向上させ、あらゆる分野で適切な訳文を得ることを可能にしました。
このように本システムはネットユーザの協調作業を前提とした、新しいタイプのWebサイト型の機械翻訳システムです。
なお、本システムの翻訳エンジンは、100% JavaTMで記述されており、部品として再利用可能で、改良、応用が容易です。さらに、翻訳方式として、パターンベース方式を採用しているため、ユーザによるパターン作成や、各分野に特有の言い回しや表現方法に関する文法知識の登録が出来、簡単に翻訳結果に反映することができます。
- 本システムの主な特徴
- 本システムは、従来の検索ポータルサイトに見られるツリー型のディレクトリ構造を持っています。各ディレクトリは、さまざまな分野に対応しますが、この分野の単位(1つのディレクトリ)をコミュニティと呼びます。ユーザは、コミュニティを自由に作成することができます。
- コミュニティ単位で辞書を作成したり、翻訳結果を管理したりすることができます。
ユーザはコミュニティ辞書を作成することができるだけでなく、個人単位のユーザ辞書も作成することができます。
- 各コミュニティの管理は、コミュニティに参加するユーザが主導して行ないます。そのコミュニティを作成したコミュニティリーダが1人で管理したり、参加メンバ全員が自主的に管理することもできます。
- 機械翻訳結果を後修正した結果やコミュニティ内で作成した対訳用例を辞書として蓄積することができ、既に対訳が辞書登録されている場合は、その対訳を用いて翻訳します。
- その他、コミュニティのメンバが協調して翻訳するための便利な機能を数多く備えています。(例 専門用語抽出ツール、コミュニティ用語集)
- 機械翻訳の方式は、パターン翻訳方式です。このため、分野に特有な言い回しなど通常の辞書では記述できないような対訳表現も翻訳パターンとして登録し、それを機械翻訳の翻訳結果に反映させることが簡単です。
- システムの構成
本システムは以下の3つの機能から構成されています。(画面イメージ)
- 翻訳機能
URL翻訳、テキスト翻訳、ファイル翻訳の3種類の機械翻訳結果を得ることができます。なお、翻訳エンジンは、100% JavaTMで記述されており、部品として再利用可能で、改良・応用が容易です。さらに、翻訳方式として、パターンベース方式を採用しているため、ユーザによるパターン作成が容易で、このため、各分野に特有の言い回しや表現方法に関する文法知識も、簡単に機械翻訳システムに登録することが可能です。
- 辞書管理機能
辞書には、ユーザ単位で管理するユーザ辞書と、コミュニティ単位で管理するコミュニティ辞書があります。辞書の追加、検索、削除ができるだけでなく、テキストから専門用語を抽出する機能や、対訳用例を辞書として登録することもできます。
- コミュニティ機能
本システムはディレクトリ型のコミュニティにより構成されています。各コミュニティ内で、翻訳機能や辞書管理機能を利用するだけで、コミュニティ単位での辞書作成や、そのコミュニティの辞書を使った機械翻訳が可能です。その他、コミュニティ機能を支える便利なツールとして、バイリンガル掲示板(機械翻訳を用いてチャットを行う機能)、コミュニティ用語集(訳語が付与されていない用語をコミュニティに公開し、訳語を他人に登録してもらう機能)、翻訳機能付リンク集(各コミュニティに関連するURLおよびその翻訳結果へのリンク作成機能)があります。
- 用語解説
- JavaおよびすべてのJava関連の商標およびロゴは、米国およびその他の国における米国Sun Microsystems,Inc.の商標または登録商標です。
- 訳してねっとは現在登録商標申請中です。
- その他、記載されている会社名、商品名は一般に各社の商標または登録商標です。
本件に関するお問い合わせ先
広報部 電話:03-3580-8950
|