UTXチーム全体による業績
2011年、UTXチーム(アジア太平洋機械翻訳協会 機械翻訳課題調査委員会ワーキング グループ3)は、第6回AAMT長尾賞(機械翻訳システムの実用化の促進および実用化のための研究開発に貢献した個人あるいはグループを表彰する)を受賞。受賞理由「翻訳支援のためのシンプルでオープンな辞書仕様UTXを開発、公開し、機械翻訳精度の向上ばかりでなく、辞書のinteroperabilityおよび翻訳支援へも有効な手段を広く提供している。今後、ローカライゼーション、オープンソース、教育、行政、医療、法律などのさまざまな分野で活用が期待されるとともに、国際標準となる素地を備えている点で高く評価できる。」
UTXチームの対外活動
2010年、法律と医学分野でUTX形式の英日・日英対訳辞書(それぞれ5451語、27126語)を作成して無償で一般公開した。
翻訳業界との連携として、2011年以降、JTF(日本翻訳連盟)翻訳祭にAAMTとして継続的に出展している。
UTXチーム各メンバーによる論文(国際学会・査読付き)
- Francis Bond et al. (2009) "Sharing User Dictionaries Across Multiple Systems with UTX-S" (PDF) in Second International Workshop on Intercultural Collaboration (IWIC2009), Stanford (UTX形式および他形式間の基本的な変換スクリプトを作成し、わずかな語数のUTX辞書でも翻訳精度を改善できることを示した)
- Seiji Okura et al. (2011) "UTX 1.11, a Simple and Open User Dictionary/Terminology Standard, and its Effectiveness with Multiple MT Systems" (PDF) in MT Summit 2011 (アモイ)
UTXチーム各メンバーによるその他の論文・ワークショップ発表・雑誌掲載
- 大倉清司他(2008)「共有ユーザー辞書仕様UTXの現状と今後の展開」言語処理学会第14回年次大会(東京)
- 大倉清司、2009年11月、LISA China Focusで発表 (北京)
- 山本ゆうじ、2011年2月、LISA Open Standards Summitで発表(ボストン)
- 大倉清司(2011)「翻訳支援のためのシンプルでオープンな辞書仕様UTX-Simple 1.10」(PDF)言語処理学会第17回年次大会(東京)
- Yamamoto Yuji, "How to create glossaries in UTX," MultiLingual (June 2011)
- 山本ゆうじ(2012)「実務日本語とUTXから特許明細書の改善を考える」(PDF)、『Japio Year Book 2012』
- Yamamoto Yuji (2013) "UTX (universal terminology eXchange): a simple terminology format," "GALAxy Newsletter"
- 山本ゆうじ(2013)「日本語文章の課題と前編集手法―用語集形式UTX と実務日本語の観点から」(PDF)、『Japio Year Book 2013』
- 山本ゆうじ(2013)「シンプルな用語集形式UTXとその活用 ―ビッグ データと『グッド データ』のいい関係」、集合知シンポジウム
- 山本ゆうじ(2014)「用語集形式UTXの現況と実務日本語・百半ルール――実際的な用語集と表記規則を実現するには」(PDF)、『Japio Year Book 2014』
- Yamamoto Yuji (2015) "UTX, a simple glossary format"、ISO/TC37松江国際会議(2015年6月)でのプレゼンテーション。
- Yamamoto Yuji (2015) "UTX: a simple standardized glossary format" 第15回日中自然言語処理共同研究促進会議、2015年10月(青森)
- 山本ゆうじ(2015)「UTXと、用語管理、翻訳品質、および標準化の関連性―ISO/TC37松江国際会議に参加して」(PDF)、『Japio Year Book 2015』
- 山本ゆうじ(2016)「用語データを共有・再利用するための用語集形式の標準規格UTX」言語処理学会第22回年次大会(仙台)
- 山本ゆうじ(2016)「体系的翻訳・文書品質管理での高品質言語資産としてのUTX用語集形式」情報処理学会研究報告、ドキュメントコミュニケーション研究会
- 山本ゆうじ(2017)「Win-Winの機械翻訳最新活用―ニューラル機械翻訳をUTX用語データでポストエディットする方法」STC東京特別セミナー
- 山本ゆうじ(2017)「ニューラルMTを構造化用語データUTXで補完して翻訳品質を改善する簡便なポスト エディット手法」言語処理学会第23回年次大会(つくば)
UTXの採用事例
UTX形式は、特許庁での機械翻訳に関する調査での辞書形式として採用されている。2013年の報告書では、約80万語の中日対訳辞書データが作成され、特に複合名詞の翻訳精度に大きな向上が認められたとある。さらに、この対訳辞書データとその他のデータに基づき、2014年には、約100万語の中日対訳辞書データが作成された。2015年には、約220万語の中日対訳辞書データが作成され、研究向けにALAGIN言語資源・音声資源サイトで無償公開された。
- 「平成24年度 中国特許文献の機械翻訳のための中日辞書整備及び機械翻訳性能向上に関する調査」調査報告書 概要版(特許庁、2013年3月)
- 「平成25年度 中国特許文献の機械翻訳のための新語に関する調査」調査報告書(一般財団法人 日本特許情報機構、2014年2月)
- JPO(日本国特許庁)中日対訳辞書(ALAGIN言語資源・音声資源サイト、2015年5月)
- 「平成26年度 中国特許文献の機械翻訳のための辞書整備及び機械翻訳の品質評価に関する調査 報告書」(一般財団法人 日本特許情報機構、2015年3月)上記中日対訳辞書の具体的な形式と作成方法の説明を含む。
国内・海外の有志により、さまざまなUTX変換ツールが作成され、公開されている。