Facebookは最近、NMT (Neural Machine Translation) の世界展開を発表した。2,000以上の翻訳方向と1日45億の翻訳が、フレーズベースの翻訳モデルからNMTに切り替わる。Facebookによると、今回の切り替えによって、よく知られた翻訳スコアであるBLEU スコアは11%上がるという。
ブログ記事を書いたエンジニア、Juan Miguel Pino氏、Alexander Sidorov氏、Necip Fazil Ayan氏によると、Facebookが今年初めにオープンソース化した機械学習フレームワークCaffe2を用いて、パフォーマンスを2.5倍に向上させたという。
この翻訳品質レベルを達成する上でキーとなったのは、アテンション付きのSequence-to-Sequence LSTM (long short-term memory) として知られるリカレントニューラルネットワークの使用だった。この種のシステムは、より精度の高い翻訳を生成するために、原文とその前にある全てのコンテキストを考慮する。これによって距離の離れた並び替えが可能になる。これは特に、英語からトルコ語、英語からギリシア語といった翻訳ペアで見られる問題を解決する。
LSTMのアテンションメカニズムは、トレーニングデータから構築されたバイリンガル辞書へのソフト翻訳アライメントにより、翻訳中の未知語の扱いにも役に立つ。語彙を削減することで、翻訳品質に大きな影響を与えることなく、計算時間を大幅に短縮した。
FBLearner Flowフレームワークを利用することで、2,000翻訳ペアのパラメータを素早く正確に微調整できたという。これだけで、英語-スペイン語の翻訳ペアにおいて、BLEUスコアは3.7%向上した。
このプロジェクトの一環として、FacebookはCaffe2にリカレントニューラルネットワークを寄贈してオープンソース化した。FacebookのArtificial Intelligence Research (FAIR) チームは、機械翻訳に畳み込みニューラルネットワーク (CNN)を使った研究も公表している。
今回のFacebookの発表は、2016年のGoogle翻訳へのNMT発表から遅れること数ヶ月、GoogleのMultimodel Neural Network発表から1ヶ月足らずだった。
Rate this Article
- Editor Review
- Chief Editor Action