BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Microsoft Translatorが100を超える言語と方言をサポート

Microsoft Translatorが100を超える言語と方言をサポート

ブックマーク

原文(投稿日:2021/10/20)へのリンク

Microsoft Translatorは、Azure上の人工知能(AI)を利用したテキスト翻訳サービスだ。コグニティブサービスの一部である。最近、同社は12の新しい言語と方言がサービスに追加されたことを発表した。これは、100を超える言語と方言の間で翻訳できるようになった。

20年以上前、Microsoftは機械翻訳プロジェクトを開始した。2002年、Microsoft AI and Researchで幅広い音声および言語グループの一部として機械翻訳グループが結成された。その目的は、言語の壁を取り除き、書き言葉と話し言葉のグローバルなコミュニケーションを可能とすることだ。これらは、AzureのTranslate AI Serviceなど、2006年以降さまざまなMicrosoft製品で使われているMicrosoft Translator APIで動作する。

Translatorは、統計的機械翻訳(SMT)モデルを活用することで、英語、中国語、ヒンディー語、アラビア語、スペイン語など、ほとんどの話し言葉を早い段階でカバーしている。AIがさらに進化し始めたときに、同社はニューラル機械翻訳(NMT)を採用し、言語ライブラリをさらに拡大した。そして今、翻訳言語の新しいリリースで、8460万人が話すバシキール語、ディベヒ語、グルジア語、キルギス語、マケドニア語、モンゴル語(キリル文字)、モンゴル語(伝統的)、タタール語、チベット語、トルクメン語、ウイグル語、ウズベク語(ラテン語)が追加された。さらに、光学式文字認識(OCR)機能では、同じAIモデルが利用されている。したがって、書かれたテキストはすべて取り込まれ、サポートされている言語に翻訳される。


出典: https://blogs.microsoft.com/ai/microsoft-translator-100-language-milestone/

Translateのアップグレードの背後にあるテクノロジーは、Zコードと呼ばれるMicrosoftの多言語AIモデルだ。これは、AIモデルを組み合わせるMicrosoftのよりより大きなXYZコードイニシアチブの一部である。これは、言語族に基づいた複数の言語を組み合わせるものであり、これによって、モデルが互いに学習可能となる。さらに、類似した言語間で言語要素の共有と転移学習によって、適切な翻訳に必要なデータ量が大幅に削減されるため、プロセスがより速く、より正確になる。

100を超える言語のサポートを提供する翻訳サービスを提供しているパブリッククラウドプロバイダーは、Microsoftだけではない。Google Translateは2016年2月に最初にそのマイルストーンに到達した。一方で、AWSはAmazon Translateで71言語のみをサポートする。

最近のMicrosoft AIブログの投稿で、MicrosoftテクニカルフェローでAzure AIの最高技術責任者であるXuedong Huang氏は次のように述べている。

100の言語は、自身が話す言語に関係なく、すべての人がコミュニケーションできるという志を達成するための良いマイルストーンです。

そして、

私たちは翻訳で、100の言語に到達したことだけでなく、スピーチやOCRに対しても賞賛したい。言語の壁を取り除きたいのです。

同社は、このサービスにより、世界中の56.6億人(世界人口の72%)が母国語として話す言語の間でテキストやドキュメントを翻訳できるようになったと主張している。

Microsoft Translatorの可用性と価格の詳細は、価格ページで確認できる。さらに、サービスの詳細とガイダンスは、ドキュメントのランディングページで確認できる。

この記事に星をつける

おすすめ度
スタイル

特集コンテンツ一覧

.NETエコシステムの紹介

David Pine 2019年11月7日 午後7時48分

こんにちは

コメントするには InfoQアカウントの登録 または が必要です。InfoQ に登録するとさまざまなことができます。

アカウント登録をしてInfoQをお楽しみください。

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

コミュニティコメント

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

BT