OpenAIは、音声による入力、有料ユーザーのGPT-4対応、レスポンスの高速化などを実現したChatGPT公式アプリを 米国のApp Store で公開した。同社は、近日中に他の国への展開を開始し、Android版も作成中であると述べている。
OpenAIによれば、iOSアプリの提供開始は、自社の技術をより多くのユーザーに利用してもらうという目的に応えるものだという。副次的な効果として、ここ数ヶ月で多くのChatGPTクライアントがリリースされており、そのうちのいくつかは7桁の収益を上げていると言われているApp Storeの状況をOpenAIが沈静化できるだろう。TwitterユーザーのAndrey Zagoruyko氏が指摘するように、これらのアプリがすべて利益を上げているとは限らないが、ChatGPTが一般消費者の間で大きな関心を集めていることを明確に示唆している。
Hacker Newsでは、このアプリがOpenAIのウェブサイトをWebビューで表示しただけのものに過ぎないと指摘するコメントもあるが、チャット履歴やデバイス間のチャット同期、音声入力など、ユーザー体験を向上させるいくつかの特徴的な機能を備えている。このことから、このアプリはWebViewラッパーではなく、実際にはAPIベースであると考えられる。
音声入力は、OpenAI Whisperを利用している。OpenAI Whisperは、16億個のパラメータを持つAIモデルで、97の異なる言語の音声を書き起こし、翻訳ができる。OpenAI Whisperはオープンソースで、ソースコードと学習済みモデルファイルの両方がGitHubで公開されている。OpenAI WhisperはAPIを通じて利用できるが、OpenAI ChatGPTアプリは応答性の向上のためにネイティブに統合しているようだ。
これは、モバイルアプリの解析ツールを多数提供するEmerge Toolsが実施した「ティアダウン」解析によって確認された。解析の結果、アプリのバイナリは41MBを占め、そのうち半分近くはデバッグ用のシンボルであり、実装がまだ「実験的」であることが証明された。このアプリには、分析用のMixPanel、ロギング用のDataDog、パフォーマンス監視用の[Sentry(https://sentry.io)]など、多くの依存関係がある。
チャット履歴については、OpenAIは前回のアップデートで、チャットをデバイスに非公開にすることを主な利点として、これを無効にする機能を提供した。チャット履歴が有効になっている場合、OpenAIはモデルの改良のためにそれを利用しする。しかし、チャット履歴を無効にした場合、チャットは30日間しか保存されない。
前述の通り、このアプリは現在、米国を拠点とするiOSユーザーにのみ提供されているが、数週間以内に他の国にも提供されるとOpenAIは述べており、Android版も近々リリースされる予定である。