GPT-4oの有料版では音声を介したアシスタント機能が実装されており、現在スマホアプリ版で使用することができます。
今回はこの会話機能について初心者向けに解説していきます。
関連記事:GPT-4oとは? GPT-4を超える基本無料モデルの利点と発表内容→
関連記事:GPT-4oならコーディングも簡単? スクリーンショットで試してみた→
会話機能へのアクセス
会話機能を使うにはまず手持ちのスマホにChatGPTの純正アプリをインストールします。また、有料版を使用している必要があります。
わかりづらいですが、発行元が「OpenAI」になっているのが純正のアプリです。
偽装をすることはできませんが、非常に似ているアプリは多数登場していますので、まず偽物と間違えないようにアクセスしてください。
例えば「ChatGPT ○○」のような名称は偽物である可能性が高いです。
現在アクセスしている、ChatGPTのユーザーでログインします。
GoogleIDなどであれば自動連係もできます。
新規であれば画面説明に沿ってユーザーIDを取得しましょう。
有料ユーザー状態でログインしたら、まず現在のGPTの設定を確認します。上部のモデル名をタップすると、写真のように複数のGPTモデルが選択できますので一番上にあるGPT-4oを選択します。
次に右下のヘッドホンマークをタップします。
これが、GPTと双方向にやり取りができるモードです。
ちなみに隣のマイクは音声入力モードになります。
タップすると準備に入ります。ロードに少々時間が掛かります。
また、電波状況などが悪い場合は上記の様にリクエストエラーを起こしてしまいます。
スタンバイOKな状態になるとしゃべったことがそのまま反映されます。
会話機能は5つの音声から対話を選べます。
また、レスポンス速度は数秒で、人間と遜色なくしゃべることができ、抑揚の強弱も存在するなど、かなりヒューマノイドの実現に近づいてきたと確信させる出来になっています。
さらに、会話した内容はそのままスレッドに記録されている為、あとから読み返すこともできます。
恐らくですがこうした地域情報は裏で検索を書けたうえで解凍を生成しているのでしょう。
しかし、タイムラグが驚くほど少ないので実際に使ってみるとかなりびっくりします。
会話機能のデモと感想
会話機能についてはOpenAIも宣伝にかなり力を入れていて、以下の様なデモムービーを公開しています。
GPTがカメラを通じて話しているのがわかります。
このデモは関連ツリーで数本投稿されており、かなり見ごたえのあるものとなっています。
会話機能の注意点
会話機能の注意点としては以下の様なことが挙げられます。
周りの音声を拾ってしまう
最近のスマートフォンのマイクはかなり性能がよく、感度もある為結構多くの音を拾ってしまいます。
音声自体は混ざらないものの、一部の問いかけが消えてしまったりする可能性があるので、できるだけ静かな場所で実行することが求められます。
また、音声の拾い方については端末ごとの影響も考えられます。
他の機能と併用できない
音声アシスタント中は基本的にチャット画面が見れず。画像を添付するなどの機能と併用できません。
もちろん中断して画像を張り付けるなどはできますが、声で指示を出しつつ、横断した仕事もしてもらうというのはなかなか難しいのでこれはアップデートを待つことになるでしょう。
ある程度気を付ければ簡単に使用できますし、話し相手として非常に優秀なので、有料版を使用している人はぜひすぐに試してみてください。