GPT-4oで音声アシスタント会話機能を使う方法【ほとんど人間】

GPT-4oの有料版では音声を介したアシスタント機能が実装されており、現在スマホアプリ版で使用することができます。

今回はこの会話機能について初心者向けに解説していきます。

関連記事：GPT-4oならコーディングも簡単？スクリーンショットで試してみた→

会話機能へのアクセス
会話機能のデモと感想
会話機能の注意点
1. 周りの音声を拾ってしまう
2. 他の機能と併用できない

会話機能へのアクセス

会話機能を使うにはまず手持ちのスマホにChatGPTの純正アプリをインストールします。また、有料版を使用している必要があります。

わかりづらいですが、発行元が「OpenAI」になっているのが純正のアプリです。

偽装をすることはできませんが、非常に似ているアプリは多数登場していますので、まず偽物と間違えないようにアクセスしてください。

例えば「ChatGPT ○○」のような名称は偽物である可能性が高いです。

‎ChatGPT

‎iOS 版 ChatGPT のご紹介: OpenAI の最新技術をあなたの手元に。この公式アプリは無料で、ユーザーの履歴をデバイス間で同期し、画像生成機能を含む OpenAI の最新機能を提供します。いつでも使える ChatGPT が...

ChatGPT - Apps on Google Play

The official app by OpenAI

現在アクセスしている、ChatGPTのユーザーでログインします。

GoogleIDなどであれば自動連係もできます。

新規であれば画面説明に沿ってユーザーIDを取得しましょう。

有料ユーザー状態でログインしたら、まず現在のGPTの設定を確認します。上部のモデル名をタップすると、写真のように複数のGPTモデルが選択できますので一番上にあるGPT-4oを選択します。

次に右下のヘッドホンマークをタップします。

これが、GPTと双方向にやり取りができるモードです。

ちなみに隣のマイクは音声入力モードになります。

タップすると準備に入ります。ロードに少々時間が掛かります。

また、電波状況などが悪い場合は上記の様にリクエストエラーを起こしてしまいます。

スタンバイOKな状態になるとしゃべったことがそのまま反映されます。

会話機能は5つの音声から対話を選べます。

また、レスポンス速度は数秒で、人間と遜色なくしゃべることができ、抑揚の強弱も存在するなど、かなりヒューマノイドの実現に近づいてきたと確信させる出来になっています。

さらに、会話した内容はそのままスレッドに記録されている為、あとから読み返すこともできます。

恐らくですがこうした地域情報は裏で検索を書けたうえで解凍を生成しているのでしょう。

しかし、タイムラグが驚くほど少ないので実際に使ってみるとかなりびっくりします。

会話機能のデモと感想

会話機能についてはOpenAIも宣伝にかなり力を入れていて、以下の様なデモムービーを公開しています。

Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN

Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) May 13, 2024