OpenAIは2024年12月、12日間にわたるライブストリーミングイベント「12Days of OpenAI」を開催し、その中で新技術を次々と発表しています。
ここでは、最新情報を整理し、それぞれの機能と利用方法、そして実際の業務でどのように活用できるかを解説していきます。
第一弾:ChatGPT Proの発表
第一弾では、ChatGPTの新しいサブスクリプションプランを発表。
新たに登場した「ChatGPT Pro」プランは月額200ドル。
ChatGPT Proについて
ChatGPTは、個人利用を中心に多くのユーザーに親しまれてきましたが、OpenAIが月額200ドルで提供する「ChatGPT Pro」の登場により、企業や専門家向けの強力なツールへと進化を遂げています。
Proバージョンでは、応答速度の向上、より複雑な質問への対応、そして高度な推論能力の強化など、性能が大幅にアップしました。
また、カスタム命令の保存や、より長い文章の処理など、専門的な作業に特化した機能も追加されています。
OpenAI o1をはじめ、o1-mini、GPT-4o、Advanced Voiceなど、最先端のモデルへの無制限アクセスが提供されるため、研究者、エンジニア、そして高度なAI活用を目指す個人は、ChatGPT Proによって、革新的なアイデアを生み出し、複雑な問題を解決し、AI研究の最前線で活躍するための強力なツールを手に入れることができます。
新機能のポイント
速度の向上と安定性
ChatGPT Proでは、従来のo1とo1-previewに比べて、応答速度が大幅に向上しました。また、ピーク時のアクセス負荷にも対応できるよう、サーバー性能が強化されています。
複数のプラグインに対応
ChatGPT Proでは、さまざまなプラグインを活用することができます。これにより、企業のニーズに合わせたカスタマイズが可能となり、例えばCRMツールやERPシステムと連携し、業務プロセスを自動化することができます。
4/4の信頼性
o1プロモードの主な強み(信頼性の向上)を強調するために、より厳格な評価設定を使用します。モデルは、1回だけではなく、4回の試行のうち4回で正解した場合にのみ問題を解決したと見なされます。
カスタム指示
ユーザーは、ChatGPT Proに対して細かな指示を設定できるようになりました。これにより、個別の業務に合わせた応答が得られ、例えば特定の顧客対応やデータ処理を自動化する際に、より正確な情報を提供できます。
料金
Proプランは月額200ドルで、PlusやTeam同様に年間契約はできません。
$200=30000円として、1か月を24日勤務として計算すると、日給は約1,250円になります。
この数字を見ると、特に人件費のコストとリスクを考えると、業種や業務内容によっては、人を雇うことの難しさが際立ちます。
- 経済的負担
人件費は、給与だけでなく、社会保険料や福利厚生、研修費用なども含まれます。
この合計コストが増えると、特に中小企業では大きな負担となることがあります。 - 育成リソースの必要性
雇用者を教育・訓練するには時間とコストがかかります。
その間、生産性が期待通りに上がらない可能性もあります。 - 退職リスク
新しく雇った人が短期間で退職してしまった場合、再び採用活動にリソースを費やさなければならないため、経済的および心理的な損失が大きいです。 - 業務の性質
短期的・断続的な業務や季節限定の仕事の場合、フルタイムで人を雇うより、フリーランスや外注を利用した方が効率的な場合があります。
企業はAIの導入に積極的な姿勢を取り始めています。
これは、AIが企業の競争力強化に不可欠であるとの認識が広まっていることを示唆しています。
OpenAIのサラ・フライアーCFOは、AIが企業の生産性向上や業務効率化に大きく貢献し、高付加価値を生み出すことから、月額2000ドルという定額制サービスの価格設定は妥当だという考えです。
実際、博士号レベルの専門家と同等のサポートをAIが提供できることを考えると、この価格設定は決して高すぎるものではないかもしれません。
第二弾:強化学習ファインチューニング研究プログラム
第二弾では、「強化学習ファインチューニング研究プログラム」を発表。
この研究プログラムに参加者募集、複雑なタスクを抱える研究者、大学、企業に応募を呼びかけ。
強化学習ファインチューニングとは何か
強化学習ファインチューニング(RFT)は、既存のAIモデルを特定のニーズに合わせて強化するOpenAIが開発した新しいモデルカスタマイズ手法です。
RFTの基本的な仕組みは、モデルに問題を解かせ、その最終的な回答を評価し、正しい回答につながった思考プロセスを強化し、間違った回答につながった思考プロセスを抑制することで機能します。
正しい答えを導き出すためのプロセスを強化し、誤った答えを避ける方向にモデルの調整を行います。
わずか数十個の例で、モデルは新しい方法で効果的に推論できるようになります。
強化学習ファインチューニングの手法とプロセス
- トレーニングデータの準備
必要な例を含むJSONL形式のデータセットを作成します。このデータには、モデルに解いてほしい問題と、その正解が含まれます。 - グレーダーの設計
グレーダーは、モデルの出力を評価しスコアを返す役割を担います。0~1のスコア範囲でモデルのパフォーマンスを定量化することができます。 - RFTジョブの実行
OpenAIのプラットフォームにデータセットとグレーダーをアップロードすると、RFTが開始されます。このジョブでは、強化学習アルゴリズムと分散型トレーニング技術を活用し、モデルのパフォーマンスを最適化します。
この一連の手法は、専門家が直面する複雑な課題にも対応できるよう設計されています。
強化学習ファインチューニングの利点と課題
- 少ないデータで高精度の学習が可能
数十例のデータでもモデルのカスタマイズが可能。 - 汎用性が高い
医療、製造業、金融など幅広い分野で応用可能。 - モデルの推論能力を向上
特定のタスクにおける専門的な判断が可能になる。
- 時間とコストの問題
トレーニングには計算リソースが必要。 - ハイパーパラメータの調整が必要
最適な結果を得るためには専門知識が求められる。
専門家の参加を歓迎
OpenAIは、アルファ版のReinforcement Fine-Tuning APIへのアクセス権を付与する、研究機関、大学、企業、特に専門家主導のタスクを扱う組織からの応募を募集しています。
条件として、ドメイン固有のタスクでこの手法をテストし、APIの改善に役立つフィードバックを提供することが求められます。
第三弾:SoraTurbo発表と動画生成AI[Sora]一般公開開始
生成AIを次のレベルへと引き上げる新たな技術として「SoraTurbo」がリリースされました。
Sora Turboとは?
「Sora Turbo」は、AIを活用して短時間で高品質な動画を生成する最新技術です。
テキスト、画像、ビデオを入力するだけで、個々のクリエイティブなアイデアを具現化する動画を作成できます。
最大1080pの解像度、縦横比の選択、20秒間の動画など、多彩な機能を備えています。
さらに、専用の新しいインターフェースにより、ストーリーボードツールを用いてフレーム単位での詳細な設定が可能になり、初心者でも直感的に操作できます。
この技術により、従来専門的な編集スキルが必要だった動画制作が、より身近なものとなりました。
Soraは、様々な長さや解像度の動画を生成でき、再カット、ストーリーボード作成、ループなどの多様な編集機能を備えています。ただし、複雑なシーンやキャラクターを含む動画の生成にはまだ制限があります。
ChatGPT PlusとProの違い
「Sora Turbo」は、ChatGPTのサブスクリプションプランで利用可能です。
ChatGPT Plus(月額20ドル)
・利用可能な機能
>5秒間のショート動画作成
>480p or 720pの解像度
>最大50本の優先動画生成(1,000クレジット)
ChatGPT Pro(月額200ドル)
・利用可能な機能
>20秒の動画生成と透かしなしでのダウンロード
>480p、720p、1080pの解像度
>16:9、1:1、9:16のアスペクト比率
>生成バリエーション5つ同時生成
>最大500本の優先動画生成(10,000クレジット)
Sora Turboのセキュリティと透明性
「Sora Turbo」は、高度な生成技術でありながら、セキュリティと透明性にも注力しています。
- C2PA対応メタデータ
すべての生成動画に出所確認可能なメタデータを付与。 - 透かし機能
不正使用を防ぐため、目に見える透かしがデフォルト設定。 - 有害コンテンツ対策
児童性的虐待やディープフェイクなどの不正用途を厳格にブロック。
禁止コンテンツ (性的コンテンツやエロティック コンテンツ、暴力や残虐行為、自傷行為、違法コンテンツ、誤報や偽情報など)
※C2PAとは、コンテンツの出所と信頼性に関する連合(発行者、作成者、消費者にさまざまな種類のメディアの起源を追跡する機能を提供するオープンな技術標準)
関連記事:動画生成AI「Sora」とは?Adobe Premiere Proとの連携→
第四弾:ChatGPT[Canvas]機能を全ユーザーに解放
有料プラン利用者向けに提供されていた「Canvasβ版」を、無料ユーザーを含む全ユーザーに公開。
Canvasは、会話をしながら執筆やコーディングを共同で構築していく機能です。
書く、作る、コードを書く、全てをAIと!Canvasで実現する超効率なワークフロー
ChatGPT Canvas(キャンバス)とは?
ChatGPT Canvas機能は、ユーザーがChatGPTと協力しながら、ライティングやコーディングを行うことを可能にし、さらにそのクオリティを向上させるための強力なツールです。
ユーザーはテキストやコードを視覚的に整理しながら、よりスムーズに作業を進めることができます。
- テキスト作成と編集
エッセイやストーリー、記事の構成を視覚的に整理。 - コードのデバッグと生成
プログラムの動作確認や改良が簡単に。 - 画像生成
簡単なプロンプトでアイデアを視覚化。
第五弾:ChatGPTがApple製品に!Siriとの連携で生まれる新しい体験
「ChatGPT in Apple Intelligence」ChatGPTがアカウントなしでApple製品で利用可能になりました。
今回の発表で注目されたのは、SiriとChatGPTの統合です。
この新機能により、ユーザーはSiriを介して直接ChatGPTを利用することが可能になりました。Siriは、音声アシスタント(バーチャルアシスタントアプリ)です。
Apple Intelligenceとは?
Apple Intelligenceは、iPhone、iPad、MacといったAppleデバイスに最適化されたAI(人工知能プラットフォーム)です。Siriを含む、Apple製品全体に組み込まれている人工知能技術の総称。
特に、iPhone16シリーズやA17Pro以降のチップを搭載したデバイスに対応しており、性能とセキュリティを両立したAI体験を提供します。
この仕組みは、デバイス内での処理を最大化しながら、必要に応じてクラウド上のChatGPTに接続するハイブリッドアプローチを採用しています。
現時点では、日本語での利用は2025年からが予定されていますが、デバイスと言語設定を「英語(米国)」に変更すれば、日本国内でも機能を試すことが可能です。
使用方法
- OSアップデート
同日に発表された「iOS 18.2」以降にアップデート。 - Apple Intelligenceを有効にする
iPhoneの設定からApple Intelligenceをオンにします。 - ChatGPTを有効化
Apple Intelligenceの設定内でChatGPTを有効にします。
Camera Controlで画像解析が可能に
iPhone 16、iPhone 16 Plus、iPhone 16 Pro、iPhone 16 Pro Maxのカメラコントロールでは、iPhoneカメラを素早く開いて、よく使うカメラ設定にアクセスすることができます。
カメラコントロールの位置は下図の通りです。
ビジュアルインテリジェンス機能
iPhone 16/16 Proシリーズに搭載された「ビジュアルインテリジェンス」機能は、カメラ(カメラコントロールボタン)で撮影した画像や動画の内容を、AIがリアルタイムで分析し、様々な情報を提供してくれる機能です。
- Apple Intelligenceを有効にする
iPhoneの設定からApple Intelligenceをオンにします。 - ChatGPTを有効化
Apple Intelligenceの設定内でChatGPTを有効にします。 - Siriに依頼
Siriにタスクを伝え、ChatGPTに委譲する仕組みを活用します。
ビジュアルインテリジェンスの活用例
- ファッションチェック
着ている服のブランドや似合うアクセサリーなどを提案してもらえます。
【動画では、プロダクト担当のMiqdad Jaffer氏が、実験的にChatGPTにクリスマスセーターコンテストの審査を依頼しました。ChatGPTは、参加者たちの画像を分析し、サム・アルトマン氏のセーターを最も独創的で魅力的と判断、優勝と発表しました。
この結果に、アルトマン氏自身も驚きを隠せず、「これはバグなのではないか」とユーモアたっぷりにコメントしました。】 - 料理レシピ検索
料理の写真を撮ると、その料理のレシピや似たようなレシピを探してくれます。 - 観光地情報
観光地の写真を撮ると、その場所の歴史や周辺の観光スポットを教えてくれます。 - 言語翻訳
外国語の看板などを撮影すると、その言葉の意味を翻訳してくれます。 - 商品検索
商品の写真を撮ると、その商品がどこで売られているか、あるいは似たような商品を探してくれます。
Writing Toolによる高度な文章作成
Writing Toolは、ChatGPTの能力を取り入れることで、文章校正や要約だけでなく、ゼロからの文章作成も可能にしました。
- Writing Toolを起動
メモアプリや対応アプリ内でWriting Toolを開きます。 - ChatGPTを活用
入力欄にリクエストを記載し、ChatGPTから提案を受け取ります。
具体例:プレゼン資料作成
プレゼン資料の原稿を作成する際、Writing Toolを使用して「市場分析に基づいたレポートを作成して」と依頼すると、ChatGPTが適切な文章を生成します。
これにより、資料作成の時間を大幅に削減できるため、効率的に業務を進めることができます。
第六弾:ChatGPTとビデオ通話できる(Advanced voice with video)
音声機能「Advanced Voice Mode」に、期間限定でホホホボイス「Santa」を追加。サンタクロースの陽気な音声で、日常会話やメッセージがより楽しいく。
ライブ映像を通じてAIと自然な会話が可能な「Advanced voice with video」を発表。プレゼン資料や作業画面を見せながら、AIからリアルタイムのアドバイスを受けられます。
アドバンスボイスモード(Advanced Voice Mode)とは?
アドバンスボイスモードは、音声とビデオの機能を組み合わせた新技術で、ChatGPTがリアルタイムで音声認識・応答を行うだけでなく、ビデオを通じて視覚的な要素を取り入れた対話を可能にするものです。
- リアルタイム応答
遅延のない即時の音声とテキスト応答。 - 視覚的フィードバック
AIが表情やジェスチャーを通じて情報を補完。 - 簡易操作
直感的なUIにより、設定や使用がスムーズ。
アドバンスボイスモードで選べる音声スタイル
ChatGPTのプリセット音声としてサンタの声が追加。12月中はサンタと会話楽しめます。
アドバンスボイスモードには、以下のような多彩な音声スタイルが用意されています。
それぞれの音声スタイルには独自の個性があり、利用シーンに合わせて選択可能です。
- Juniper
開放的で明るい声。親しみやすく、カジュアルなコミュニケーションに最適。 - Vale
聡明で雄弁なトーン。プロフェッショナルな場面や説得力を求める会話に適しています。 - 期間限定!サンタモード
ホリデーシーズン限定の楽しい声。サンタクロースの温かさを感じる特別な体験を提供します。 - Ember
自信に満ちた楽観的な声。モチベーションを高める会話や、ポジティブな対話にぴったりです。 - Spruce
穏やかで前向きなトーン。落ち着きと信頼感を与える声は、リラックスしたコミュニケーションに最適。 - Sol
抜け目なく、くつろいだスタイルの声。インフォーマルで親近感のある対話に向いています。 - Cove
落ち着いていて率直な声。信頼性を重視した会話に適した選択肢です。 - Breeze
生き生きとして誠実なトーン。エネルギッシュで明るい会話をサポートします。 - Arbor
のんびりとして器用な声。柔らかい印象を与え、リラックスした雰囲気を作ります。 - Maple
朗らかで素直な声。温かみのある会話を通じて、親密な関係を築くのに最適です。
関連記事:AIとの会話がもっと身近に!ネイティブ英語学習も!→
アドバンスボイス&ビデオ(Advanced voice with video)とは?
「Advanced voice with video」は、ChatGPTが音声と映像を同時に処理できる機能です。
ユーザーは画面共有やライブ映像を通じてAIと対話することが可能になります。
- リアルタイム分析
映像と音声を同時に解析し、AIと自然な会話が可能。 - 画面共有への対応
プレゼン資料や操作画面を共有しながら、AIのアドバイスを受けられる。 - 簡単な動画撮影機能
チャット画面で簡単に動画を撮影でき、会話を記録したり、AIと相談やアドバイスしてもらうなど会話が可能。 - 多言語対応
多言語での音声認識と応答が可能で、国際的な利用にも適しています。
画面共有機能を使用してコーヒーの淹れ方をアドバイスしてもらう
ChatGPTは、アドバンスボイスモードにおいて、会話中にリアルタイムでユーザーの反応を認識し、まるで人間とビデオ通話をしているかのように自然な対話が可能になりました。
まとめ
「12 Days of OpenAI」シリーズの第6弾までの内容をまとめると、OpenAIが展開するさまざまなイノベーションや技術について、これまでに紹介してきた重要なポイントが浮き彫りになりました。
第6弾では、AI技術がさらに進化し、実際のビジネスや日常生活でどのように役立つのかに焦点を当てました。
これらの技術は、単なる理論にとどまらず、現実世界において価値を発揮する力を持っています。
各日ごとの解説では、OpenAIの最新の研究成果やツール、アプリケーションが具体的に紹介され、読者にとって身近で有益な情報が多く含まれていました。
これらの技術がビジネスや社会に与える影響、そして今後どのように発展していくのかを深く理解することができました。
第6弾までの内容を通じて、OpenAIの取り組みがますます多岐にわたり、AIの活用が今後さらに広がっていくことが予想されます。
クリスマスには大きなプレゼントが届く予感でワクワクしますね。
これからの残りの内容も注目し、OpenAIがどのような新しい可能性を提示してくれるのか、引き続き見守りましょう。