こちらの記事ではAIに関連する用語とその解説をジャンルごとに行っています。
随時更新されていきますので是非ご活用ください。
- 1.AIの基礎的な概念
- 2.機械学習:方法と応用
- 機械学習(Machine Learning)
- ディープラーニング(Deep Learning)
- ニューラルネットワーク(Neural Network)
- 教師あり学習(Supervised Learning)
- 教師なし学習(Unsupervised Learning)
- 強化学習(Reinforcement Learning)
- 過適合/オーバーフィッティング(Overfitting)
- クラスタリング(Clustering)
- 回帰分析(Regression Analysis)
- フィードフォワードニューラルネットワーク(Feedforward Neural Network)
- バックプロパゲーション(Backpropagation)
- ハイパーパラメータ(Hyperparameter)
- パラメータ
- 過学習(Overfitting)
- データサイエンス
- サポートベクターマシン(SVM)
- レコメンド(Recommend)
- 転移学習(Transfer Learning)
- 遺伝的アルゴリズム(Genetic Algorithm)
- 3.データ処理と分析
- 4.ソフトウェアとインターフェース
- ウェアラブルデバイス
- クラウドコンピューティング(Cloud Computing)
- エッジコンピューティング(Edge Computing)
- ゲートウェイ(Gateway)
- API(Application Programming Interface)
- コンピュータビジョン(Computer Vision)
- IoT(Internet of Things)
- GAN(Generative Adversarial Network)
- RPA(Robotic Process Automation)
- ロボティクス(Robotics)
- セマンティックウェブ(Semantic Web)
- エッジAI(Edge AI)
- クラウドAI
- 自動音声認識(ASR)
- 5.その他の関連用語
1.AIの基礎的な概念
人工知能(AI)
人工知能(AI)は、コンピュータが人間のような知的活動を行う技術です。
例えば、チェスの対局や天気予報の予測など、人間が行う複雑な判断を模倣します。コンピュータが問題を解決するためにルールやパターンを学ぶことで、AIは日々進化しています。
汎用人工知能(AGI:Artificial General Intelligence)
汎用人工知能(AGI:Artificial General Intelligence)とは、人間の様に多様かつ色々な思考を同時進行することを目的に開発されたAIの進化系です。
AGIは特定のタスクに特化した現在のAIと異なり、理解力、推論、学習、感情認識、意思決定など、人間の知能が持つ幅広い能力を模倣することを目指しています。
アルゴリズム(Algorithm)
アルゴリズムは、問題を解決するための手順やルールの集まりです。
レシピを例にすると、材料をどの順序でどのように扱うのかという指示に似ています。コンピュータプログラムでは、このアルゴリズムに従ってデータを処理し、様々なタスクを実行します。
弱いAIと強いAI(Weak AI and Strong AI)
弱いAIは特定のタスクに特化したAIを指し、強いAIは人間のような汎用的な知能を持つAIを指します。
現在のAIは主に弱いAIに分類されるが、強いAIの実現はAI研究の究極的な目標の一つです。
生成AI(generative ai)
生成AIとは、学習したデータを元にして、新しい文章や絵や音楽などを生成する技術です。
従来のAIが決められた行為に対して強くなっていったのに対して、生成AIはパターンと関係を学習することでそれらを組み合わせたりヒントにした新しいコンテンツを生成することができるようになりました。
関連記事:いまさら聞けない生成AIってなに?→
関連記事:生成AIとは?→
XAI(説明可能なAI)
説明可能なAI(XAI: Explainable Artificial Intelligence)とは、AIの意思決定プロセスを理解しやすくするための技術や手法のことです。AIがどのようにして結果を導き出しているのかを明示することで、ユーザーや開発者がその判断を信頼し、適切に活用できるようにします。
コグニティブ・コンピューティング
コグニティブ・コンピューティング(Cognitive Computing)は、従来のコンピューターのように単に与えられた命令を処理するだけでなく、人間の思考プロセスを模倣することで、より高度なデータ解析や意思決定を可能にする技術です。
シンギュラリティ(技術的特異点)
シンギュラリティ(Singularity)、または技術的特異点とは、AIが人間の知能を超える瞬間を指します。
2.機械学習:方法と応用
機械学習(Machine Learning)
機械学習は、コンピュータがデータから学び、経験を積んで自ら進化する技術です。
メールがスパムかどうかを判断するフィルターのように、多くの例から「これはスパムだ」と学ぶことで、新しいメールに対しても正確に判断できるようになります。
ディープラーニング(Deep Learning)
ディープラーニングは、膨大なデータから複雑なパターンを学ぶための機械学習の手法です。
これは、人間の脳の構造に似た「ディープニューラルネットワーク」を使用します。例えば、言語翻訳や音声認識システムでの使用が挙げられ、大量のテキストや音声データから翻訳や認識のルールを自動で学習します。
日本語では深層学習と翻訳されています。
関連記事:ディープラーニング(Deep Learning)とは?→
ニューラルネットワーク(Neural Network)
ニューラルネットワークは、人間の脳の神経細胞(ニューロン)を模倣したコンピュータモデルです。
これは、多層にわたるネットワークを通じて、複雑なパターンやデータを処理します。例えば、手書き文字の認識などが可能になります。
ニューラルネットワークの研究はAIの自然な振る舞いを追求するのに大いに意味のあることです。
関連記事:ニューラルネットワーク(Neural Network)とは?→
教師あり学習(Supervised Learning)
教師あり学習では、ラベル付きのデータセット(例:犬の画像に「犬」とラベルをつける)を使用してモデルを訓練します。
この訓練を通じて、新しいデータに対しても正確な予測や分類が可能になります。
教師なし学習(Unsupervised Learning)
教師なし学習は、ラベルがないデータを使って、その中のパターンや構造を自動で見つける方法です。
顧客の購買データを分析して、似た傾向を持つグループに分けるなどが例です。
強化学習(Reinforcement Learning)
強化学習は、試行錯誤を通じて最適な行動を学ぶ手法です。
ゲームやロボットの自動制御などで使われ、正しい行動には報酬を与え、間違った行動にはペナルティを与えることで学習します。
例えば横スクロールアクションで穴に落ちるとペナルティ。ジャンプして穴を無事に通過するとご褒美。という設定で学習を行うと、ステージに沿ってジャンプする様にAIが学習します。
関連記事:強化学習(Reinforcement Learning)とは?→
過適合/オーバーフィッティング(Overfitting)
Overfitting(過適合)とは、機械学習モデルが訓練データに対して過度に最適化されてしまう状態のことを指します。
これは、モデルが訓練データの特徴をあまりにも正確に学習してしまい、新しい未知のデータに対する一般化能力が低下してしまう現象です。
関連記事:Overfitting(過適合)とは?→
クラスタリング(Clustering)
クラスタリングは、似た特徴を持つデータをグループにまとめる方法です。
例えば、SNS上のユーザー行動から、趣味や興味が似ている人々を同じグループに分類できます。
教師なしの一つです。
回帰分析(Regression Analysis)
回帰分析は、変数間の関係を分析し、将来のトレンドや数値を予測する手法です。
例えば、過去の住宅価格のデータから、将来の価格動向を予測することができます。
数値を用いるため、根拠の明確な分析となります。
関連記事:回帰分析(Regression Analysis)とは?→
フィードフォワードニューラルネットワーク(Feedforward Neural Network)
フィードフォワードニューラルネットワークは、情報が一方向にのみ流れるネットワークで、ディープラーニングに用いられます。
基本的なニューラルネットワークで、画像や音声認識などの複雑なタスクに割り当てられます。
関連記事:フィードフォワードニューラルネットワーク(Feedforward Neural Network)とは?→
バックプロパゲーション(Backpropagation)
バックプロパゲーションは、ニューラルネットワークを訓練する際に使用される技術です。
出力された結果と正解との差を逆方向に伝播させ、ネットワークの重みを最適化します。
関連記事:バックプロパゲーション(Backpropagation)とは?→
ハイパーパラメータ(Hyperparameter)
ハイパーパラメータは、機械学習モデルの学習過程を制御するパラメータです。この制御値は人間が入力するものになります。
ハイパーパラメータの例
- エポック数
- 学習率
- 閾値
- 層の数
- 一層あたりのニューロン数
- 活性化関数の種類
- 最適化アルゴリズム
- バッチサイズ
モデルの精度に大きく影響を及ぼすため、適切な値の選定が重要です。
関連記事:ハイパーパラメータ(Hyperparameter)とは?→
パラメータ
パラメータ、あるいはパラメータ数とは、言語モデルが持つ性能の一つの指標です。
パラメータには「容量」「データの重み」「ニューロン数」など、いくつかの要因が存在します。
基本的には多くなるほど性能が上がるとされていますが、過学習とのバランスや消費電力とのバランス。
そして、モデルの動作の不確実性をもたらす可能性などが指摘されており、必ずしもパラメータ数が多い方が優位とは断定できないものとなります。
過学習(Overfitting)
AIが訓練データ(トレーニングデータ)に過度に適応しすぎてしまい、新しいデータに対する汎化性能が低下する状態を指します。
データサイエンス
データサイエンスは、膨大なデータ(ビッグデータ)から有用な情報を抽出し、それを意思決定や予測に活用する学問領域です。
サポートベクターマシン(SVM)
サポートベクターマシン(SVM)とは、データを2つのグループに分けるために、最適な境界線を見つける機械学習の分類アルゴリズムです。
レコメンド(Recommend)
レコメンド(recommend)とは本来、英語で「おすすめする」「推薦する」ということを意味する言葉です。
AmazonやNetflixでよく見かける「あなたにおすすめ」機能のこと。
転移学習(Transfer Learning)
転移学習とは、AIが別のタスクで学んだ知識を再利用する技術です。画像認識や自然言語処理など、様々な分野で活用され、AI開発を効率化します。
関連記事:転移学習(transfer learning)とは?→
遺伝的アルゴリズム(Genetic Algorithm)
遺伝的アルゴリズムとは、自然界の進化を模倣して問題の解を見つけるAI技術です。生産スケジューリングや回路設計など、様々な分野で活用されています。
関連記事:遺伝的アルゴリズム(Genetic Algorithm)とは?→
3.データ処理と分析
インタラクション(interaction)
インタラクションは、相互コミュニケーションの意味。
AI分野においてはユーザーとAIの対話。もしくは対話状況全体(1スレッド中の対話全て)を指すことが多いです。
1つの応答なのか、スレッド内のすべての応答なのかは前後のニュアンスにより別の理解になることが多いです。
データマイニング(Data Mining)
データマイニングは、大量のデータから有用な情報やパターンを発見するプロセスです。
スーパーマーケットの販売データを分析して、どの商品が一緒に購入される傾向にあるかを見つけ出すことが一例です。
関連記事:データマイニング(Data Mining)とは?→
データセット(Dataset)
データセットは、特定のタスクに対して分析や学習を行うためのデータの集合です。
機械学習では、これらのデータセットを使ってパターンを学習し、新しいデータに対する予測を行います。
ビッグデータ(Big Data)
ビッグデータは、従来のデータベースや分析ツールでは扱いきれないほど巨大で複雑なデータセットを指します。
このデータから得られる洞察は、ビジネスの意思決定、科学研究、公共政策など多岐にわたって利用されています。
プロンプト(prompt)
プロンプトは、特に生成AIにおいて我々ユーザーがAIに対して送る命令文のことです。
「私は今資料を作成しています。そこで○○業界に関する資料のテンプレートをください」
例えばこういったものがプロンプトに当たります。
つまり「プロンプト入力」とはAIへの命令そのものであり、「プロンプトの良し悪し」とはそのプロンプトに対するAIの出力安定性や明瞭な内容であるかということになります。
基本的には誰が使っても使いやすい物が良いプロンプトとされています。
マルチモーダル
AI分野ではとくに複数のカテゴリ(モダリティ)の処理を同時に行うことを指しています。
例えば、映像(1つのモダリティ)と音声(もう1つのモダリティ)を同時に読み取り、これらを勘案して出力をします。
現実的な範囲でこれらが実装できるようになれば「動画の感想を登場人物の感情も交えて語る」といったことが可能になるかもしれません。
マルコフ連鎖モンテカルロ法
マルコフ連鎖モンテカルロ法(Markov Chain Monte Carlo、MCMC)とは、確率分布からのサンプリングや確率モデルのパラメータ推定に用いられる統計的手法です。
AIが文章を生成する際、特定のモデルやパラメータの設定にMCMCが間接的に関係する場合があります。
自然言語処理(NLP)
自然言語処理(NLP)は、人間の言語を理解し、処理するAIの分野です。例えば、音声認識や自動翻訳、チャットボットなどがNLPの応用例です。これにより、機械が人間の言葉を理解し、対話や情報提供が可能になります。
自然言語理解(NLU)
NLUは、NLPの一部で人間の言葉をコンピュータが理解するプロセスに焦点を当てています。
この分野の目的は、テキストや音声データを解析し、その意図や感情、関連する情報を把握することです。
例えば、チャットボットがユーザーの質問を理解し、適切な回答を生成するのにNLUが使用されます。
自然言語生成(NLG)
NLGは、NLPの一部でコンピュータがデータや情報から人間が理解しやすい言語でテキストを生成する技術です。
この技術は、データから報告書を作成したり、自動的にニュース記事を生成したりするのに利用されます。
アノテーション(annotation)
アノテーション(annotation)は、データに対してラベルやタグを付ける作業のことです。例えば、画像データに対して「犬」「猫」「うさぎ」などのラベルを付けることが挙げられます。
4.ソフトウェアとインターフェース
ウェアラブルデバイス
身に着けることができるデバイス(端末)のこと。
AI分野ではスマートウォッチや、Ai Pinなどのモデルがこれにあたります。
将来的にはタッチレスの音声操作のみで様々なことができるようになると予測されています。
クラウドコンピューティング(Cloud Computing)
クラウドコンピューティングは、インターネットを介してリモートサーバー上のリソース(ストレージ、アプリケーションなど)を利用する技術です。
このおかげで、個々のデバイスの性能に依存せず、必要なリソースを必要な時に利用できます。
関連記事:クラウドコンピューティング(Cloud Computing)とは?→
エッジコンピューティング(Edge Computing)
エッジコンピューティングは、データを中央のサーバーではなく、生成元に近い「エッジ」で処理する技術です。
これにより、データの遅延を減らし、リアルタイム処理が可能になります。
例えば、自動運転車の即時判断がその一例です。
関連記事:エッジコンピューティング(Edge Computing)とは?→
ゲートウェイ(Gateway)
ゲートウェイは、異なるネットワークやプロトコル間の通信を可能にするデバイスやソフトウェアです。
例えば、家庭内の異なる種類のスマートデバイスが互いに通信する際に重要な役割を果たします。
API(Application Programming Interface)
API(アプリケーションプログラミングインターフェース)は、異なるソフトウェア間で情報交換や機能利用を可能にする規約です。ウェブサービスのデータをアプリで利用する際などに使用され、開発の柔軟性を高めます。
例えば商品の在庫数というのが在庫の管理データとしてサーバーに保管されていたとして、それを我々の携帯電話やパソコンで読み取る為には在庫数の現状を呼び出さなければいけません。これがAPIにあたります。
関連記事:API(Application Programming Interface)とは?→
コンピュータビジョン(Computer Vision)
コンピュータビジョンは、画像や動画から情報を抽出し、解析する技術です。監視カメラの映像解析や、医療画像の病変検出などに利用され、物理的な世界をデジタルデータとして解釈します。
関連記事:コンピュータビジョン(Computer Vision)とは?→
IoT(Internet of Things)
IoT(Internet of Things)は、日常の物品がインターネットに接続されてデータを交換する技術です。スマートホームデバイスやウェアラブルデバイスなど、生活を便利にする多くの製品で活用されています。
関連記事:IoT(Internet of Things)とは?→
GAN(Generative Adversarial Network)
GAN(Generative Adversarial Network)は、二つのニューラルネットワークが互いに競争しながら学習を進める構造です。この技術は、リアルな画像生成やスタイル変換など、クリエイティブな領域で革新的な成果をもたらしています。
関連記事:GAN(Generative Adversarial Network)とは?→
RPA(Robotic Process Automation)
RPA(Robotic Process Automation)は、定型的な業務プロセスを自動化する技術です。例えば、データ入力やフォームの処理など、繰り返し行われる作業を自動化し、効率を向上させます。
関連記事:RPA(Robotic Process Automation)とは?→
ロボティクス(Robotics)
ロボット技術に、AI等を組み込み、より高度な自律性、柔軟性、知能を持たせることを指します。
ミニマムで専門的なAIモデルを搭載したロボットは将来的に扱いやすい人類のパートナーとなるかもしれません。
関連記事:ヒューマノイドと会話可能にFigure01にChatGPTが搭載される→
セマンティックウェブ(Semantic Web)
セマンティックウェブは、ウェブ上のデータに意味を持たせることで、より効率的な検索や情報の共有を可能にする技術です。これにより、ウェブ上の情報がより有意義に、そして関連性を持って利用されるようになります。
関連記事:セマンティックウェブ(Semantic Web)とは?→
エッジAI(Edge AI)
エッジAIは、データ処理をクラウドではなくデバイス自体で行う技術を指します。データ処理と機械学習モデルをネットワークの端末機器に直接搭載することで、リアルタイムでのデータ処理を可能にします。
クラウドAI
クラウドAIは、インターネット上に人工知能を構築して、AIのデータ処理や機械学習モデルのトレーニングを行う技術です。クラウド上の強力なコンピューティング能力を活用して処理することで、大量のデータを効率的に処理し、高度なAI機能を提供します。
自動音声認識(ASR)
自動音声認識(ASR)は、コンピュータが人間の音声を理解し、文字に変換する技術です。スマートフォンの音声アシスタントや音声入力機能でよく目にすることができます。
5.その他の関連用語
バイアス(Bias)
バイアスとは、AIシステムにおける偏見や先入観を指します。
例えば、トレーニングデータの偏りがモデルの判断に影響を与え、特定のグループに対する不公平な結果を生むことがあります。
オンプレミス(On-premises)
オンプレミスは、企業や組織が自身の物理的な施設内にデータセンターやサーバーを設置し、その上でシステムを運用する方式です。セキュリティやカスタマイズの自由度が高いという利点があります。
ビジネス現場で「オンプレで」と表現された場合は「一つの会社用に設置する」の意味が込められています。
チューニング(Tuning)
チューニングは、機械学習モデルの性能を最適化するためのプロセスです。
ハイパーパラメータの調整を通じて、モデルの予測精度や処理速度を向上させることが目的です。
後述のファインチューニングよりももっと一般的なモデルへ与えられます。
ファインチューニング(Fine-Tuning)
ファインチューニングは、既にトレーニングされた機械学習モデルを特定のタスクやデータセットに合わせて再調整するプロセスです。この手法により、モデルは新たなデータや異なる条件でも高いパフォーマンスを発揮できるようになります。
例えば、あるChatAIをA社専用のチャットボットとしてチューニングすることがこれに当たります。
関連記事:ファインチューニング(Fine-Tuning)とは?→
フェデレーテッドラーニング
フェデレーテッドラーニングとは、多くのデバイスが協力して学習を行う技術のこと。
例えばタブレット端末とPC。複数のPCなどがこれに当たります。
各デバイスが個別にデータを学習し、その結果だけを共有して、全体の学習を進めます。