ベクトル データベースとは
生成AI の可能性を広げる「ベクトルデータベース(ベクターデータベース)」への注目度が高まっています。例えば、PostgreSQL にベクトルデータベースの機能を追加する拡張機能 pgvector 0.5.0 が8月末に発表されました。(https://codezine.jp/news/detail/18267)
ベクトルデータベースは、ベクトル(数値の並び)を効率的に保存・検索するためのデータベースです。特に、AI や機械学習、自然言語処理(NLP)の分野でよく使われます。
ChatGPT や多くの画像認識モデルは、テキストや画像をベクトル(特徴量)に変換して処理します。例えば、ある画像が 1024次元のベクトルとして処理されている場合、そのベクトルにどれくらい似ているかをベクトル同士の類似度(似ているかどうか)を計算することで、検索や分類ができます。
画像などの類似検索、セマンティック検索(意味ベースの検索)、レコメンデーションなどで利用されています。
参考リンク |
---|