|
我要入营,结交更多好友,开启更多功能,轻松玩转服务器大本营!
您需要 登录 才可以下载或查看,没有账号?我要入营
x
不论是RAG,还是Agent,几乎每个LLM 驱动的应用程序都可能会用到向量数据库。那么,向量数据库什么意思?和传统数据库有什么区别?驰网飞飞将和你分享。
一、向量数据库什么意思?
数据库即用来组织、存储和管理数据的仓库,允许用户和程序以各种方式访问和处理数据。数据库的设计旨在管理大量信息,同时支持快速访问、高效查询、可靠的事务处理和并发访问。
向量数据库(Vector Database)是指以向量形式存储数据集合的数据库,向量是基于不同特征或属性来描述对象的数据表示。每个向量代表一个单独的数据点,例如一个词或一张图片,由描述其许多特性的值的集合组成。这些变量有时被称为“特征”或“维度”。例如,一张照片可以表示为像素值的向量,整个句子也可以表示为单词嵌入的向量。
向量通常是通过对原始数据(如文本、图像、音频、视频等)应用某种变换或嵌入函数生成向量并进行管理、存储、检索,是非关系型数据库的一种。嵌入函数可以基于各种方法,例如机器学习模型、单词嵌入、特征提取算法。向量数据库采取索引策略来简化向量类似的特定查询。这在机器学习应用程序中特别有用,因为相似性搜索经常用于发现可比较的数据点或生成建议。相较于传统数据库,向量数据库的核心在于数据向量化和相似性搜索。
二、关系型数据库基本概念
传统数据库,如关系型数据库旨在存储结构化数据。这意味着数据被组织到预定义的表、行和列中,确保数据的完整性和一致性。传统数据库往往针对CRUD进行优化,旨在高效地创建、读取、更新和删除数据条目,使其适用于从 Web 服务到企业软件的各种应用程序。但是,一旦定义了数据库结构,进行更改可能会非常复杂且耗时。这种刚性可确保数据一致性,但灵活性可能不如某些现代数据库的无模式或动态模式性质。
三、向量数据库和传统数据库的区别
(1)数据存储形式
传统数据库通常以表格形式存储结构化数据,向量数据库则通过Embedding技术,将非结构化数据转换为向量数据进行存储,可以将文本、图像、音频、视频等数据转换为高维度的向量,能够更高效地处理更大规模数据。
(2)数据索引与查询方式
传统数据库使用传统的索引结构(B树、哈希索引等),基于精确的数值或关键字进行查询,结果是明确符合条件的数据记录。向量数据库则是模糊查询,使用kd-tree、LSH、HNSW等特殊的索引方式,通过计算一个向量与其他所有向量之间的距离快速在大规模向量数据集中找到最相似的向量,支持复杂的查询操作,如相似性搜索、范围查询等。
向量数据库什么意思?向量数据库和传统数据库的区别
感谢您的阅读,服务器大本营-技术文章内容集合站,助您成为更专业的服务器管理员! |
|