-
向量数据库 milvus 入门-15-内存内复制
内存内复制
本主题介绍 Milvus 中的内存中复制(replication)机制,该机制可在工作内存中实现多个网段复制,以提高性能和可用性。
有关如何配置内存中复制的信息,请参阅查询节点相关配置。
概述
利用内存中副本,Milvus 可以在多个查询节点上加载相同的数据段。如果一个查询节点出现故障或忙于处理当前的搜索请求,当另一个查询节点到达时,系统可将新请求发送到拥有相同段复制...
2026-01-16 13:01:55 |
Database
-
向量数据库 milvus 入门-14-metric 指标
度量类型
相似度量用于衡量向量之间的相似性。选择合适的距离度量有助于显著提高分类和聚类性能。
目前, Milvus 支持这些类型的相似性度量:欧氏距离 (L2)、内积 (IP)、余弦相似度 (COSINE)、JACCARD,HAMMING 和BM25 (专门为稀疏向量的全文检索而设计)。
下表总结了不同字段类型与相应度量类型之间的映射关系。
字段类型
...
2026-01-16 13:01:55 |
Database
-
向量数据库 milvus 入门-13-timestamp 时间戳
时间同步
本主题介绍 Milvus 的时间同步机制。
概述
Milvus 中的事件一般可分为两类:
数据定义语言(DDL)事件:创建/删除 Collections、创建/删除分区等。
数据操作语言(DML)事件:插入、搜索等。
任何事件,不管是 DDL 还是 DML 事件,都标有时间戳,可以表明事件发生的时间。
假设有两个用户在 Milvus 中发起了一系列 DML 和...
2026-01-16 13:01:55 |
Database
-
向量数据库 milvus 入门-12-timestamp 时间戳
时间戳
本主题解释时间戳的概念,并介绍 Milvus 向量数据库中与时间戳相关的四个主要参数。
概述
Milvus 是一个向量数据库,可以搜索和查询从非结构化数据转换而来的向量。在进行数据操作语言(DML)操作(包括数据插入和删除)时,Milvus 会为参与操作的实体分配时间戳。因此,Milvus 中的所有实体都有一个时间戳属性。而同一 DML 操作符中的实体批次共享相同的时间戳值。
...
2026-01-16 13:01:55 |
Database
-
向量数据库 milvus 入门-11-多租户
实施多租户
在 Milvus 中,多租户意味着多个客户或团队(称为租户)共享同一个集群,同时保持隔离的数据环境。
Milvus 支持四种多租户策略,每种策略都在可扩展性、数据隔离和灵活性之间提供不同的权衡。本指南将向您介绍每种方案,帮助您选择最适合自己使用情况的策略。
多租户策略
Milvus 支持四个级别的多租户:数据库、Collection、Partition 和Partitio...
2026-01-16 13:01:55 |
Database
-
向量数据库 milvus 入门-10-bitset 比特集
比特集
本主题介绍比特集机制,它有助于在 Milvus 中实现属性过滤和删除操作等关键功能。
概述
比特集是一组比特。比特是只有两种可能值的元素,最典型的是0 和1 ,或布尔值true 和false 。在 Milvus 中,比特集是由比特数0 和1 组成的数组,与 ints、浮点数或字符相比,它可以用来紧凑、高效地表示某些数据。比特数默认为0 ,只有在满足特定要求时才会被设置为1 。
...
2026-01-16 13:01:55 |
Database
-
向量数据库 milvus 入门-09-KONWhere
Knowhere
本主题介绍 Milvus 的核心向量执行引擎 Knowhere。
概述
Knowhere 是 Milvus 的核心向量执行引擎,它集成了多个向量相似性搜索库,包括Faiss、Hnswlib和Annoy。
Knowhere 的设计还支持异构计算。它可以控制在哪个硬件(CPU 或 GPU)上执行索引构建和搜索请求。
这就是 Knowhere 名字的由来–知道在哪里执行...
2026-01-16 13:01:55 |
Database
-
向量数据库 milvus 入门-08-啄木鸟
啄木鸟
在 Milvus 2.6 中,Woodpecker 使用专门构建的云原生先写日志(WAL)系统取代了 Kafka 和 Pulsar。
Woodpecker 专为对象存储而设计,可简化操作、最大化吞吐量并轻松扩展。
啄木鸟的设计目标
云环境中的最高吞吐量
持久、仅附加日志记录,实现可靠恢复
操作符最少,无需本地磁盘或外部代理
零磁盘架构
Woodpecker 的核心创新...
2026-01-16 13:01:55 |
Database