VkingDB 向量数据库 | 火山云

目前似乎下架了。
高性能
内置多种火山引擎内部自研索引算法,支持内部多个百亿库,百亿级向量检索规模,检索性能在5ms内。
实时性
支持向量数据实时写入、实时更新,支持实时索引。
稳定高效
存算分离架构,单数据多场景,节约计算资源,提高在线稳定性,保证高可用性。
多场景最佳实践
50+内部业务,多个百亿级别库检索实践,内部多个大模型场景的落地实践,例如抖音、头条、懂车帝、剪映、番茄小说、飞书、搜索、风控、广告等。
VkingDB技术宣讲
 

Embedding TPM

RPM(Requests Per Minute,每分钟请求数) TPM(Tokens Per Minute,每分钟 token 数量)
说明
  • 当前 Embedding 服务支持将文本/图片生成向量。
  • 当前对 Embedding 模型设置了 TPM(Tokens Per Minute,每分钟 tokens 数量)的调用限制,每个账号(含主账号下的所有子账号,合并计算)的 TPM 不超过 12w/模型。
每张图 2k token 大改
60 张 RPM
1 QPS
 
Loading...
目录
文章列表
王小扬博客
产品
Think
Git
软件开发
计算机网络
CI
DB
设计
缓存
Docker
Node
操作系统
Java
大前端
Nestjs
其他
PHP