Embeddings
Embeddings 用于把文本转换为向量,常见于语义搜索、推荐、聚类、去重和 RAG 检索。当前文档侧重接入说明;具体开放模型和接口以控制台与 API 参考为准。
典型流程
- 对文档段落、商品描述或知识库片段生成向量。
- 将向量写入向量数据库或支持向量检索的存储系统。
- 查询时对用户问题生成向量。
- 通过相似度召回相关内容,再交给聊天模型生成答案。
使用建议
- 输入文本先做切分,避免单条内容过长。
- 存储向量时保留原文、来源、更新时间和权限字段。
- 检索结果进入聊天模型前,建议做去重、排序和长度控制。
- 如果业务有多语言数据,优先选择支持多语言语义对齐的 embedding 模型。