2.3 KiB
总体目标
1、支持 IBS 动态数据查询(工单进展、域名配置、运营数据、订购数据等);
2、智能分析 CDN 优质客户;
3、团队纵向扩展:支持融合 CDN 配置一键下发下发、DNS动态数据查询等
公司现状
基于 vLLM 推理引擎部署 DeepSeek-R1-Distill-Qwen-32B
32K tokens(32768 约 2.4 万字中文) 使用 vLLM 框架,注意需开启工具调用相关配置。
RAGFlow v0.18.0 2025-04-23(知识库)
最新 v0.24.0 完全支持 MCP v0.20.0 依赖 MySQL、ES、Redis、MinIO
概念
Function Calling / Tool Call / Tool Calling
LangGraph 个人理解为拖拽
MCP 服务端 + ReAct Agent 智能体 + RAGFlow 知识库
MCP(Model Context Protocol,模型上下文协议)是一种用于将 AI 应用连接到外部系统的开源标准。
通俗点理解 列出能力:服务器告诉客户端它提供哪些 tools/resources/prompts,以及每个 tool 的参数结构 调用工具:客户端发起 call tool,带上符合 schema 的参数 返回结果:服务器返回结构化结果(文本/数据/错误),客户端再交给模型继续推理
ReAct: Synergizing Reasoning and Acting in Language Models
Question: 用户问题
Thought: 我需要查一下数据 Action: 调用查询工具(search API) Observation: 返回查询结果
Thought: 根据结果我可以推理答案 Action: 再调用一个工具 / 或直接回答
Final Answer: 最终结果
RAGFlow(开源的 RAG 工程化平台 / 系统)Python TypeScript
本质是 RAG(Retrieval-Augmented Generation)检索增强生成
用户问题 ↓ 去知识库检索相关内容 ↓ 把检索结果喂给大模型 ↓ 生成答案
DB-GPT 开源的“AI 原生数据应用开发框架”,用大模型来操作数据库和数据系统。
问题
鉴权问题:哪个平台能调用哪些工具,哪个平台的哪些用户能调用哪些工具
AI 平台颁发系统级别 Token 限制你能用的工具。
也就是比如你在我们平台注册了你的 tool,然后调用我们 AI 接口,需要 MCP server Token 和 用户 Token。
如果只用户 Token,那么是不是就需要一个 令牌置换 方案。