1772530674

2026-03-03 17:37:57 +08:00
parent 546b32c344
commit a0d7c1ba97
18 changed files with 725 additions and 355 deletions
@@ -0,0 +1,70 @@
+# 总体目标
+
+1、支持 IBS 动态数据查询（工单进展、域名配置、运营数据、订购数据等）；  
+2、智能分析 CDN 优质客户；  
+3、团队纵向扩展：支持融合 CDN 配置一键下发下发、DNS动态数据查询等
+
+# 公司现状
+
+基于 vLLM 推理引擎部署 DeepSeek-R1-Distill-Qwen-32B
+
+> 32K tokens（32768 约 2.4 万字中文）
+> 使用 vLLM 框架，注意需开启工具调用相关配置。
+
+RAGFlow v0.18.0 2025-04-23（知识库）
+
+> 最新 v0.24.0
+> 完全支持 MCP v0.20.0
+> 依赖 MySQL、ES、Redis、MinIO
+
+# 概念
+
+Function Calling / Tool Call / Tool Calling
+
+[LangGraph](https://docs.langchain.com/oss/python/langgraph/overview) 个人理解为拖拽
+
+**MCP** 服务端 + **ReAct Agent** 智能体 + **RAGFlow** 知识库
+
+**MCP**（Model Context Protocol，模型上下文协议）是一种用于将 AI 应用连接到外部系统的开源标准。
+
+> 通俗点理解
+> 列出能力：服务器告诉客户端它提供哪些 tools/resources/prompts，以及每个 tool 的参数结构
+> 调用工具：客户端发起 call tool，带上符合 schema 的参数
+> 返回结果：服务器返回结构化结果（文本/数据/错误），客户端再交给模型继续推理
+
+**ReAct**: Synergizing Reasoning and Acting in Language Models
+
+> Question: 用户问题
+>
+> Thought: 我需要查一下数据
+> Action: 调用查询工具(search API)
+> Observation: 返回查询结果
+>
+> Thought: 根据结果我可以推理答案
+> Action: 再调用一个工具 / 或直接回答
+>
+> Final Answer: 最终结果
+
+**RAGFlow**（开源的 RAG 工程化平台 / 系统）Python TypeScript
+
+本质是 RAG（Retrieval-Augmented Generation）检索增强生成
+
+> 用户问题
+> ↓
+> 去知识库检索相关内容
+> ↓
+> 把检索结果喂给大模型
+> ↓
+> 生成答案
+
+**DB-GPT** 开源的“AI 原生数据应用开发框架”，用大模型来操作数据库和数据系统。
+
+# 问题
+
+鉴权问题：哪个平台能调用哪些工具，哪个平台的哪些用户能调用哪些工具
+
+AI 平台颁发系统级别 Token 限制你能用的工具。
+
+也就是比如你在我们平台注册了你的 tool，然后调用我们 AI 接口，需要 MCP server Token 和 用户 Token。
+
+如果只用户 Token，那么是不是就需要一个  令牌置换 方案。
@@ -0,0 +1,26 @@
+请为我的公司设计一个智能体方案（公司内部 AI 能力中台 / AI 插件市场）。
+
+目前公司的主要业务是：用户可以通过我们的平台引入域名，域名在平台产生计费计量后，可以查询相关的流量情况或带宽情况。
+
+我们现在已经有了一个 RAGFlow 流程，但也仅限于实现基础的知识库智能问答。
+
+我们现在的目标是：
+
+1. 支持IBS动态数据查询(工单进展、域名配置、运营数据、订购数据等)；
+2. 智能分析CDN优质客户；
+3. 团队纵向扩展：支持融合CDN配置一键下发下发、DNS动态数据查询
+4. 实现通过对话查询流量或峰值带宽的效果。
+5. 构建一个总体的、标准化的智能体框架。
+6. 我们的后端代码以 Java 为主，希望这个框架是可对接的，后续能方便其他业务组（比如做 DNS 指令下发的团队）接入。
+7. 实现一键 AI 智能下发。其他小组只需按照我们提供的规范提供接口，就可以接入到我们的智能体中，通过对话框完成业务操作。
+
+请帮我设计一个完整汇报可行性方案，并给出技术选型建议：
+
+1. 语言环境：基于 Java 语言。
+2. 技术选型：是否建议使用 Spring Boot 或 Spring AI？
+3. 框架评估：目前比较火的 AI 框架，比如 MCP（Model Context Protocol），是否适合我们的业务场景？
+4. 架构设计：如何设计才能保证后期智能体的高可扩展性？比如其他组提供一个接口规范，我们就能为其提供智能服务。
+
+比如先说一个简单的流程：我要查流量，那肯定是智能体去编排，决定调用某一个智能体的 Agent 工具，然后发起流量查询等等。这是一个简单的流程。
+
+比如现在我整个服务已经跑起来了，此时隔壁的项目组给了我一个配置下发的接口，并告诉了我这个接口的参数以及请求地址。我能不能通过“可配置化”的形式，直接在我的页面上把它的地址、需要的参数等信息输入进去，这样我的智能体就拥有了这个能力，而不需要停服务或者进行二次开发。