1772530674

This commit is contained in:
Docker7530
2026-03-03 17:37:57 +08:00
parent 546b32c344
commit a0d7c1ba97
18 changed files with 725 additions and 355 deletions
@@ -0,0 +1,70 @@
# 总体目标
1、支持 IBS 动态数据查询(工单进展、域名配置、运营数据、订购数据等);
2、智能分析 CDN 优质客户;
3、团队纵向扩展:支持融合 CDN 配置一键下发下发、DNS动态数据查询等
# 公司现状
基于 vLLM 推理引擎部署 DeepSeek-R1-Distill-Qwen-32B
> 32K tokens32768 约 2.4 万字中文)
> 使用 vLLM 框架,注意需开启工具调用相关配置。
RAGFlow v0.18.0 2025-04-23(知识库)
> 最新 v0.24.0
> 完全支持 MCP v0.20.0
> 依赖 MySQL、ES、Redis、MinIO
# 概念
Function Calling / Tool Call / Tool Calling
[LangGraph](https://docs.langchain.com/oss/python/langgraph/overview) 个人理解为拖拽
**MCP** 服务端 + **ReAct Agent** 智能体 + **RAGFlow** 知识库
**MCP**Model Context Protocol,模型上下文协议)是一种用于将 AI 应用连接到外部系统的开源标准。
> 通俗点理解
> 列出能力:服务器告诉客户端它提供哪些 tools/resources/prompts,以及每个 tool 的参数结构
> 调用工具:客户端发起 call tool,带上符合 schema 的参数
> 返回结果:服务器返回结构化结果(文本/数据/错误),客户端再交给模型继续推理
**ReAct**: Synergizing Reasoning and Acting in Language Models
> Question: 用户问题
>
> Thought: 我需要查一下数据
> Action: 调用查询工具(search API)
> Observation: 返回查询结果
>
> Thought: 根据结果我可以推理答案
> Action: 再调用一个工具 / 或直接回答
>
> Final Answer: 最终结果
**RAGFlow**(开源的 RAG 工程化平台 / 系统)Python TypeScript
本质是 RAGRetrieval-Augmented Generation)检索增强生成
> 用户问题
>
> 去知识库检索相关内容
>
> 把检索结果喂给大模型
>
> 生成答案
**DB-GPT** 开源的“AI 原生数据应用开发框架”,用大模型来操作数据库和数据系统。
# 问题
鉴权问题:哪个平台能调用哪些工具,哪个平台的哪些用户能调用哪些工具
AI 平台颁发系统级别 Token 限制你能用的工具。
也就是比如你在我们平台注册了你的 tool,然后调用我们 AI 接口,需要 MCP server Token 和 用户 Token。
如果只用户 Token,那么是不是就需要一个 令牌置换 方案。
+26
View File
@@ -0,0 +1,26 @@
请为我的公司设计一个智能体方案(公司内部 AI 能力中台 / AI 插件市场)。
目前公司的主要业务是:用户可以通过我们的平台引入域名,域名在平台产生计费计量后,可以查询相关的流量情况或带宽情况。
我们现在已经有了一个 RAGFlow 流程,但也仅限于实现基础的知识库智能问答。
我们现在的目标是:
1. 支持IBS动态数据查询(工单进展、域名配置、运营数据、订购数据等);
2. 智能分析CDN优质客户;
3. 团队纵向扩展:支持融合CDN配置一键下发下发、DNS动态数据查询
4. 实现通过对话查询流量或峰值带宽的效果。
5. 构建一个总体的、标准化的智能体框架。
6. 我们的后端代码以 Java 为主,希望这个框架是可对接的,后续能方便其他业务组(比如做 DNS 指令下发的团队)接入。
7. 实现一键 AI 智能下发。其他小组只需按照我们提供的规范提供接口,就可以接入到我们的智能体中,通过对话框完成业务操作。
请帮我设计一个完整汇报可行性方案,并给出技术选型建议:
1. 语言环境:基于 Java 语言。
2. 技术选型:是否建议使用 Spring Boot 或 Spring AI
3. 框架评估:目前比较火的 AI 框架,比如 MCPModel Context Protocol),是否适合我们的业务场景?
4. 架构设计:如何设计才能保证后期智能体的高可扩展性?比如其他组提供一个接口规范,我们就能为其提供智能服务。
比如先说一个简单的流程:我要查流量,那肯定是智能体去编排,决定调用某一个智能体的 Agent 工具,然后发起流量查询等等。这是一个简单的流程。
比如现在我整个服务已经跑起来了,此时隔壁的项目组给了我一个配置下发的接口,并告诉了我这个接口的参数以及请求地址。我能不能通过“可配置化”的形式,直接在我的页面上把它的地址、需要的参数等信息输入进去,这样我的智能体就拥有了这个能力,而不需要停服务或者进行二次开发。