1772530674
This commit is contained in:
@@ -0,0 +1,70 @@
|
||||
# 总体目标
|
||||
|
||||
1、支持 IBS 动态数据查询(工单进展、域名配置、运营数据、订购数据等);
|
||||
2、智能分析 CDN 优质客户;
|
||||
3、团队纵向扩展:支持融合 CDN 配置一键下发下发、DNS动态数据查询等
|
||||
|
||||
# 公司现状
|
||||
|
||||
基于 vLLM 推理引擎部署 DeepSeek-R1-Distill-Qwen-32B
|
||||
|
||||
> 32K tokens(32768 约 2.4 万字中文)
|
||||
> 使用 vLLM 框架,注意需开启工具调用相关配置。
|
||||
|
||||
RAGFlow v0.18.0 2025-04-23(知识库)
|
||||
|
||||
> 最新 v0.24.0
|
||||
> 完全支持 MCP v0.20.0
|
||||
> 依赖 MySQL、ES、Redis、MinIO
|
||||
|
||||
# 概念
|
||||
|
||||
Function Calling / Tool Call / Tool Calling
|
||||
|
||||
[LangGraph](https://docs.langchain.com/oss/python/langgraph/overview) 个人理解为拖拽
|
||||
|
||||
**MCP** 服务端 + **ReAct Agent** 智能体 + **RAGFlow** 知识库
|
||||
|
||||
**MCP**(Model Context Protocol,模型上下文协议)是一种用于将 AI 应用连接到外部系统的开源标准。
|
||||
|
||||
> 通俗点理解
|
||||
> 列出能力:服务器告诉客户端它提供哪些 tools/resources/prompts,以及每个 tool 的参数结构
|
||||
> 调用工具:客户端发起 call tool,带上符合 schema 的参数
|
||||
> 返回结果:服务器返回结构化结果(文本/数据/错误),客户端再交给模型继续推理
|
||||
|
||||
**ReAct**: Synergizing Reasoning and Acting in Language Models
|
||||
|
||||
> Question: 用户问题
|
||||
>
|
||||
> Thought: 我需要查一下数据
|
||||
> Action: 调用查询工具(search API)
|
||||
> Observation: 返回查询结果
|
||||
>
|
||||
> Thought: 根据结果我可以推理答案
|
||||
> Action: 再调用一个工具 / 或直接回答
|
||||
>
|
||||
> Final Answer: 最终结果
|
||||
|
||||
**RAGFlow**(开源的 RAG 工程化平台 / 系统)Python TypeScript
|
||||
|
||||
本质是 RAG(Retrieval-Augmented Generation)检索增强生成
|
||||
|
||||
> 用户问题
|
||||
> ↓
|
||||
> 去知识库检索相关内容
|
||||
> ↓
|
||||
> 把检索结果喂给大模型
|
||||
> ↓
|
||||
> 生成答案
|
||||
|
||||
**DB-GPT** 开源的“AI 原生数据应用开发框架”,用大模型来操作数据库和数据系统。
|
||||
|
||||
# 问题
|
||||
|
||||
鉴权问题:哪个平台能调用哪些工具,哪个平台的哪些用户能调用哪些工具
|
||||
|
||||
AI 平台颁发系统级别 Token 限制你能用的工具。
|
||||
|
||||
也就是比如你在我们平台注册了你的 tool,然后调用我们 AI 接口,需要 MCP server Token 和 用户 Token。
|
||||
|
||||
如果只用户 Token,那么是不是就需要一个 令牌置换 方案。
|
||||
@@ -0,0 +1,26 @@
|
||||
请为我的公司设计一个智能体方案(公司内部 AI 能力中台 / AI 插件市场)。
|
||||
|
||||
目前公司的主要业务是:用户可以通过我们的平台引入域名,域名在平台产生计费计量后,可以查询相关的流量情况或带宽情况。
|
||||
|
||||
我们现在已经有了一个 RAGFlow 流程,但也仅限于实现基础的知识库智能问答。
|
||||
|
||||
我们现在的目标是:
|
||||
|
||||
1. 支持IBS动态数据查询(工单进展、域名配置、运营数据、订购数据等);
|
||||
2. 智能分析CDN优质客户;
|
||||
3. 团队纵向扩展:支持融合CDN配置一键下发下发、DNS动态数据查询
|
||||
4. 实现通过对话查询流量或峰值带宽的效果。
|
||||
5. 构建一个总体的、标准化的智能体框架。
|
||||
6. 我们的后端代码以 Java 为主,希望这个框架是可对接的,后续能方便其他业务组(比如做 DNS 指令下发的团队)接入。
|
||||
7. 实现一键 AI 智能下发。其他小组只需按照我们提供的规范提供接口,就可以接入到我们的智能体中,通过对话框完成业务操作。
|
||||
|
||||
请帮我设计一个完整汇报可行性方案,并给出技术选型建议:
|
||||
|
||||
1. 语言环境:基于 Java 语言。
|
||||
2. 技术选型:是否建议使用 Spring Boot 或 Spring AI?
|
||||
3. 框架评估:目前比较火的 AI 框架,比如 MCP(Model Context Protocol),是否适合我们的业务场景?
|
||||
4. 架构设计:如何设计才能保证后期智能体的高可扩展性?比如其他组提供一个接口规范,我们就能为其提供智能服务。
|
||||
|
||||
比如先说一个简单的流程:我要查流量,那肯定是智能体去编排,决定调用某一个智能体的 Agent 工具,然后发起流量查询等等。这是一个简单的流程。
|
||||
|
||||
比如现在我整个服务已经跑起来了,此时隔壁的项目组给了我一个配置下发的接口,并告诉了我这个接口的参数以及请求地址。我能不能通过“可配置化”的形式,直接在我的页面上把它的地址、需要的参数等信息输入进去,这样我的智能体就拥有了这个能力,而不需要停服务或者进行二次开发。
|
||||
Reference in New Issue
Block a user