Files
notes/work/移动杭研/AI 项目/IBS 智能体具体落实技术方案.md
T
Docker7530 a85ad8447f 1773239962
2026-03-11 22:39:26 +08:00

99 lines
3.0 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 总体目标
1、支持 IBS 动态数据查询(工单进展、域名配置、运营数据、订购数据等);
2、智能分析 CDN 优质客户;
3、团队纵向扩展:支持融合 CDN 配置一键下发下发、DNS动态数据查询等
# 公司现状
基于 vLLM 推理引擎部署 DeepSeek-R1-Distill-Qwen-32B
> 32K tokens32768 约 2.4 万字中文)
> 使用 vLLM 框架,注意需开启工具调用相关配置。
RAGFlow v0.18.0 2025-04-23(知识库)
> 最新 v0.24.0
> 完全支持 MCP v0.20.0
> 依赖 MySQL、ES、Redis、MinIO
# 概念理解
bge 向量模型。
Function Calling / Tool Call / Tool Calling
[LangGraph](https://docs.langchain.com/oss/python/langgraph/overview) 个人理解为拖拽
**MCP** 服务端 + **ReAct Agent** 智能体 + **RAGFlow** 知识库
**MCP**Model Context Protocol,模型上下文协议)是一种用于将 AI 应用连接到外部系统的开源标准。
> 通俗点理解
> 列出能力:服务器告诉客户端它提供哪些 tools/resources/prompts,以及每个 tool 的参数结构
> 调用工具:客户端发起 call tool,带上符合 schema 的参数
> 返回结果:服务器返回结构化结果(文本/数据/错误),客户端再交给模型继续推理
**ReAct**: Synergizing Reasoning and Acting in Language Models
> Question: 用户问题
>
> Thought: 我需要查一下数据
> Action: 调用查询工具(search API)
> Observation: 返回查询结果
>
> Thought: 根据结果我可以推理答案
> Action: 再调用一个工具 / 或直接回答
>
> Final Answer: 最终结果
**RAGFlow**(开源的 RAG 工程化平台 / 系统)Python TypeScript
本质是 RAGRetrieval-Augmented Generation)检索增强生成
> 用户问题
>
> 去知识库检索相关内容
>
> 把检索结果喂给大模型
>
> 生成答案
**DB-GPT** 开源的“AI 原生数据应用开发框架”,用大模型来操作数据库和数据系统。
# 问题备注
鉴权问题:哪个平台能调用哪些工具,哪个平台的哪些用户能调用哪些工具
AI 平台颁发系统级别 Token 限制你能用的工具。
也就是比如你在我们平台注册了你的 tool,然后调用我们 AI 接口,需要 MCP server Token 和 用户 Token。
如果只用户 Token,那么是不是就需要一个 令牌置换 方案。
你有什么工具?
我想知道企业A的域名列表。
我想查询 企业A a.com 近 5 天的峰值。
RAGFlow 版本升级至少 v0.20.0。(注意一下是否可以开启自身当作 MCP 服务的功能。)
dify 的整体使用流程流畅很多。
后期 Tool 多了,我们是否提供 MCP 注册中心。
Tool 代码的封装。
dify API 的研究。
DeepSeek-R1-Distill-Qwen-32B 工具调用。
发指令 --》ibs-ai --> RAGflow --> 智能决策 a 工具 b 知识库
需要 MCP server Token 和 用户 Token。
后期 Tool 多了,我们是否提供 MCP 注册中心。
DeepSeek-R1-Distill-Qwen-32B 工具调用。