1774597379

This commit is contained in:
Docker7530
2026-03-27 15:43:03 +08:00
parent ab0cbad418
commit e4a339bd77
43 changed files with 2973 additions and 179 deletions
+2
View File
@@ -11,7 +11,9 @@
寅杰说需要配管反向提交资料,确认下提交什么。
3.8 系统提示优化 - 信安错误提醒优化(5 天)
4.1 政企侧用户体验优化(2 天)
5.5 试商用客户峰值带宽增加引入省份信息(2 天)
# 总结
-4
View File
@@ -24,10 +24,6 @@ excalicode-ai 是我之前的一个大项目,其中包含各种模块和功能
11:融合 1 平面
cli_a9381b92c0b8dbd8
KySVktr83JyJGaQR9GnJDesxLx5z3Gw2
OpenClaw: access not configured.
Your Feishu user id: ou_5c0794859a5a52712cbfb49aaa334b70
+2
View File
@@ -71,3 +71,5 @@ ps -ef | grep xinan
```
# 总结
日报有问题。了解了一些概念。
+4 -2
View File
@@ -1,8 +1,10 @@
# 任务
- [ ] 开发:参加 IBS 项目晨会,同步昨日问题跟进事项。(李春良
- [ ] 开发:支撑 IBS V7.19.0 版本测试。新业务平面引入与系统集成实施。(李春良
- [x] 开发:参加 IBS 项目晨会,同步昨日问题跟进事项。追踪信安信息邮件问题。(李春良 0.5
- [x] 开发:支撑 IBS V7.19.0 版本测试。新业务平面引入与系统集成实施。合作服务商 显示问题。(李英浩 1
# 日志
# 总结
张雪峰去世了。
+33
View File
@@ -0,0 +1,33 @@
# 任务
- [x] 开发:参加 IBS 项目晨会,同步昨日问题跟进事项。(李春良 0.5)
- [x] 开发:支撑 IBS V7.19.0 版本测试。新业务平面引入与系统集成实施。接口确认(郑子雯 1)
- [x] 项目:IBS 智能体调研,简化 MCP 接口逻辑。(张鹏豪 6.5)
# 日志
杭州是满血大概只有 8K。
咋们的蒸馏大概只有 4K。
1. vllm 可以控制请求时间么?
2. 是否开启思考是否可以控制?
3. vllm 启动有哪些可以控制。
deepseek-reasoner
DeepSeek-V3.2
(思考模式)
可以控制是否思考?
| 参数 | 不传默认值 | 传什么 | 作用 | 影响什么 |
| --------------------------- | ----------- | ----------------------------------------------------------------------- | ----------------- | -------------------------------------------------- |
| `--enable-auto-tool-choice` | 默认关闭(False | 传 `--enable-auto-tool-choice` 开启;或显式传 `--no-enable-auto-tool-choice` 关闭 | 允许模型自己决定是否调用工具 | 不开时,模型通常不会主动发起 tool call;开了后,模型可根据问题自动选择 MCP/tool |
| `--tool-call-parser` | 默认无(None) | 传一个解析器名字,比如 `openai``llama3_json``hermes``mistral``qwen3_xml` 等 | 指定如何解析模型输出的工具调用格式 | 不传时,即使模型输出了工具调用内容,也可能无法被正确识别;传错了会导致 tool call 解析失败 |
![](../../attachment/image-20260325141838198.png)
# 总结
这两天在自己部署模型。想了解一些模型的概念。
+22
View File
@@ -0,0 +1,22 @@
# 任务
- [x] 开发:参加 IBS 项目晨会,同步昨日问题跟进事项。(李春良 0.5)
- [x] 开发:支撑 IBS V7.19.0 版本测试。新业务平面引入与系统集成实施。确认 2.7查询某域名具体配置信息(基础+高级配置)为什么无法触发平面。(郑子雯 1)
- [x] 客响:直播控制台无法导出。(后台时间过长)(李春良 0.5)
- [x] 前端:企业白名单、cache+二级域名白名单问题。(白寰宇 0.5)
- [x] 项目:IBS 智能体调研讨论,模型功能方向。(田卓 5.5)
# 日志
CoT 思考链
1. 到底是不是想要的。
2. 组件选型。
# 总结
这两天仔细了解了一下模型的安装部署,性能,以及工具调用协议等等。
首先感觉脑子里清晰了很多。
我发现我现在一个毛病,我想过多的了解更多的内容,导致我其实有个很大的问题,我总会挖的过深。然后脑子里积压过多的东西。然后当我瞬间轻松下来脑子里又一股脑的都出来了。笔记工具是我一个巨大的助力和习惯,让我有的追溯。
+44
View File
@@ -0,0 +1,44 @@
# 任务
- [x] 开发:参加 IBS 项目晨会,同步昨日问题跟进事项。(李春良 0.5)
- [x] 项目:内容网络IBS系统研发项目_IBS子项目3月任务清单。(李春良 1)
- [ ] 开发:请求命中率计算问题。
# 日志
同步两个我个人的想法你们可以看看
DeepSeek-R1-Distill-Qwen-32B 接口似乎不支持 Tool Calling 和 Function Calling,虽然能靠底座 Qwen 的能力绕过,但接口标准是否一致还需本地验证。现在测试一直是用的官方的 API,别到最后咋们这边不适配就很难受。
128G 卡跑 32B,如果追求效果用 16bit 加大上下文比如顶满 128K ,剩下的显存留给 KV Cache 根本撑不住几个并发;如果为了高并发切到 8bit 量化加 8K 上下文,工具调用能力大概率会直线下降。所以这个资源和模型最好能快些定下来,用自己的资源测试,就会有一些实际的体感。
模型牛,人就轻松;模型弱,调试提示词和工具就要好久好久时间。
总是用官方满血测试就有一种啥啥都好的错觉。
实际效果我不知道,但我感觉涉及工具调用决策等等应该更看模型能力了。
评估具体实现方案,分为四大模块处理:
1. 运营数据
2. 话单
3. CDN集中运管平台接口规范扩展
4. BPM对接接口规范扩展
完成数据统计、实时监控、内容中心、用量查询、统计报表、运营指标导出、业务运维/配置管理、全站加速控制台/统计分析/数据统计、直播控制台/域名管理、冲突域名管理等页面开发。
完成计费对账、自有业务中间话单统计等页面开发。
完成以下接口适配创建/修改加速域名信息、域名配置回调接口(接口方向:CDN集中运维平台->IBS平台)、启用/停用加速域名、查询平面分发的所有加速域名列表、查询加速域名列表(基础配置)、查询某域名具体配置信息(基础+高级配置)、增加/修改域名高级配置、内容预热、内容刷新、内容分发、Url封禁/解禁。
完成以下接口适配IBS通用运维任务创建接口(IBS->BPM)、通用任务状态回传接口(BPM->IBS)、业务适配工单验收反馈接口(BPM->IBS)、业务适配工单阶段反馈接口(BPM->IBS)、域名平面同步接口(BPM->IBS
完成运营数据需求开发自测,具备联调条件
完成话单需求开发自测,具备联调条件
完成CDN集中运管平台接口规范扩展需求开发自测,具备联调条件
完成BPM对接接口规范扩展需求开发自测,具备联调条件
# 总结