Files
notes/openpalm/openpalm.md
T
Docker7530 521496f2df 1779195890
2026-05-19 21:04:53 +08:00

123 lines
3.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
AI 费用:120
GPU 租赁:79
YOLO200
---
SAM、DINOv3、OpenCV
SAM → 抠出目标
DINOv3 → 提纹路特征(查瑕疵)
OpenCV → 算长宽、面积
OpenCV 负责量得准
SAM 2 负责先抠出来
YOLO 负责后期稳定批量识别
DINOv3 负责判断像不像
---
| 层 | 技术 | 本质 |
| --- | ------ | ---- |
| 检测层 | YOLO | 找位置 |
| 分割层 | SAM2 | 精确边界 |
| 几何层 | OpenCV | 测量 |
| 语义层 | DINOv3 | 相似度 |
---
帮我调研并设计一个技术方案。
我是做文玩核桃的,就是那种特别漂亮的、专门在手里玩耍的核桃。文玩核桃从树上摘下来、刷掉外层青皮之后,有一个步骤叫“配对”。因为成对的核桃整体售价更高,外形也更漂亮一致。
关于“成对”的定义:
### 一、硬性尺寸(核心基础)
| 点位 | 配对标准 | 红线禁忌 |
|------|----------|----------|
| 边/宽 | 误差≤0.5mm | 宽窄不一 |
| 肚/厚 | 误差≤0.5mm | 一扁一鼓 |
| 高/桩 | 误差≤0.5mm | 一高一矮 |
### 二、器型骨架(对称关键)
1. **桩型**:同矮桩/高桩/元宝桩,桩体一致
2. **肩型**:双肩高低、倾斜对称
3. **底座**:地平、底正、大小相同
4. **核桃尖**:长短、粗细、钝锐统一
### 三、纹路细节(颜值核心)
1. **主筋**:走向、粗细左右呼应
2. **纹路**:深浅、疏密、纹理一致
3. **脐眼(气门)**:形状、大小、闭合度相同
### 四、皮质密度(决定后期)
1. **皮色**:原皮同色,无阴阳色差
2. **密度**:上手压手感一致
3. **晃仁**:晃动松紧、声音相同
4. **皮质**:厚薄、软硬统一
### 五、瑕疵品相(加分减分)
- 无伤:无虫眼、裂、阴皮、修补
- 瑕对称:天然小瑕疵需成双存在,单瑕报废
### 六、极简速查口诀
先卡尺寸再看型,
肩底边脐要对齐;
纹路皮色密度同,
同树同熟才好堆。
从树上摘下成百上千个核桃后,人工配对是一个很重要的环节。我现在想通过现有的一些模型来实现这个效果,所以想调研一下整体的技术方案怎么做更好。
我预想的效果是:
1. 用户(核农)拍摄并上传核桃的照片。
2. 采集每个核桃的六个面:即上下、左右、前后。
3. 通过技术手段,将这六个面的数据与其他核桃进行比对。
4. 系统自动告诉用户,在他的一千个核桃里面,哪些核桃的匹配率更高。
我的一些疑问:
1. 采集照片这个步骤是否也有好的技术方案,因为我我发抉择,是搞一个专门的工具实现比如一个传送带、然后6 个摄像头,还是可以通过手机就可以实现。
2. 整体流程是否有现成的模型,比如现在有好多现成的始觉模型。还是说如果想实现成熟的方案,最终要有一套自己的训练过的模型或者算法什么的。
3. 我看网上有 SAM、DINOv3、OpenCV 这种实现方案。不知道是否适合我的场景,或者有比这些更适合我的方案。
最终给我输出一个技术方案文档:OpenPalm 项目 整体技术方案.md
然后我们基于这个文档,再一起讨论。
---
概念:Minimum Viable Product
---
OpenCV
滤波:
手机拍照有小黑点 → 去噪
OCR 图片太脏 → 清理背景
人脸磨皮 → 平滑
车牌识别 → 去干扰
边缘检测前处理 → 提高效果