3.5 KiB
3.5 KiB
AI 费用:120
GPU 租赁:79
YOLO:200
SAM、DINOv3、OpenCV
SAM → 抠出目标
DINOv3 → 提纹路特征(查瑕疵)
OpenCV → 算长宽、面积
OpenCV 负责量得准
SAM 2 负责先抠出来
YOLO 负责后期稳定批量识别
DINOv3 负责判断像不像
| 层 | 技术 | 本质 |
|---|---|---|
| 检测层 | YOLO | 找位置 |
| 分割层 | SAM2 | 精确边界 |
| 几何层 | OpenCV | 测量 |
| 语义层 | DINOv3 | 相似度 |
帮我调研并设计一个技术方案。
我是做文玩核桃的,就是那种特别漂亮的、专门在手里玩耍的核桃。文玩核桃从树上摘下来、刷掉外层青皮之后,有一个步骤叫“配对”。因为成对的核桃整体售价更高,外形也更漂亮一致。
关于“成对”的定义:
一、硬性尺寸(核心基础)
| 点位 | 配对标准 | 红线禁忌 |
|---|---|---|
| 边/宽 | 误差≤0.5mm | 宽窄不一 |
| 肚/厚 | 误差≤0.5mm | 一扁一鼓 |
| 高/桩 | 误差≤0.5mm | 一高一矮 |
二、器型骨架(对称关键)
- 桩型:同矮桩/高桩/元宝桩,桩体一致
- 肩型:双肩高低、倾斜对称
- 底座:地平、底正、大小相同
- 核桃尖:长短、粗细、钝锐统一
三、纹路细节(颜值核心)
- 主筋:走向、粗细左右呼应
- 纹路:深浅、疏密、纹理一致
- 脐眼(气门):形状、大小、闭合度相同
四、皮质密度(决定后期)
- 皮色:原皮同色,无阴阳色差
- 密度:上手压手感一致
- 晃仁:晃动松紧、声音相同
- 皮质:厚薄、软硬统一
五、瑕疵品相(加分减分)
- 无伤:无虫眼、裂、阴皮、修补
- 瑕对称:天然小瑕疵需成双存在,单瑕报废
六、极简速查口诀
先卡尺寸再看型,
肩底边脐要对齐;
纹路皮色密度同,
同树同熟才好堆。
从树上摘下成百上千个核桃后,人工配对是一个很重要的环节。我现在想通过现有的一些模型来实现这个效果,所以想调研一下整体的技术方案怎么做更好。
我预想的效果是:
- 用户(核农)拍摄并上传核桃的照片。
- 采集每个核桃的六个面:即上下、左右、前后。
- 通过技术手段,将这六个面的数据与其他核桃进行比对。
- 系统自动告诉用户,在他的一千个核桃里面,哪些核桃的匹配率更高。
我的一些疑问:
- 采集照片这个步骤是否也有好的技术方案,因为我我发抉择,是搞一个专门的工具实现比如一个传送带、然后6 个摄像头,还是可以通过手机就可以实现。
- 整体流程是否有现成的模型,比如现在有好多现成的始觉模型。还是说如果想实现成熟的方案,最终要有一套自己的训练过的模型或者算法什么的。
- 我看网上有 SAM、DINOv3、OpenCV 这种实现方案。不知道是否适合我的场景,或者有比这些更适合我的方案。
最终给我输出一个技术方案文档:OpenPalm 项目 整体技术方案.md
然后我们基于这个文档,再一起讨论。
概念:Minimum Viable Product
OpenCV
滤波:
手机拍照有小黑点 → 去噪
OCR 图片太脏 → 清理背景
人脸磨皮 → 平滑
车牌识别 → 去干扰
边缘检测前处理 → 提高效果
https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Windows-x86_64.exe