Files
notes/openpalm/openpalm.md
T
Docker7530 7f14056210 1778682052
2026-05-13 22:20:54 +08:00

3.5 KiB
Raw Blame History

AI 费用:120

GPU 租赁:79

YOLO200


SAM、DINOv3、OpenCV

SAM → 抠出目标

DINOv3 → 提纹路特征(查瑕疵)

OpenCV → 算长宽、面积

OpenCV 负责量得准

SAM 2 负责先抠出来

YOLO 负责后期稳定批量识别

DINOv3 负责判断像不像


技术 本质
检测层 YOLO 找位置
分割层 SAM2 精确边界
几何层 OpenCV 测量
语义层 DINOv3 相似度

帮我调研并设计一个技术方案。

我是做文玩核桃的,就是那种特别漂亮的、专门在手里玩耍的核桃。文玩核桃从树上摘下来、刷掉外层青皮之后,有一个步骤叫“配对”。因为成对的核桃整体售价更高,外形也更漂亮一致。

关于“成对”的定义:

一、硬性尺寸(核心基础)

点位 配对标准 红线禁忌
边/宽 误差≤0.5mm 宽窄不一
肚/厚 误差≤0.5mm 一扁一鼓
高/桩 误差≤0.5mm 一高一矮

二、器型骨架(对称关键)

  1. 桩型:同矮桩/高桩/元宝桩,桩体一致
  2. 肩型:双肩高低、倾斜对称
  3. 底座:地平、底正、大小相同
  4. 核桃尖:长短、粗细、钝锐统一

三、纹路细节(颜值核心)

  1. 主筋:走向、粗细左右呼应
  2. 纹路:深浅、疏密、纹理一致
  3. 脐眼(气门):形状、大小、闭合度相同

四、皮质密度(决定后期)

  1. 皮色:原皮同色,无阴阳色差
  2. 密度:上手压手感一致
  3. 晃仁:晃动松紧、声音相同
  4. 皮质:厚薄、软硬统一

五、瑕疵品相(加分减分)

  • 无伤:无虫眼、裂、阴皮、修补
  • 瑕对称:天然小瑕疵需成双存在,单瑕报废

六、极简速查口诀

先卡尺寸再看型,

肩底边脐要对齐;

纹路皮色密度同,

同树同熟才好堆。

从树上摘下成百上千个核桃后,人工配对是一个很重要的环节。我现在想通过现有的一些模型来实现这个效果,所以想调研一下整体的技术方案怎么做更好。

我预想的效果是:

  1. 用户(核农)拍摄并上传核桃的照片。
  2. 采集每个核桃的六个面:即上下、左右、前后。
  3. 通过技术手段,将这六个面的数据与其他核桃进行比对。
  4. 系统自动告诉用户,在他的一千个核桃里面,哪些核桃的匹配率更高。

我的一些疑问:

  1. 采集照片这个步骤是否也有好的技术方案,因为我我发抉择,是搞一个专门的工具实现比如一个传送带、然后6 个摄像头,还是可以通过手机就可以实现。
  2. 整体流程是否有现成的模型,比如现在有好多现成的始觉模型。还是说如果想实现成熟的方案,最终要有一套自己的训练过的模型或者算法什么的。
  3. 我看网上有 SAM、DINOv3、OpenCV 这种实现方案。不知道是否适合我的场景,或者有比这些更适合我的方案。

最终给我输出一个技术方案文档:OpenPalm 项目 整体技术方案.md

然后我们基于这个文档,再一起讨论。


概念:Minimum Viable Product


OpenCV

滤波:

手机拍照有小黑点 → 去噪

OCR 图片太脏 → 清理背景

人脸磨皮 → 平滑

车牌识别 → 去干扰

边缘检测前处理 → 提高效果


https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Windows-x86_64.exe