第57章 策略
  由於是基於大夏的临床合规性,所以赛事组特定在酒店的某个会议室里临时搭建了一座小型图书馆。
  里面存放了有关大夏临床要求等一系列资料,从中找到自己需要的东西也是一项消耗巨大的工作。
  当然,这也是比赛的一部分。
  听完卫临风的策略讲述,其他几人都没有异议,不愧是比赛经验丰富的前辈,虽然是新型赛制,却在极短的时间里就想到了目前能想到的最佳方案。
  接下来几人重点討论了题目算法。
  这次比赛重点聚焦的是早期胰腺导管腺癌(pdac)的精准筛查ai算法,目的是根据患者的临床数据排除其他隱患。
  赛事组准备了中日韩7家顶级医院近十年的回顾性队列数据集,共包含12万例受试者,涵盖三大模態全量数据:影像、检验和文本病例。
  评审要求有三点:
  1.在独立测试集阳性样本占比1.8%、fpr(假阳性率)小於5%的前提下,筛查灵敏度要大於90%。
  2.单例全流程推理在单张消费级显卡上耗时小於10秒。
  3.可解释性模块必须符合《大夏胰腺癌早筛早诊指南》最新版循证医学规范,禁止黑箱模型输出。
  对此蓝策提出了自己的看法。
  “1.8%的阳性率,如果堆千亿参数的多模態大模型暴力擬合,很容易因为过擬合崩溃,而且十分浪费时间。”
  “我觉得算法设计要以临床先验为核心约束,先锁死指南明確的胰腺癌高维特徵空间,再谈模型训练。”
  卫临风点点头表示同意。