答辩提问清单 · 专硕

李浩铭 · 土壤含水率传感器

专业硕士(机械专业领域) · 共 4 条提问 · 指导教师 和贤桃 副教授

论文题目
土壤含水率传感器
学位类型
专业硕士(机械专业领域)
作者
李浩铭
指导教师
和贤桃 副教授
论文页数
104 页
评阅日期
2026-05-22

提问 Q1:四波长选取与三模块外壳集成的工程取舍

展示问对应评阅书:主要贡献第 1 条(多源融合硬件一体化集成,展示问)
[定位]

第二章 三种传感机理与四个特征波长的选取、第三章 硬件实现与 FPC 柔性互连、表 3-1 LED 性能参数与表 3-3 LED-硅光电池对应关系(四个特征波长 490 / 570 / 940 / 1450 nm)、第 3.5 节 PT100 温度模块与共面边缘场紫铜电极的并入

[问题铺垫]

作者在论文里把光谱、电导、温度三种敏感机理整合到一个 240×428×26 毫米的传感器外壳里,外壳总质量约 316 克(3D 打印树脂件),主控板(STM32F407VET6)和采集板之间用 FPC 柔性互连。光谱通道挑了 490、570、940、1450 纳米这四个波长,并不是把可见光近红外整个波段都扫一遍。这套硬件方案从机械外壳到 PCB 集成、再到嵌入式主控,作者基本是自己一路做下来的。

[主问题]

请你具体说说,这四个波长是怎么从机理和电路两边一起挑出来的?外壳里把光路、电极、温度元件挤到一起,做集成时遇到的最难的一两个工程问题是怎么处理的?

[备选追问]
  1. 若学生主要从“光谱机理”角度回答(如“940 对水分吸收带敏感”):可追问 —— 那 1450 纳米这一档相对 940 纳米,在你的电路噪声水平下区分度是多少?
  2. 若学生主要从“工程集成”角度回答(如“FPC 解决空间问题”):可追问 —— 共面电极和光路如果靠得太近,会不会有电磁串扰?你是怎么屏蔽的?
[期望听到的核心要点]
  • 要点 1(合格线):能说出四个波长各自对应的吸收 / 反射机理(如 1450 纳米是水分子 O-H 吸收带)
  • 要点 2(合格线):能说出三模块集成时至少一处真实的工程困难(光路遮挡、电磁串扰、温度梯度、空间布局等任一)
  • 要点 3(加分项):能具体讲出 FPC 互连选择的具体理由(如柔性绕过电池仓 / 减少装配应力)或 PT100 与电极之间的热耦合处理
  • 红线:若学生答“按文献推荐选的”或“导师让选的”而说不出本论文具体的工程考量,反映对自己硬件设计的细节不熟悉

提问 Q2:静态标定测试集与训练集划分方式

硬伤问对应评阅书:意见 1(静态标定的训练测试集划分不构成独立测试,硬伤)
[定位]

第 4.1.2 节 静态标定数据组成、第 4.3.1 节 数据集划分、图 4-14 六个模型的 train / test 散点图、表 4-4 模型对比

[问题铺垫]

作者在静态标定阶段做了 8 个含水率梯度,每个梯度采集 550 组数据、重复 3 次,共 13200 个样本;然后用 8 比 2 随机划分(random_state=42)得到训练集和测试集。图 4-14 给出 6 个模型在两个集合上的散点图。把 6 个模型的 train RMSE 与 test RMSE 摆在一起看,差距都在 0 到 0.05 之间,最大相对差距不到 2%。在独立同分布的标准评估里,测试集 RMSE 通常比训练集大 10% 到 30%。

[主问题]

请你说说,每个含水率梯度的 1650 个采样点是在什么状态下连续采集的?这种采集方式下,按样本随机做 8 比 2 划分,训练集和测试集之间的独立性是怎么保证的?

[备选追问]
  1. 若学生承认相邻采样点高度相关(如“是同一土样在静止状态下连续扫的”):可追问 —— 那如果改成按梯度做留一交叉验证,你预期 GBANet 的 RMSE 会变成多少?
  2. 若学生坚持当前划分合理(如“sklearn 默认就是这么用的”):可追问 —— 你看图 4-14,六个模型的 train 和 test 差距都不到 2%,按你的理解这是模型泛化好还是另有原因?
[期望听到的核心要点]
  • 要点 1(合格线):能承认每个梯度 1650 个样本来自同一土样在静止、恒温、短时间内的连续扫描
  • 要点 2(合格线):能识别出按样本随机划分会把相邻高相关样本同时分到训练和测试,导致测试集与训练集严格同分布
  • 要点 3(加分项):能主动提出按梯度划分(Leave-One-Gradient-Out)或按采集次划分作为补救方案,并预估真实泛化误差会显著大于当前 0.4594
  • 红线:若学生坚持“R 方 0.9936 反映模型对新土样的预测能力”,反映对独立测试集与数据泄露的统计学概念理解不到位

提问 Q3:速度分段补偿参数的拟合数据来源与跨工况沿用

硬伤问对应评阅书:意见 2(速度分段补偿的 5 参数从 8 数据点拟合,后续试验沿用未独立验证,硬伤)
[定位]

第 5.2.1 节 公式 (5-21) 三段补偿函数、表 5-10 拟合数据共 8 行、第 5.3 节 盐分试验、第 5.4 节 土壤类型试验

[问题铺垫]

作者在 5.2.1 节提了一个三段补偿函数,里面有五个待定参数(δ₀、v₁、v₂、α、β)。这五个参数是从表 5-10 的 8 行数据用最小二乘拟合的,8 行全部来自单一土样、单一含水率(12.5%)、单一温度(22°C)下采集的 6 个速度点。后面的盐分试验和土壤类型试验虽然换了盐分浓度和土壤类型,但这组补偿参数从头到尾没动。把参数代回公式反算 8 个数据点,残差均方根约 0.11%,已接近测量噪声水平。

[主问题]

请你讲一下,5 个待定参数从 8 个数据点拟合出来,统计学上你是怎么判断这组参数有没有泛化能力的?在 5.3 节盐分试验和 5.4 节土壤类型试验里,把同一组参数直接用在不同的盐分浓度、不同的土壤类型上,背后的物理假设是什么?

[备选追问]
  1. 若学生从“数据点数足够”角度回答(如“残差很小说明拟合好”):可追问 —— 残差小到接近测量噪声,是不是反而说明自由度不够?n 比 p 等于 1.6 的回归模型,按你了解,统计推断上的安全门槛大概是多少?
  2. 若学生从“物理假设”角度回答(如“动态接触行为在不同土壤上类似”):可追问 —— 那为什么不在另一份土样(比如砂土)上重新采几个速度点,验证一下 δ₀ 和 α 是不是真的稳定?
[期望听到的核心要点]
  • 要点 1(合格线):能识别 n=8 / p=5、n/p=1.6 远低于常规回归建模门槛(n/p ≥ 10)的统计学问题
  • 要点 2(合格线):能说出当前参数是工况依赖的标定值,对不同土样、不同含水率窗口的可推广性没有独立验证
  • 要点 3(加分项):能主动提出“在第二份土样上重新拟合参数对比稳定性”或“在变速工况下验证过渡段二次项”等补救方案
  • 红线:若学生答“已经验证过了,5.3 和 5.4 试验的精度证明参数稳定”,反映把“沿用参数后试验精度可接受”与“参数本身经过独立验证”混淆

提问 Q4:温度补偿能力的端到端验证

边缘问对应评阅书:意见 3 子问题 (b)(温度补偿能力的端到端验证缺失,边缘问承接子问题 b)
[定位]

第 4.1.4 节 变温响应试验(含水率 12.9% / 16.0% × 5 温度点)、第 4.2.2 节 门控机制描述、第 4.3.1 节 GBANet 训练数据描述(22°C 常温)

[问题铺垫]

作者在 4.1.4 节做了一个变温试验,在 2.5 到 33°C 五个温度点上采了两个含水率(12.9%、16.0%)的硬件电压曲线,推出了温度系数(电导 0.0203 V/°C、光谱 0.0173 V/°C)。但 GBANet 的 13200 个训练样本全部在 22°C 常温下采集,4.1.4 这 10 个变温工况的数据没进 GBANet 的训练集或测试集。作者在 4.2.2 节写“由于输入特征 x 中包含温度参数,该门控机制使模型本身就具备温度感知能力”——这是基于网络结构推出的能力声称。

[主问题]

请你说说,门控网络在 22°C 单一温度下训练得到的权重,凭什么能保证在 5°C 或 30°C 这种训练域外的温度下也输出合理预测?4.1.4 节那 10 个变温工况的数据,为什么没有用来端到端跑一次 GBANet 的预测精度?

[备选追问]
  1. 若学生从“门控机制结构”角度回答(如“温度作为输入会被注意力加权”):可追问 —— 但训练数据本身没有覆盖跨温度,门控函数从哪里学到“5°C 时电导通道权重该调多少”的映射?
  2. 若学生从“工作量限制”角度回答(如“试验条件有限没补做”):可追问 —— 那如果只是把 4.1.4 已有的 10 个变温工况的电压输入 GBANet 推理一次(不需要重新训练),是否可以补出一条温度-预测精度曲线?
[期望听到的核心要点]
  • 要点 1(合格线):能区分“结构性推断(温度作为输入 → 模型应该能感知)”与“实验性证明(在多个温度下评估端到端预测精度)”
  • 要点 2(合格线):能承认 GBANet 训练数据未覆盖跨温度工况,4.1.4 的变温数据仅用于硬件温漂曲线绘制
  • 要点 3(加分项):能主动提出“用 4.1.4 已采集的 10 个变温工况数据做 GBANet 推理评估”作为最小补强方案
  • 红线:若学生答“门控机制就是为了温度补偿设计的,所以一定能跨温度泛化”,反映对网络泛化能力与训练数据覆盖范围之间的关系理解不到位

二、本清单与评阅书 6 条意见的对应

评阅书意见 严重度 是否衍生提问 对应 Qn 理由
意见 1 数据泄露 high Q2(硬伤) 方法论核心硬伤,必问
意见 2 速度分段补偿过拟合 high Q3(硬伤) 统计学 + 跨工况外推双重硬伤,必问
意见 3 (a) 跨土样窗口窄 high 否(评委自由提问) —— 与 (b) 同属适应性试验缺口;专硕 4 问总额下取 (b) 进 Q4,(a) 留作答辩主席自由发挥
意见 3 (b) 温度补偿端到端缺失 high Q4(边缘) 进 Q4 边缘问,与 Q3 互补:Q3 问“参数外推到不同土样”,Q4 问“模型外推到不同温度”
意见 4 MRE 可追溯性 medium-high —— 修复成本极低(增 1 列 + 改 2 句),表述完整性问题,不浪费答辩时间
意见 5 标定量程边界 medium —— 声明问题,不涉及方法论;评委需要时可直接询问“传感器在 25% 以上能用吗”
意见 6 校对类合并 low 否(校对类不进答辩) —— 校对级问题原则上不进答辩,已在评阅书与详细佐证中处置
主要贡献第 1 条 硬件一体化集成 —— Q1(展示) 评阅书中工程亮点最实在的一项,让学生有发挥空间

三、对答辩主席的执行建议

  1. 顺序建议:按 Q1 → Q2 → Q3 → Q4 的顺序提问。Q1 展示让学生进入状态;Q2 与 Q3 是核心方法论硬伤,构成本次答辩的实质考察;Q4 边缘收口。
  2. 追问节奏:每问主问题给学生 2–3 分钟回答;根据回答方向挑 [备选追问] 中的 1 条延伸 1–2 分钟。专硕答辩典型 15–25 分钟提问环节,4 问全答完约需 18–24 分钟。
  3. 若时间紧张:可只问 Q1(展示)+ Q2(硬伤数据泄露)+ Q3(硬伤速度补偿),Q4 留作补充。Q2 与 Q3 是评阅书定性 high 的两条,建议至少问到其一。
  4. 若学生回答超预期:Q2、Q3 主问题若学生第一轮就把核心要点全说出来(如主动提出按梯度划分 / 主动承认参数工况依赖性),可不追问,直接进下一题。
  5. 若学生回答触红线:本清单 [期望听到的核心要点] 段中的“红线”是评分参考;若学生在 Q2 或 Q3 触红线,建议答辩委员会在评议时把“修改后同意答辩”中的修改要求明确写到具体意见上(参考评阅书意见 1、2 的修改建议路径 A/B/C)。