李浩铭 · 答辩提问清单

论文题目: 土壤含水率传感器
学位类型: 专业硕士（机械专业领域）
作者: 李浩铭
指导教师: 和贤桃副教授
论文页数: 104 页
评阅日期: 2026-05-22

提问 Q1：四波长选取与三模块外壳集成的工程取舍

展示问对应评阅书：主要贡献第 1 条（多源融合硬件一体化集成，展示问）

[定位]

第二章三种传感机理与四个特征波长的选取、第三章硬件实现与 FPC 柔性互连、表 3-1 LED 性能参数与表 3-3 LED-硅光电池对应关系（四个特征波长 490 / 570 / 940 / 1450 nm）、第 3.5 节 PT100 温度模块与共面边缘场紫铜电极的并入

[问题铺垫]

作者在论文里把光谱、电导、温度三种敏感机理整合到一个 240×428×26 毫米的传感器外壳里，外壳总质量约 316 克（3D 打印树脂件），主控板（STM32F407VET6）和采集板之间用 FPC 柔性互连。光谱通道挑了 490、570、940、1450 纳米这四个波长，并不是把可见光近红外整个波段都扫一遍。这套硬件方案从机械外壳到 PCB 集成、再到嵌入式主控，作者基本是自己一路做下来的。

[主问题]

请你具体说说，这四个波长是怎么从机理和电路两边一起挑出来的？外壳里把光路、电极、温度元件挤到一起，做集成时遇到的最难的一两个工程问题是怎么处理的？

[备选追问]

若学生主要从“光谱机理”角度回答（如“940 对水分吸收带敏感”）：可追问 —— 那 1450 纳米这一档相对 940 纳米，在你的电路噪声水平下区分度是多少？
若学生主要从“工程集成”角度回答（如“FPC 解决空间问题”）：可追问 —— 共面电极和光路如果靠得太近，会不会有电磁串扰？你是怎么屏蔽的？

[期望听到的核心要点]

要点 1（合格线）：能说出四个波长各自对应的吸收 / 反射机理（如 1450 纳米是水分子 O-H 吸收带）
要点 2（合格线）：能说出三模块集成时至少一处真实的工程困难（光路遮挡、电磁串扰、温度梯度、空间布局等任一）
要点 3（加分项）：能具体讲出 FPC 互连选择的具体理由（如柔性绕过电池仓 / 减少装配应力）或 PT100 与电极之间的热耦合处理
红线：若学生答“按文献推荐选的”或“导师让选的”而说不出本论文具体的工程考量，反映对自己硬件设计的细节不熟悉

提问 Q2：静态标定测试集与训练集划分方式

硬伤问对应评阅书：意见 1（静态标定的训练测试集划分不构成独立测试，硬伤）

[定位]

第 4.1.2 节静态标定数据组成、第 4.3.1 节数据集划分、图 4-14 六个模型的 train / test 散点图、表 4-4 模型对比

[问题铺垫]

作者在静态标定阶段做了 8 个含水率梯度，每个梯度采集 550 组数据、重复 3 次，共 13200 个样本；然后用 8 比 2 随机划分（random_state=42）得到训练集和测试集。图 4-14 给出 6 个模型在两个集合上的散点图。把 6 个模型的 train RMSE 与 test RMSE 摆在一起看，差距都在 0 到 0.05 之间，最大相对差距不到 2%。在独立同分布的标准评估里，测试集 RMSE 通常比训练集大 10% 到 30%。

[主问题]

请你说说，每个含水率梯度的 1650 个采样点是在什么状态下连续采集的？这种采集方式下，按样本随机做 8 比 2 划分，训练集和测试集之间的独立性是怎么保证的？

[备选追问]

若学生承认相邻采样点高度相关（如“是同一土样在静止状态下连续扫的”）：可追问 —— 那如果改成按梯度做留一交叉验证，你预期 GBANet 的 RMSE 会变成多少？
若学生坚持当前划分合理（如“sklearn 默认就是这么用的”）：可追问 —— 你看图 4-14，六个模型的 train 和 test 差距都不到 2%，按你的理解这是模型泛化好还是另有原因？

[期望听到的核心要点]

要点 1（合格线）：能承认每个梯度 1650 个样本来自同一土样在静止、恒温、短时间内的连续扫描
要点 2（合格线）：能识别出按样本随机划分会把相邻高相关样本同时分到训练和测试，导致测试集与训练集严格同分布
要点 3（加分项）：能主动提出按梯度划分（Leave-One-Gradient-Out）或按采集次划分作为补救方案，并预估真实泛化误差会显著大于当前 0.4594
红线：若学生坚持“R 方 0.9936 反映模型对新土样的预测能力”，反映对独立测试集与数据泄露的统计学概念理解不到位

查看本提问对应的详细佐证：
意见 1：静态标定的训练测试集划分不构成独立测试，R²=0.9936 是过拟合记忆

提问 Q3：速度分段补偿参数的拟合数据来源与跨工况沿用

硬伤问对应评阅书：意见 2（速度分段补偿的 5 参数从 8 数据点拟合，后续试验沿用未独立验证，硬伤）

[定位]

第 5.2.1 节公式 (5-21) 三段补偿函数、表 5-10 拟合数据共 8 行、第 5.3 节盐分试验、第 5.4 节土壤类型试验

[问题铺垫]

作者在 5.2.1 节提了一个三段补偿函数，里面有五个待定参数（δ₀、v₁、v₂、α、β）。这五个参数是从表 5-10 的 8 行数据用最小二乘拟合的，8 行全部来自单一土样、单一含水率（12.5%）、单一温度（22°C）下采集的 6 个速度点。后面的盐分试验和土壤类型试验虽然换了盐分浓度和土壤类型，但这组补偿参数从头到尾没动。把参数代回公式反算 8 个数据点，残差均方根约 0.11%，已接近测量噪声水平。

[主问题]

请你讲一下，5 个待定参数从 8 个数据点拟合出来，统计学上你是怎么判断这组参数有没有泛化能力的？在 5.3 节盐分试验和 5.4 节土壤类型试验里，把同一组参数直接用在不同的盐分浓度、不同的土壤类型上，背后的物理假设是什么？

[备选追问]

若学生从“数据点数足够”角度回答（如“残差很小说明拟合好”）：可追问 —— 残差小到接近测量噪声，是不是反而说明自由度不够？n 比 p 等于 1.6 的回归模型，按你了解，统计推断上的安全门槛大概是多少？
若学生从“物理假设”角度回答（如“动态接触行为在不同土壤上类似”）：可追问 —— 那为什么不在另一份土样（比如砂土）上重新采几个速度点，验证一下 δ₀ 和 α 是不是真的稳定？

[期望听到的核心要点]

要点 1（合格线）：能识别 n=8 / p=5、n/p=1.6 远低于常规回归建模门槛（n/p ≥ 10）的统计学问题
要点 2（合格线）：能说出当前参数是工况依赖的标定值，对不同土样、不同含水率窗口的可推广性没有独立验证
要点 3（加分项）：能主动提出“在第二份土样上重新拟合参数对比稳定性”或“在变速工况下验证过渡段二次项”等补救方案
红线：若学生答“已经验证过了，5.3 和 5.4 试验的精度证明参数稳定”，反映把“沿用参数后试验精度可接受”与“参数本身经过独立验证”混淆

查看本提问对应的详细佐证：
意见 2：速度分段补偿的 5 参数从 8 数据点拟合，后续试验沿用未独立验证

提问 Q4：温度补偿能力的端到端验证

边缘问对应评阅书：意见 3 子问题 (b)（温度补偿能力的端到端验证缺失，边缘问承接子问题 b）

[定位]

第 4.1.4 节变温响应试验（含水率 12.9% / 16.0% × 5 温度点）、第 4.2.2 节门控机制描述、第 4.3.1 节 GBANet 训练数据描述（22°C 常温）

[问题铺垫]

作者在 4.1.4 节做了一个变温试验，在 2.5 到 33°C 五个温度点上采了两个含水率（12.9%、16.0%）的硬件电压曲线，推出了温度系数（电导 0.0203 V/°C、光谱 0.0173 V/°C）。但 GBANet 的 13200 个训练样本全部在 22°C 常温下采集，4.1.4 这 10 个变温工况的数据没进 GBANet 的训练集或测试集。作者在 4.2.2 节写“由于输入特征 x 中包含温度参数，该门控机制使模型本身就具备温度感知能力”——这是基于网络结构推出的能力声称。

[主问题]

请你说说，门控网络在 22°C 单一温度下训练得到的权重，凭什么能保证在 5°C 或 30°C 这种训练域外的温度下也输出合理预测？4.1.4 节那 10 个变温工况的数据，为什么没有用来端到端跑一次 GBANet 的预测精度？

[备选追问]

若学生从“门控机制结构”角度回答（如“温度作为输入会被注意力加权”）：可追问 —— 但训练数据本身没有覆盖跨温度，门控函数从哪里学到“5°C 时电导通道权重该调多少”的映射？
若学生从“工作量限制”角度回答（如“试验条件有限没补做”）：可追问 —— 那如果只是把 4.1.4 已有的 10 个变温工况的电压输入 GBANet 推理一次（不需要重新训练），是否可以补出一条温度-预测精度曲线？

[期望听到的核心要点]

要点 1（合格线）：能区分“结构性推断（温度作为输入 → 模型应该能感知）”与“实验性证明（在多个温度下评估端到端预测精度）”
要点 2（合格线）：能承认 GBANet 训练数据未覆盖跨温度工况，4.1.4 的变温数据仅用于硬件温漂曲线绘制
要点 3（加分项）：能主动提出“用 4.1.4 已采集的 10 个变温工况数据做 GBANet 推理评估”作为最小补强方案
红线：若学生答“门控机制就是为了温度补偿设计的，所以一定能跨温度泛化”，反映对网络泛化能力与训练数据覆盖范围之间的关系理解不到位

二、本清单与评阅书 6 条意见的对应

评阅书意见	严重度	是否衍生提问	对应 Qn	理由
意见 1 数据泄露	high	是	Q2（硬伤）	方法论核心硬伤，必问
意见 2 速度分段补偿过拟合	high	是	Q3（硬伤）	统计学 + 跨工况外推双重硬伤，必问
意见 3 (a) 跨土样窗口窄	high	否（评委自由提问）	——	与 (b) 同属适应性试验缺口；专硕 4 问总额下取 (b) 进 Q4，(a) 留作答辩主席自由发挥
意见 3 (b) 温度补偿端到端缺失	high	是	Q4（边缘）	进 Q4 边缘问，与 Q3 互补：Q3 问“参数外推到不同土样”，Q4 问“模型外推到不同温度”
意见 4 MRE 可追溯性	medium-high	否	——	修复成本极低（增 1 列 + 改 2 句），表述完整性问题，不浪费答辩时间
意见 5 标定量程边界	medium	否	——	声明问题，不涉及方法论；评委需要时可直接询问“传感器在 25% 以上能用吗”
意见 6 校对类合并	low	否（校对类不进答辩）	——	校对级问题原则上不进答辩，已在评阅书与详细佐证中处置
主要贡献第 1 条硬件一体化集成	——	是	Q1（展示）	评阅书中工程亮点最实在的一项，让学生有发挥空间

三、对答辩主席的执行建议

顺序建议：按 Q1 → Q2 → Q3 → Q4 的顺序提问。Q1 展示让学生进入状态；Q2 与 Q3 是核心方法论硬伤，构成本次答辩的实质考察；Q4 边缘收口。
追问节奏：每问主问题给学生 2–3 分钟回答；根据回答方向挑 [备选追问] 中的 1 条延伸 1–2 分钟。专硕答辩典型 15–25 分钟提问环节，4 问全答完约需 18–24 分钟。
若时间紧张：可只问 Q1（展示）+ Q2（硬伤数据泄露）+ Q3（硬伤速度补偿），Q4 留作补充。Q2 与 Q3 是评阅书定性 high 的两条，建议至少问到其一。
若学生回答超预期：Q2、Q3 主问题若学生第一轮就把核心要点全说出来（如主动提出按梯度划分 / 主动承认参数工况依赖性），可不追问，直接进下一题。
若学生回答触红线：本清单 [期望听到的核心要点] 段中的“红线”是评分参考；若学生在 Q2 或 Q3 触红线，建议答辩委员会在评议时把“修改后同意答辩”中的修改要求明确写到具体意见上（参考评阅书意见 1、2 的修改建议路径 A/B/C）。

查看本提问对应的详细佐证：
意见 3：适应性试验设计存在两处覆盖缺口

← 返回汇总 → 本案详细佐证

李浩铭 · 土壤含水率传感器

提问 Q1：四波长选取与三模块外壳集成的工程取舍

提问 Q2：静态标定测试集与训练集划分方式

提问 Q3：速度分段补偿参数的拟合数据来源与跨工况沿用

提问 Q4：温度补偿能力的端到端验证

二、本清单与评阅书 6 条意见的对应

三、对答辩主席的执行建议