Chapter 4 研究的范式
4.1 科学问题
具体什么是科学问题,难有准确定义,但是我们可以从一些侧面了解什么是科学问题。
科学问题的一些诠释:
- 一个你能通过科学实验方能解决的问题;
- 一个讨论过、研究过,但尚未形成定论的问题;
- 一个可能被你的科学设计而解决的问题。
4.2 研究区
4.3 检验、检验、检验
科研工作的每一步,都需要进行检验,而且是双重检验(Double Check),用不同的两个种策略对同一个数据、结果进行检验。
常见的检验方法(每条都尽量做到:方法独立 + 结论可解释 + 可复现):
- 异常值检验与原因分析:先用统计或规则把“异常”定位出来,再判断它是错误、罕见事件,还是机制变化。
- 案例1(降水):出现负降水或极端尖峰。检查原始站点/再分析产品标记、缺测值编码(如-9999)、时间聚合(小时→日)是否重复累计;若对应台风/暴雨过程且多源一致,可能是“真极端”。
- 案例2(水文):流量突增但降水无响应。检查水位-流量关系曲线是否更新、闸坝调度/融雪过程、传感器漂移;若仅单站突变且邻站不一致,多为数据问题。
- 正确范围检验(物理/定义域):用物理常识或变量定义给出硬边界,超界即优先判为错误或单位问题。
- 案例1(相对湿度):应在0–100%。若出现>100%,常见原因是单位(0–1 vs 0–100)或插值/平滑造成越界。
- 案例2(坡度):坡度为角度时,值应≥0,取值范围090°。坡度也可使用radians函数转换为弧度,取值范围0π。坡度也可使用m/m或者m/km单位,取值范围0~无穷大。
- 案例3(坡向):坡向一般在0–360°,若出现负值或>360,多为投影/算法输出未规范化。坡向也可能是0~π,因此计算后必须明确其可靠单位和取值范围。
- 单位与量级检验:先确认单位,再看量级是否落在“地区/季节/过程”合理区间;量级不对往往比“数值不对”更常见。
- 案例1(降水单位):ERA5常以 m 表示累积降水,站点常用 mm。若把 m 当成 mm,会导致降水小1000倍。 日尺度的均值降水通常为3mm/天量级,月尺度的均值降水通常为100mm/月量级,年尺度的均值降水通常为1000mm/year量级——干旱、半干旱、半湿润、湿润地区的年降雨量标准是<200mm/year, 200-400mm/year, 400-800mm/year, >800mm/year。
- 案例2(径流单位):流量 m³/s 与径流深 mm/day 混用。检查是否做了流域面积归一化与时间尺度换算。
- 手动演算(抽样核对):挑选少量样本点/时段,用纸笔或计算器复算关键步骤,验证公式、索引、聚合逻辑是否正确。
- 案例1(面积加权平均):随机抽3个像元,手算权重与加权和,对比程序输出,能快速发现权重没归一/掩膜错位。
- 案例2(统计指标):手算一次 \(R^2\)、RMSE 或 NSE 的分子分母,常能发现把训练集当测试集或均值基准用错。
- Excel/表格演算(快速交叉核算):用另一套工具复现“同一件事”,尤其适合聚合、透视、分组统计与简单回归。
- 案例1(月尺度汇总):用透视表按月求和/均值,对比脚本输出,能抓到时区、闰日、缺测填补导致的偏差。
- 案例2(异常筛查):用条件格式标出负值/超界/突变点,快速定位问题发生的时间段或空间块。
- 对公式/模型做绘图检验:把公式当函数画出来,看单调性、极限、拐点是否符合预期;同时画“输入→输出”散点看是否有反常形态。
- 案例1(经验公式):某参数化公式应随温度升高而增大,但曲线出现下降段,提示符号写反或变量单位未转换。
- 案例2(关系曲线):水位-流量曲线应基本单调;若出现回折,可能是分段拟合错误或数据混入不同断面时期。
- 因果/相关/逻辑一致性检验:不把相关当因果,但要检查时间顺序、方向性与常识逻辑是否自洽。
- 案例1(降水-径流滞后):降水峰值通常先于径流峰值(存在滞后)。若模型输出径流先于降水,多为时间对齐/时区错误。
- 案例2(物理方向):温度升高通常会提高潜在蒸散;若计算得到PET随温度升高反而降低,优先检查公式与单位。
- 案例3:降水、径流数据统计与模型时间差。 1:00, 2:00, 3:00分别有三个降水和径流数据,其含义通常为0-1:00,1-2:00,2-3:00三个时段中,降水和径流的平均值。水文模型中使用数据时,应在0-1:00时刻使用1:00的降水和径流数据,而不是1:00-2:00的降水和径流数据,即时间差为1小时。换句话说,降水数据报告为1,2,3时数据,但输入给模型需要把时间修改为0,1,2时,模型中才会顺利从0时刻开始使用“记录于数据表的1:00刻的降雨数值”——其虽标记在1:00时刻,但实际代表0-1区间内平均值。
- 物质/能量平衡检验:用守恒约束把结果“卡住”;不要求完全闭合,但要求误差解释得通且量级合理。
- 案例1(水量平衡):多年平均下 \(P \approx ET + Q + \Delta S\)。若 \(ET+Q\) 远大于 \(P\),先查单位、流域边界、重复累计与漏算地下补给项。
- 案例2(能量平衡):净辐射与感热/潜热通量不闭合时,检查通量符号约定、时间平均方式与地表反照率/长波辐射输入。
- 文献/多源数据交叉对比:把结果放回“已知范围”,与区域经验值、公开产品、前人研究做同尺度对照。
- 案例1(径流系数):多年径流系数若接近1或远小于0.01,通常不合理;应对照同气候区流域的典型范围并解释差异来源。
- 案例2(蒸散量):年ET若超过当地多年降水太多,需要解释水汽输入/灌溉/融雪补给等,否则优先怀疑单位与区域掩膜。