Simulation and application of hydrological frequency distribution with insufficient data
-
摘要:传统水文频率分析往往需要大量样本以保证分布的拟合效果,而我国仍有部分站点水文数据记录较少,因此本文提出小样本算法:将Jackknife方法、Bootstrap方法与水文频率分析中传统参数估计方法相结合,得到新的参数估计值,以增强传统水文频率分布的拟合效果.为验证小样本算法的优越性,以泾河流域为例,将8个站点的年最大日降水量作为原样本,利用小样本算法对不同样本量的样本进行多次再抽样,将多组再抽样样本分别进行分布的拟合,得到小样本算法的参数估计值,并通过Kolmogorov-Smirnov检验和RMSE检验结果,验证小样本算法对传统参数估计方法的改进效果.结果表明:1)在小样本情况下,该算法明显优于传统方法的拟合效果,尤其部分站点的Bootstrap方法,使用较少样本量时达到了使用较多样本量的拟合效果; 2)随着样本量的减少,某些站点的传统方法所求分布不能通过检验,而小样本算法可以得到较好的结果.
-
关键词:
- Jackknife方法/
- Bootstrap方法/
- 小样本算法/
- 年最大日降水量
Abstract:Traditional hydrological frequency analysis often requires large numbers of samples to ensure good fitting of distribution, but few hydrological data records are available for some stations in China.This paper studies the small sample algorithm.The Jackknife method, Bootstrap method and traditional parameter estimation methods in hydrological frequency analysis are combined to obtain new parameter estimates to enhance fitting effect of traditional hydrological frequency distribution.The Jinghe River basin is taken as an example to verify advantages and disadvantages of this algorithm.Annual maximum daily precipitation data at 8 stations are selected as original sample.Small sample algorithm is used to re-sample the samples with different sample sizes multiple times, and the resampled samples are fitted with the distribution.Parameter estimation of small sample algorithm is obtained after parameter optimization.Kolmogorov-Smirnov (K-S) test and RMSE test are used to verify improvement of small sample algorithm upon traditional parameter estimation method.The fitting effect of small sample algorithm is markedly better than traditional algorithm in cases of small sample size.The fitting effect of Bootstrap for small samples is almost the same as traditional parameter estimation method using larger sample sizes.When the sample size at some stations is small, the distribution obtained by the traditional method cannot pass the K-S test, but the small sample algorithm can get better results. -
表 1各站点数据概况
站点 样本容量 最小值 最大值 中位数 平均值 定边 64 10.6 107.4 37.25 40.28281 吴旗 64 13.8 113.4 47.50 52.06093 固原 63 17.6 98.1 39.50 44.61905 环县 63 19.6 108.7 44.60 48.62381 西峰 69 26.0 115.9 51.50 55.07536 长武 63 22.1 142.2 50.80 54.20635 武功 66 20.6 140.8 54.85 59.84394 耀县 58 23.2 96.5 46.95 52.32069 表 2各站点不同分布K-S检验和RMSE检验结果对比
站点 参数 定边 吴旗 固原 环县 西峰 长武 武功 耀县 正态分布 P 0.50 0.35 0.25 0.29 0.46 0.05 0.02 0.13 RMSE 0.0547 0.0511 0.0621 0.0589 0.0537 0.0800 0.0747 0.0518 logistic分布 P 0.70 0.64 0.44 0.58 0.49 0.68 0.24 0.30 RMSE 0.0324 0.0355 0.0556 0.0488 0.0376 0.0386 0.0505 0.0459 GEV分布 P 0.98 0.92 0.65 0.75 0.84 0.79 0.61 0.63 RMSE 0.0182 0.0222 0.0411 0.0308 0.0319 0.0274 0.0290 0.0318 P-Ⅲ分布
(矩法估计)P 0.95 0.91 0.54 0.76 0.93 0.65 0.63 0.49 RMSE 0.0268 0.0238 0.0428 0.0344 0.0252 0.0421 0.0340 0.0328 P-Ⅲ分布
(极大似然估计)P 0.79 0.88 0.65 0.98 0.57 0.34 0.35 0.67 RMSE 0.0276 0.0279 0.0339 0.0241 0.0294 0.0465 0.0434 0.0287 P-Ⅲ分布
(线性矩估计)P 0.94 0.81 0.81 0.93 0.22 0.64 0.78 0.74 RMSE 0.0194 0.0224 0.0346 0.0246 0.0256 0.0390 0.0326 0.0278 P-Ⅲ分布
(概率权重法)P 0.94 0.81 0.81 0.93 0.22 0.64 0.78 0.74 RMSE 0.0194 0.0224 0.0346 0.0246 0.0256 0.0390 0.0326 0.0278 表 33个站点不同方法K-S检验和RMSE检验结果对比
方法 矩法估计 极大似然估计 线性矩估计 概率权重法 P RMSE P RMSE P RMSE P RMSE 武功 30个样本 0.07 0.0735 — — — — — — Jackknife方法 0.07 0.0726 0.62 0.0417 0.10 0.0780 0.10 0.0780 Bootstrap方法1 0.19 0.0571 0.66 0.0397 0.08 0.0779 0.12 0.0690 Bootstrap方法2 0.66 0.0414 0.73 0.0348 0.45 0.0510 0.23 0.0585 西峰 30个样本 0.23 0.0586 — — 0.22 0.0589 0.22 0.0589 Jackknife方法 0.56 0.0513 0.32 0.0515 0.45 0.0517 0.45 0.0517 Bootstrap方法1 0.42 0.0468 0.53 0.0424 0.28 0.0526 0.25 0.0522 Bootstrap方法2 0.31 0.0559 0.30 0.0540 0.37 0.0607 0.33 0.0575 定边 30个样本 0.07 0.1165 0.07 0.1142 — — — — Jackknife方法 0.50 0.0597 0.11 0.1043 0.07 0.1124 0.07 0.1124 Bootstrap方法1 0.69 0.0435 0.91 0.0303 0.66 0.0447 0.82 0.0358 Bootstrap方法2 0.16 0.0808 0.34 0.0725 0.36 0.0559 0.45 0.0572 表 45个站点不同方法K-S检验和RMSE检验结果对比
方法 矩法估计 极大似然估计 线性矩估计 概率权重法 P RMSE P RMSE P RMSE P RMSE 环县 30个样本 0.18 0.0537 0.27 0.0562 0.22 0.0564 0.22 0.0564 Jackknife方法 0.25 0.0485 0.29 0.0545 0.26 0.0512 0.26 0.0512 Bootstrap方法1 0.21 0.0512 0.54 0.0328 0.66 0.0358 0.67 0.0364 Bootstrap方法2 0.19 0.0553 0.53 0.0398 0.44 0.0463 0.31 0.0464 吴旗 30个样本 0.86 0.0279 0.53 0.0338 0.68 0.0293 0.68 0.0293 Jackknife方法 0.79 0.0277 0.59 0.0316 0.91 0.0246 0.91 0.0246 Bootstrap方法1 0.95 0.0262 0.97 0.0213 0.88 0.0218 0.92 0.0213 Bootstrap方法2 0.89 0.0331 0.97 0.0241 0.82 0.0277 0.94 0.0247 固原 30个样本 0.59 0.0477 0.29 0.0475 0.45 0.045 0.45 0.045 Jackknife方法 0.54 0.0475 0.32 0.0453 0.71 0.0388 0.71 0.0388 Bootstrap方法1 0.72 0.0457 0.86 0.0355 0.68 0.0383 0.81 0.0367 Bootstrap方法2 0.35 0.0569 0.63 0.0379 0.77 0.0399 0.82 0.0383 长武 30个样本 0.23 0.0615 0.24 0.06 0.30 0.0578 0.30 0.0578 Jackknife方法 0.35 0.0542 0.50 0.0465 0.66 0.0368 0.66 0.0368 Bootstrap方法1 0.84 0.0340 0.63 0.0289 0.86 0.0316 0.89 0.0318 Bootstrap方法2 0.70 0.0441 0.79 0.0370 0.71 0.0435 0.74 0.0385 耀县 30个样本 0.73 0.0374 0.60 0.0392 0.62 0.0417 0.62 0.0417 Jackknife方法 0.80 0.0322 0.72 0.0336 0.84 0.0304 0.84 0.0304 Bootstrap方法1 0.76 0.0289 0.80 0.0278 0.85 0.0292 0.70 0.0285 Bootstrap方法2 0.85 0.0368 0.82 0.0302 0.84 0.0357 0.83 0.0326 表 5各站点样本量为20时不同方法RMSE检验结果对比
站点 方法 矩法估计 极大似然估计 线性矩估计 概率权重法 定边 20个样本 0.0956 0.0993 0.1079 0.1079 Jackknife方法 0.0772 0.0911 0.0505 0.0505 Bootstrap方法1 0.0282 0.0364 0.0269 0.0364 Bootstrap方法2 0.0283 0.0647 0.0186 0.0352 吴旗 20个样本 0.0423 0.0552 0.0479 0.0479 Jackknife方法 0.0406 0.0537 0.0280 0.0280 Bootstrap方法1 0.0235 0.0247 0.0271 0.0372 Bootstrap方法2 0.0226 0.0248 0.0272 0.0371 固原 20个样本 0.0556 0.0361 0.0438 0.0438 Jackknife方法 0.0475 0.0666 0.0378 0.0378 Bootstrap方法1 0.0447 0.0326 0.0331 0.0359 Bootstrap方法2 0.0472 0.0345 0.0339 0.0342 环县 20个样本 0.0376 0.0398 0.0359 0.0359 Jackknife方法 0.0562 0.0376 0.0263 0.0263 Bootstrap方法1 0.0367 0.0244 0.0241 0.0267 Bootstrap方法2 0.0504 0.0283 0.0311 0.0289 西峰 20个样本 0.0753 0.0717 0.0740 0.0740 Jackknife方法 0.0686 0.0679 0.0629 0.0629 Bootstrap方法1 0.0618 0.0551 0.0435 0.0445 Bootstrap方法2 0.0804 0.0697 0.0708 0.0576 长武 20个样本 0.0501 0.0492 0.0452 0.0452 Jackknife方法 0.0377 0.0320 0.0450 0.0450 Bootstrap方法1 0.0368 0.0267 0.0298 0.0297 Bootstrap方法2 0.0462 0.0359 0.0384 0.0399 武功 20个样本 0.0342 0.0409 — — Jackknife方法 0.0342 0.0405 0.0604 0.0604 Bootstrap方法1 0.0322 0.0314 0.0462 0.0388 Bootstrap方法2 0.0347 0.0385 0.0505 0.0374 耀县 20个样本 0.0559 0.0524 0.0491 0.0491 Jackknife方法 — 0.0517 0.0470 0.0470 Bootstrap方法1 0.0482 0.0465 0.0470 0.0470 Bootstrap方法2 0.0574 0.0464 0.0460 0.0479 表 6各站点样本量为10时不同方法RMSE检验结果对比
站点 方法 矩法估计 极大似然估计 线性矩估计 概率权重法 定边 10个样本 0.0652 — — — Jackknife方法 0.0606 0.0382 0.0440 0.0440 Bootstrap方法1 0.0359 0.0235 0.0261 0.0366 Bootstrap方法2 0.0346 0.0242 0.0483 0.0352 吴旗 10个样本 0.0667 — — — Jackknife方法 0.0693 0.0424 — — Bootstrap方法1 0.0253 0.0251 0.0293 0.0324 Bootstrap方法2 0.0234 0.0323 0.0367 0.0513 固原 10个样本 — — — — Jackknife方法 — — — — Bootstrap方法1 0.0481 0.0508 0.0377 0.0321 Bootstrap方法2 0.0436 0.0535 0.0364 0.0368 环县 10个样本 — — — — Jackknife方法 — — — — Bootstrap方法1 0.0584 0.0292 0.0429 0.0732 Bootstrap方法2 0.0635 0.0311 0.0788 0.0800 西峰 10个样本 0.0545 0.0445 0.0461 0.0461 Jackknife方法 0.0399 0.0576 0.0311 0.0311 Bootstrap方法1 0.0525 0.0352 0.0327 0.0366 Bootstrap方法2 0.0682 0.0573 0.0398 0.0489 长武 10个样本 — — — — Jackknife方法 0.0968 0.0664 — — Bootstrap方法1 0.0884 0.0510 0.0642 0.0524 Bootstrap方法2 0.0933 0.0643 0.0661 0.0604 武功 10个样本 — — 0.0708 0.0708 Jackknife方法 — — 0.0622 0.0622 Bootstrap方法1 — — 0.0632 0.0324 Bootstrap方法2 0.0744 — 0.0392 0.0457 耀县 10个样本 — — 0.065 0.065 Jackknife方法 0.0764 0.0782 0.0562 0.0562 Bootstrap方法1 0.0783 0.0842 0.0794 0.0719 Bootstrap方法2 0.0910 0.0929 0.0777 0.0778 -
[1] IPCC. Climate change 2021: the physical science basis[M]. Cambridge: Cambridge University Press, 2021 [2] DUMRONGROJWATTHANA P,LACOMBE G,TRÉBUIL G. Increased frequency of extreme rainfall events threatens an emblematic cultural coastal agroecosystem in southeastern Thailand[J]. Regional Environmental Change,2022,22(2):1 [3] 马嘉忆,董增川,蒋飞卿,等. 城镇化背景下太湖流域极端降雨时空演变特征[J]. 水电能源科学,2022,40(3):1 [4] 孙忠保,程先富,张强,等. 1960−2014年皖江地区极端降水事件时空特征研究[J]. 必威精装版app官方下载苹果版 (自然科学版),2018,54(6):772doi:10.16360/j.cnki.jbnuns.2018.06.012 [5] 应急管理部新闻宣传司. 应急管理部发布2021年8月全国自然灾害情况[J]. 中国减灾,2021(19):7 [6] 慎璐璐,杨艳芬,吴晶,等. 黄河流域极端气候事件时空变化规律[J]. 水土保持研究,2022,29(2):231doi:10.3969/j.issn.1005-3409.2022.2.stbcyj202202034 [7] QIAN L X,ZHAO Y,YANG J H,et al. A new estimation method for copula parameters for multivariate hydrological frequency analysis with small sample sizes[J]. Water Resources Management,2022,36(4):1141doi:10.1007/s11269-021-03016-w [8] SINGH V P,STRUPCZEWSKI W G. On the status of flood frequency analysis[J]. Hydrological Processes,2002,16(18):3737doi:10.1002/hyp.5083 [9] YUAN J H,EMURA K,FARNHAM C,et al. Frequency analysis of annual maximum hourly precipitation and determination of best fit probability distribution for regions in Japan[J]. Urban Climate,2018,24:276doi:10.1016/j.uclim.2017.07.008 [10] 胡辰,夏军,佘敦先,等. 布尔分布在辽宁省西部半干旱地区水文频率分析中的应用[J]. 水文,2019,39(1):20doi:10.3969/j.issn.1000-0852.2019.01.004 [11] 于岚岚. 不同频率分布线型在辽西水文频率分析对比[J]. 水利规划与设计,2019(9):24doi:10.3969/j.issn.1672-2469.2019.09.008 [12] 姚蕊,孙鹏,张强,等. 基于Copula淮河流域水文干旱频率分析及影响研究[J]. 必威精装版app官方下载苹果版 (自然科学版),2019,55(6):755 [13] 张浪,贺中华,夏传花,等. 基于河流出水量的区域水文干旱特征及其水文频率分析:以黔中水利枢纽工程区为例[J]. 科学技术与工程,2021,21(27):11480doi:10.3969/j.issn.1671-1815.2021.27.005 [14] 杜懿,麻荣永,赵立亚. 水文频率分析计算研究:以郁江南宁站为例[J]. 广西水利水电,2017(6):12 [15] 王鹏飞, 王双银, 王晶, 等. 不同选样方法下短历时暴雨频率分布线型优选[J/OL]. 人民黄河 (2022-07-27) [2022-08-15]. http://kns.cnki.net/kcms/detail/41.1128.TV.20220727.1041.006.html [16] 白龙,吴滨,杨丽慧,等. 基于多种拟合方法的福州长短历时暴雨强度公式研究[J]. 海峡科学,2020(9):12doi:10.3969/j.issn.1673-8683.2020.09.004 [17] 冯蕴雯,黄玮,吕震宙,等. 极小子样试验的半经验评估方法[J]. 航空学报,2004,25(5):456doi:10.3321/j.issn:1000-6893.2004.05.006 [18] 李永华,张月,石姗姗. 基于极小子样的某列车齿轮箱箱体疲劳寿命可靠性评估[J]. 中国工程机械学报,2020,18(2):165 [19] 魏德永,阮永芬,孟涛,等. 基于Bayes-Bootstrap法确定土力学参数及可靠性分析[J]. 西安建筑科技大学学报(自然科学版),2021,53(5):706 [20] 佐磊,胡小敏,何怡刚,等. 小样本数据处理的加速寿命预测方法[J]. 电子测量与仪器学报,2020,34(11):26 [21] 孙慧玲,胡伟文,杨美妮. Bayes Bootstrap方法在小样本参数估计中的应用[J]. 计算机与数字工程,2016,44(5):788doi:10.3969/j.issn.1672-9722.2016.05.002 [22] 傅惠民,李子昂,付越帅. 电子产品小样本可靠性评估与更新方法[J]. 机电产品开发与创新,2021,34(4):1doi:10.3969/j.issn.1002-6673.2021.04.001 [23] 罗修辉,韦程东,王一茸. 小样本下指数分布可靠性参数估计方法的比较[J]. 统计与决策,2018,34(1):14doi:10.13546/j.cnki.tjyjc.2018.01.003 [24] 李政仪,邱春荣,宫二玲. 一种小样本数据条件下的可靠性评估方法[J]. 长沙民政职业技术学院学报,2021,28(2):131doi:10.3969/j.issn.1671-5136.2021.02.035 [25] 黄玮,冯蕴雯,吕震宙. 极小子样试验的虚拟增广样本评估方法[J]. 西北工业大学学报,2005,23(3):384doi:10.3969/j.issn.1000-2758.2005.03.024 [26] 李若茜,肖霞,梅能,等. 基于Bayes和Bootstrap方法的智能电表可靠性评估[J]. 南方电网技术,2022,16(3):76 [27] 钱龙霞,王红瑞,张韧,等. 小样本观测资料条件下的耿贝尔极值水文频率分析模型[J]. 工程科学与技术,2019,51(5):41 [28] LI M R,LI X D,AO T Q. Comparative study of regional frequency analysis and traditional at-site hydrological frequency analysis[J]. Water,2019,11(3):486doi:10.3390/w11030486 [29] 雷庆文,闫磊,鲁东阳,等. 基于粒子群算法的P-Ⅲ型分布极大似然估计研究[J]. 中国农村水利水电,2022(7):128 [30] 刘薇,常振海. 自助法再生样本的获取方法研究[J]. 齐齐哈尔大学学报(自然科学版),2012,28(4):78