打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
基于数据挖掘技术的滑带土抗剪强度预测
基于数据挖掘技术的滑带土抗剪强度预测

基于数据挖掘技术的滑带土抗剪强度预测*

渠孟飞 谢 强 李朝阳 贺建军

(西南交通大学地球科学与环境工程学院 成都 610031)

摘 要:利用数据挖掘技术对三峡库区重庆段滑带土抗剪强度特征值进行预测研究。利用CHAID算法与相关性分析进行数据预处理。根据CHAID算法分类结果,将滑坡按照原岩的沉积环境进行分类。在分类的基础上,根据各定量指标与抗剪强度的Pearson相关系数筛选滑带土抗剪强度的影响因素。相关性分析结果表明,原岩为不同沉积环境的滑坡其天然状态下内摩擦角的影响因素不同;天然状态下的黏聚力与各定量因素相关性均不高。将相关性高的指标作为输入变量,建立数据挖掘模型。研究结果表明,挖掘出的知识具有良好的适用性。

关键词:数据挖掘 抗剪强度预测 相关性分析 三峡库区

0 引 言

滑带土抗剪强度取值是滑坡稳定性研究和滑坡防治工程中的重要环节,也是很多工程技术人员关心的问题。一般情况下,滑带土抗剪强度的确定方法是原位试验、室内试验和反演分析相结合,这需要技术人员具有一定的实践经验,且花费较大。因此,许多学者试图研究抗剪强度与滑带土其他物理力学指标、矿物成分等之间的关系,以期通过这些指标预测抗剪强度。国内外的学者们(李妥德等,1979;Hirata et al.,1990;周平根,1998;吴香根,2000;Lee et al.,2003;Tiwari et al.,2005;Goktepe et al.,2008;魏玉峰等,2011)得出了一定条件下不同指标与抗剪强度的关系。对于三峡库区重庆段的滑坡,李维树等(2006)、李远耀等(2008)、魏玉峰等(2011)、Wen et al.(2007)研究了影响滑带土抗剪强度的因素,但并未给出预测抗剪强度的模型用于工程实际。本文拟利用数据挖掘技术,通过对三峡库区(重庆段)地质灾害数据库系统中万州区、云阳县和奉节县一些重要的、大型的滑坡治理中积累的大量的、宝贵的岩土数据进行挖掘,找出影响滑带土抗剪强度特征值的主要因素(定性的与定量的),进而预测抗剪强度特征值,为后续的滑坡治理工作提供参考。

1 三峡库区重庆段滑坡特征

收集的滑坡主要分布于万州、奉节和云阳一带,为了合理地管理和分析这些宝贵的数据,中国建筑西南勘察设计院和西南交通大学(2014)联合开发了三峡库区(重庆段)地质灾害数据库系统,可为后续的数据挖掘工作提供数据源支持。通过系统的统计分析功能,得到三峡库区重庆段滑坡的基本特征。

重庆市构造-沉积演化史中,从早三叠世到晚三叠世发生海侵到海退过程,沉积了一套海相的红色复陆建造、异地碳酸盐建造和膏盐蒸发岩建造;侏罗纪,晚三叠世末至早侏罗世初,台区海水全部退出,气候转为炎热干旱,成为大型红色内陆盆地,沉积了一套陆相的石英砂岩、泥岩和多韵律砂泥岩。本次收集的滑坡发育于侏罗系和三叠系地层。

根据滑体物质组成及滑动面的性质可将三峡库区重庆段的滑坡分为沿岩土界面滑动的堆积层滑坡、破碎岩体滑坡和岩质滑坡3类,其中堆积层滑坡为主要类型。堆积层滑坡滑带土的显著特征是:一般为粉质黏土或黏土,多数含有一定量的碎石。

2 数据的选取与预处理

数据挖掘(Data mining)是一个利用各种方法,从海量的有噪声的凌乱数据中(一般是存储在数据库系统中),提取隐含和潜在的对决策有用的信息和模式的过程。是一种集合了数据库技术、机器学和统计学的技术。完整的数据挖掘过程包括数据源的建立和管理、从数据源中提取数据、数据预处理、模型建立、模型评估以及模型应用等一系列步骤。

数据挖掘的首要任务是数据的选取与预处理。利用计算机和统计方法对数据进行预先处理可为后续的数据挖掘建模奠定良好的数据基础。

2.1 定性因素分析

CHAID是卡方自动交互诊断器(Chi-squared Automatic Interaction Dector)的简称。相对于其他分类算法,CHAID是从统计显著性检验角度确定当前最佳分组变量和分割点。

选取原岩的地层(具体到组)、滑体土成因类型、滑面贯通程度3个定性指标作为输入数据,滑带土天然状态内摩擦角(φ)、天然状态黏聚力(C)作为输出目标,分别建立CHAID模型。模型计算结果表明,滑坡按照原岩的沉积环境不同共分为两类,陆相(侏罗系)的和海相的(三叠系),未有按照其他指标分类,表明φ和C受其他定性因素的影响较小。图1、图2分别为原岩为陆相沉积环境(侏罗系)与海相沉积环境(三叠系)的滑坡的滑带土C和φ的分布直方图。滑带土C均值分别为20.63kPa和24.24kPa,φ均值分别为12.94°和19.46°,差别较大。

2.2 定量因素分析

对于自变量和因变量均为数值型的数据,采用Pearson相关系数判定相关性,对两个变量的总体的相关系数r进行t检验。一般情况:

时,可视为两个变量之间高度相关;
时,可视为中度相关;
时,视为低度相关;
时,说明两个变量之间的相关程度极弱,可视为不相关。

根据实际工程经验和以往的研究成果(Hirata et al.,1990;周平根,1998;吴香根,2000;Lee etal.,2003;刘小丽等,2004;李维树等,2006;Goktepe et al.,2008;李远耀等,2008;魏玉峰等,2011;Wen et al.,2007),选取滑面平均坡度(α)、滑带土碎石含量(GC)、室内试验得到的天然含水率(w)和塑性指数(IP)作为滑带土抗剪强度的影响因素,分析它们与C和φ的相关性。

表1为原岩为侏罗系地层和三叠系地层滑坡的各项指标与抗剪强度相关性分析结果。

由相关性分析结果可知,黏聚力与各项指标线性相关程度弱。因此进一步做各项指标与黏聚力的曲线估计,选取线性、二次项、对数和指数模型。各模型的决定系数R2系数均较小。

图1 原岩为不同沉积环境的滑带土天然状态黏聚力分布直方图
Fig.1 Histogram of C of slip soil of bed rock strata of different sedimentary environment a.侏罗系地层;b.三叠系地层

图2 原岩为不同沉积环境的滑带土天然状态内摩擦角分布直方图
Fig.2 Histogram ofφof slip soil of bed rock strata of different sedimentary environment a.侏罗系地层;b.三叠系地层

表1 相关系数r与假设检验概率p值
Table 1 The correlation coefficient and probability of p value

*在0.05水平上(双侧)相关;**在0.01水平上(双侧)相关

α GC w IPr 0.541*0.198-0.624**-0.835**侏罗系φp 0.025 0.447 0.007 0.000 C r 0.454-0.343 0.218-0.024 p 0.067 0.177 0.4 0.928 r 0.910**0.832**-0.642**-0.175三叠系φp 0.000 0.003 0.045 0.629 C r-0.21-0.058 0.243-0.379 p 0.954 0.874 0.499 0.28

原岩为侏罗系地层的滑坡滑带土天然状态下内摩擦角与滑面平均坡度中度相关,与天然状态含水率和塑性指数高度相关,与碎石含量不相关。原岩为三叠系地层的滑坡滑带土天然状态下内摩擦角与滑面平均坡度、碎石含量高度相关;与天然含水率中度相关;与塑性指数不相关。可知原岩为不同沉积环境的滑坡,其天然状态下内摩擦角的影响因素不同,应分别建立数据挖掘模型。

3 内摩擦角数据挖掘模型的建立

在收集到的44个滑坡中,由于部分滑坡数据缺失,符合模型建立所需数据的滑坡共有30个,其中28个(发育于侏罗系地层的18个,三叠系地层的10个)为训练样本,2个为验证样本。

能用于回归预测的数据挖掘模型主要有:人工神经网络、支持向量机、决策树、多元回归等,对比不同模型的预测精度和工程实用性,最终选取多元回归模型。

3.1 原岩为三叠系地层的滑坡

采用逐步回归法建立多元回归模型,根据相关性分析结果确定输入变量,因此输入变量为滑面平均坡度、碎石含量、天然含水率,原始数据(表2)。

表2 建模原始数据
Table 2 Original data formodel building

名称α/(°)GC/%w/%φ/(°)安渡滑坡28 30 14.05 24黄瓜坪滑坡A1区9 12.5 18.4 12.7黄瓜坪滑坡A2区17 30 19.27 21.6茶土坡滑坡30 25 16.9 22.9水田坝滑坡9 8 24.2 11.7闵家包滑坡1剖面20 15 19.18 18.1闵家包滑坡3剖面30 25 19.26 24.1猴子石滑坡25 22 14.7 21铁合金厂滑坡15 30 19 19三马山老滑坡14 22 23.3 17.07

3.1.1 拟合优度检验

建立了两个回归模型,模型一自变量为α,调整R2为0.806;模型二的自变量为α和GC,调整R2为0.976,表3为模型汇总,可知两个模型的拟合度均较好。

3.1.2 回归模型的显著性检验

置信区间为95%。方差分析结果表明(表4),当回归方程包含不同自变量时,其显著性概率均小于0.05,拒绝总体回归系数均为0的原假设。

3.1.3 回归系数的显著性检验

置信区间为95%。表5为回归系数的显著性检验结果。

模型一:φ=9.565+0.49α。方程常数项与自变量α的显著性水平值均小于0.05。

模型二:φ=6.501+0.349α+0.266 GC。方程常数项与自变量α和GC的显著性水平均小于0.05。

表3 模型汇总
Table 3 Model summary

模型R R2调整R2标准估计的误差1 0.910 0.828 0.806 1.935 2 0.991 0.981 0.976 0.680

表4 方差分析表Table 4 ANOVA result

模型 平方和df均方F Sig.回归144.066 1 144.066 1残差29.958 8 3.745总计174.024 9 38.472 0.000回归170.785 2 85.393 2残差3.239 7 0.463总计174.024 9 184.553 0.000

表5 回归系数显著性检验结果
Table 5 Significance testing result of regression coefficient

模型标准系数Beta t Sig.1(常量)5.72 0.000 α 0.910 6.203 0.000 2(常量)9.120 0.000 0.647 10.431 0.000 GC 0.472 7.599 0.000 α

图3 模型一的拟合值与计算值的拟合曲线
Fig.3 Fitting curve of fitted value and calculated value ofmodel 1

综上所述,可知建立的多元回归模型通过了统计显著性检验。模型一与模型二是恰当的、具有较好的拟合度,均可用来预测。图3和图4分别为模型一和模型二的拟合值与计算值的拟合曲线。

图4 模型二的拟合值与计算值的拟合曲线
Fig.4 Fitting curve of fitted value and calculated value ofmodel 2

3.2 原岩为侏罗系地层的滑坡

采用逐步回归法建立多元回归模型,根据相关性分析结果确定输入变量,因此输入变量为滑面平均坡度、天然含水率、塑性指数,建模原始数据(表6)。

表6 建模原始数据
Table 6 Original data formodel building

名称α/(°)w/%IPφ/(°)二屯坪滑坡10 19.5 11.2 15.85万元纸厂滑坡21 25.16 13.5 13.15支农桥1号滑坡8 26.72 15.21 11支农桥2号滑坡8 26.72 15.21 11.6驸马1号滑坡20 19.58 10.61 16驸马2号滑坡11 19.9 11.27 15驸马3号滑坡8 25.9 11.8 13老窖林滑坡12 21.9 10.47 16.9吴家湾滑坡10 24.21 16.39 11.59隆家湾滑坡10 24.6 13.66 12.98建材厂滑坡12 28.77 14.64 11.16普安新集镇滑坡24 21.6 10.54 18杨家坝H1滑坡10 20.8 10.78 14杨家坝H2滑坡7 20.51 10.69 15.3寂静乡滑坡8 22.83 13.37 12.3铺垭场滑坡5 21.82 12.9 11.52黄家坪滑坡20 28.57 13.97 14.4

3.2.1 拟合优度检验

建立了两个模型,模型一自变量为IP,调整R2为0.677;模型二的自变量为IP和α,调整R2为0.814(表7)。模型二的拟合度优于模型一。

3.2.2 回归模型的显著性检验

对回归模型进行检验,置信区间为95%。检验结果(表8),方差分析结果表明,当回归方程包含不同的自变量时,其显著性概率值均小于0.05,拒绝总体回归系数均为0的假设。

3.2.3 回归系数的显著性检验

对回归系数进行检验,置信区间为95%。表9为回归系数的显著性检验结果。

表7 模型汇总
Table 7 Model summary

模型R R2调整R2标准估计的误差1 0.835 0.697 0.677 1.223 2 0.915 0.837 0.814 0.928

表8 方差分析表Table 8 ANOVA result

模型平方和df均方F sig.回归51.615 1 51.615 1残差22.442 15 1.496总计74.057 16 34.500 0.000回归61.983 2 30.992 2残差12.074 14 0.862总计74.057 16 35.936 0.000

表9 回归系数显著性检验结果
Table 9 Significance testing result of regression coefficient

模型标准系数Beta t Sig.1(常量)12.609 0.000 IP-0.835-5.784 0.000(常量)12.950 0.000 2IP-0.754-6.835 0.000 α0.383 3.467 0.004

模型一:φ=25-0.924 IP。方程常数项与自变量IP的显著性水平值均小于0.05。

模型二:φ=22.615-IP0.835+α0.146。方程常数项、IP与α的系数显著性水平小于0.05。

综上所述,可知建立的多元回归模型通过了统计显著性检验。相对于模型二,模型一的拟合度较差。

图5和图6分别为模型一和模型二的拟合值与计算值的拟合曲线。

4 预 测

数据挖掘模型经检验是有意义的,可用来进行预测。双溪铺滑坡是一堆积层滑坡,位于万州区,原岩的地层为侏罗系中统沙溪庙组,滑带土为粉质黏土夹碎石,滑面平均坡度为15°,碎石含量为20%,天然含水率为22.6,塑性指数为13.4;老房子滑坡是原岩地层为三叠系中统巴东组的堆积层滑坡,位于奉节县,滑带为粉质黏土夹碎石,滑面平均坡度为20°,碎石含量为25%,天然含水率为13.4,塑性指数为12.0。将两个滑坡的相应指标代入到建立的回归模型中,得到预测值,表10为两个模型的预测结果对比,可知对于原岩为不同沉积环境的滑坡,模型二的预测精度较模型一的要高,建议使用模型二进行预测。

图5 模型一的拟合值与计算值的拟合曲线
Fig.5 Fitting curve of fitted value and calculated value ofmodel 1

图6 模型二的拟合值与计算值的拟合曲线
Fig.6 Fitting curve of fitted value and calculated value ofmodel 2

表10 挖掘模型的预测结果
Table 10 Prediction result of regression equation

双溪铺滑坡/(°)老房子滑坡/(°)实际值13.8 20预测值12.58 19.36模型一绝对误差1.22 0.64相对误差/%8 3.2预测值13.58 20.13模型二绝对误差0.22 0.13相对误差1.6 0.6

5 结 论

(1)运用实际工程中大量的数据建立数据库,采用数据挖掘技术对滑带土抗剪强度特征值进行了预测研究。挖掘结果表明,原岩为不同沉积环境下形成的滑坡的滑带土抗剪强度差异较大,且天然状态下内摩擦角的影响因素不同。据此建立的挖掘模型具有较好的预测能力。

(2)三峡库区重庆段的滑坡,原岩为陆相沉积环境(侏罗系)的滑带土天然状态内摩擦角与滑面平均坡度和滑带土塑性指数有较强相关性;原岩为海相沉积环境(三叠系)的滑带土的天然状态内摩擦角与滑面平均坡度和滑带土碎石含量有较强相关性。天然状态黏聚力与各指标相关性均较弱,对其进行预测需进一步研究。

参考文献:

China Southwest Geotechnical Investigation&Design Insitute Co.,Ltd.,Southwest Jiaotong University.2014.Database system of geological disaster of the Three Gorges Reservior:China,2014SR104895[P]. 2014-7-24.

Goktepe A B,Altun S,AltintasG,etal.2008.Shear strength estimation of plastic clayswith statistical and neural approaches[J].Building and Environment,43(5):849~860.

Hirata S,Yao S,Nishida K.1990.Multiple regression analysis between themechanical and physical properties of cohesive soils[J].Soils and Foundation,30(3):91~108.

Lee S J,Lee SR,Kim Y S.2003.An approach to estimate unsaturated shear strength using artificial neural network and hyperbolic formulation[J].Computers and Geotechnics,30(6):489~503.

Li T D,Zhang Y J.1979.Present situation of domestic and overseas studies on residual strength(Landslide Collection(Ⅱ))[M]. Beijing:China Railway Publishing House:8~10.

Li Y Y,Yin K L,Chai B,et al.2008.Study on statistical rule of shear strength parameters of soil in landslide zone in Three Gorges Reservoir area[J].Rock and Soil Mechanisc,29(5):1419~1424.

LiW S,Wu A Q,Ding X L.2006.Study on influencing factors of shear strength parameters of slide zone clay in Three Gorges Reservoir area[J].Rock and Soil Mechanics,27(1):56~60.

Liu X L,Deng JH,LiG T.2004.Shear strength properties of slip soils of landslides:an overview[J].Rock and Soil Mechanics,25(11):1849~1854.

Tiwari B,Marui H.2005.A new method for the correlation of residual shear strength of the soilwithmineralogical composition[J].Journal ofGeotechnicaland Geoenvironmental Engineering,131(9):1139~1150.

Wei Y F,Nie D X,LüS D,et al.2011.Experimental study ondetermining the values of shear strength parameters of soil in sliding zone of large-scale landslide[J].Yellow river,33(7):127~129.

Wen B P,Aydin A,Duzgoren-Aydin N S.2007.Residual strength of slip zones of large landslides in the Three Gorges area,China[J]. Engineering Geology,93(3—4):82~98.

Wu X G.2000.The relationship between the shearing strength of clay in slide zone and slope gradient[J].Journal of Geological Hazards and Environment Prevention,11(2):145~146.

Zhou P G.1998.Estimation method of shear strength of slip zone soils[J].Hydrogeology&Engineering Geology,(6):30~32,58.

中国建筑西南勘察设计研究院有限公司,西南交通大学.2014.三峡库区(重庆段)地质灾害数据库系统:中国,2014SR104895[P]. 2014-7-24.

李妥德,张颖均.1979.国内外滑坡土残余强度的研究现状(滑坡文集(二))[M].北京:中国铁道出版社:8~10.

李远耀,殷坤龙,柴波,等.2008.三峡库区滑带土抗剪强度参数的统计规律研究[J].岩土力学,29(5):1419~1424.

李维树,邬爱清,丁秀丽.2006.三峡库区滑带土抗剪强度参数的影响因素研究[J].岩土力学,27(1):56~60.

刘小丽,邓建辉,李广涛.2004.滑带土强度特性研究现状[J].岩土力学,25(11):1849~1854.

魏玉峰,聂德新,吕生弟,等.2011.大型滑坡滑带土强度参数取值试验研究[J].人民黄河,33(7):127~129.

吴香根.2000.工程滑坡滑带土抗剪强度与地形坡度的关系[J].地质灾害与环境保护,11(2):145~146.

周平根.1998.滑带土强度参数的估算方法[J].水文地质工程地质,(6):30~32,58.

PREDICTION OF SHEAR STRENGTH OF SLIP ZONES USING DATA M INING TECHNOLOGY

QU Mengfei XIE Qiang LIZhaoyang HE Jianjun
(Faculty of Geosciences and Environmental Engineering of Southwest Jiaotong University,Chengdu 610031)

Abstract:The datamining techniques were used to predict shear strength of slip zone soil.In order to define the qualitative and quantitative factors affecting the shear strength,the CHAID(Chi-squared Automatic Interaction Detector)method and correlation analysis were used to pretreat data.According to the result obtained by CHAID method the landslides are classified by sedimentary environment of slip bed.Based on the classification,the influencing factorswere selected in the light of Pearson correlation coefficient.The correlation analysis result shows that the internal friction angle of slip zone is affected by different factors as the slip bed of different sedimentary environment.The cohesive force has no obvious relationship with the factors.Stepwise regression was carried out to establish regression model for internal friction angle.The regression equations are passed statistical test and of good fitting degree and prediction accuracy.The forecast equations for the actual project data have good performances.

Key words:Datamining,Shear strength prediction,Correlation analysis,Three Gorges area

中图分类号:TU43

文献标识码::A

DOI:10.13544/j.cnki.jeg.2016.06.009

*收稿日期:2015-10-10;

收到修改稿日期:2016-02-02.

第一作者简介:渠孟飞(1988-),女,博士生,主要从事地质灾害防治研究.Email:793147928@qq.com

通讯作者简介:谢强(1957-),男,教授,博士生导师,主要从事岩体力学与工程研究.Email:civil1301@swjtu.cn

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
南极洲地质
涪陵自然环境
土木工程专业英语词汇(上)
重庆地貌
秦皇岛地质地貌实习报告
浙江湖州长兴金钉子远古世界景点介绍(附图)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服