华南农业大学林学与风景园林学院杨文越课题组《Travel Behaviour and Society》最新发文:居民绿地使用行为模式影响因素及其非线性效应
导读:论文基于潜在剖面分析方法识别出3类居民绿地行为模式,通过可解释机器学习模型探究居民个人社会经济属性、感知绿地可达性和绿地特征、社区绿度以及邻近绿地可达性因素对居民绿地使用模式的影响因素和非线性效应。研究结论可为城市规划者提供指导与决策依据,确保绿地的包容性和公平利益,促进更可持续和包容的城市绿色环境。
题目:The influencing factors and nonlinear effects on residents’ green space usage behavior patterns: An interpretable machine learning modelling approach期刊:Travel Behaviour and Society
时间:2026.4
作者:Wenyue Yang, Yani Chen
论文链接:https://www.sciencedirect.com/science/article/pii/S2214367X25002418
摘要
基于2021年在广州开展的问卷调查数据,本研究采用潜在剖面分析(Latent Profile Analysis,LPA)方法对居民绿地使用行为模式进行分类。之后,通过可解释机器学习模型(XGBoost-SHAP)分析影响这些模式的因素及其非线性效应。结果表明,居民绿地使用行为可分为“近距离-短时长-高频率”“中等距离-中等时长-常规频率”和“远距离-长时长-低频率”3种模式。居民个人社会经济属性、感知绿地可达性、感知绿地特征、社区绿度以及邻近绿地可达性在这3类绿地使用模式中发挥着不一样的作用。其中,感知绿地可达性是最主要影响因素。拥有较高感知绿地可达性的居民倾向于“近距离-短时长-高频率”的绿地使用行为模式,而感知绿地可达性较低的居民倾向于“远距离-长时长-低频率”模式。在感知绿地特征中,绿地安全性和植物多样性越高,会驱使居民选择“近距离-短时长-高频率”模式;而中等水平的绿地美观性和动物多样性会驱使居民选择“中等距离-中等时长-常规频率”模式;绿地安全性和植物多样性越低、动物多样性越高,则驱使居民选择“远距离-长时长-低频率”模式。此外,社区绿度和邻近绿地可达性与居民绿地使用行为模式之间存在非线性关系。
绿地为居民提供户外休闲的活动和社交场所,这些互动有助于提升居民身体活动水平与个人心理健康,促进人们社会健康和福祉。居民绿地使用行为作为居民日常生活中的关键方面,常被用作评估居民生活质量的关键指标。此前,大量研究探究了个人社会经济属性对居民绿地使用行为的影响,且个人对绿地的态度和偏好也会影响其使用行为。然而,全面评估这些因素是如何影响绿地使用行为模式的研究仍然相对有限。
多尺度的绿地环境特征是影响居民绿地使用行为的另一个关键因素。此外,社区建成环境,包括绿地与住宅区的邻近程度、绿地设施质量等,也在居民绿地使用模式中发挥着重要的作用。然而,大多数现有研究假设这些环境和可达性因素与绿地使用行为之间存在线性关系,忽视了可能存在的非线性关系。XGBoost是一种基于梯度提升决策树(GBDT)的集成机器学习算法,它以高效、灵活且准确的模型解决分类问题。结合XGBoost和SHAP的可解释机器学习模型可用于分析不同绿地使用行为模式影响因素的差异及其非线性效应。
为此,本研究基于潜在剖面分析和可解释机器学习模型(XGBoost-SHAP),探究各影响因素与居民绿地使用行为之间的非线性关系。试图回答以下研究问题:
(1)居民社会经济属性、感知绿地可达性、感知绿地特征、社区绿度以及邻近绿地可达性在不同绿地使用行为模式中的影响有何差异?(2)社区绿度和邻近绿地可达性对居民绿地使用行为产生怎样的非线性影响?
本研究结论可为城市规划者提供关键指导,使他们能够在绿地空间分布和功能设计方面作出更具战略性的决策。而且,政策制定者可利用研究结果制定针对特定居民子群体的政策,从而确保绿地包容性和公平利益,促进更可持续和包容的城市绿色环境。
3.1 研究区域
本研究区域涵盖越秀、荔湾、海珠、白云、天河、黄埔和番禺七个主要城区,共收集有效问卷1265份(图1)。
3.2 研究数据及变量
问卷调查收集了受访者的社会经济属性,包括年龄、性别、是否拥有16岁以下儿童、教育水平、工作状况、拥有汽车情况以及家庭人均月收入。此外,问卷还收集了居民访问绿地频率、每次访问时长以及住所与最常访问绿地之间的距离数据,以及居民感知绿地可达性和感知绿地特征(植物多样性、动物多样性、整洁性、设施多样性、安全性和美观性)(表1)。
表1 样本社会经济属性、绿地使用行为、感知绿地可达性及感知绿地特征的数据分布


本研究进一步测度了社区绿度和邻近绿地可达性。社区绿度通过每位受访者所在社区内归一化差植被指数(NDVI)的平均值来量化。同时,本研究利用基于百度地图LBS开放平台开发的出行O-D点智能查询系统(TIQS)计算每个样本住宅与其最近绿地之间的最短步行距离。
3.3 潜在剖面分析(LPA)
本研究采用潜在剖面分析(LPA)对居民绿色空间使用模式进行分类,基于住所与最常访问绿地之间的距离数据、绿地访问时长和绿地访问频率等变量。
3.4 可解释机器学习模型(XGBoost-SHAP)
影响因素和非线性效应对不同模式的居民绿地使用行为可能存在差异。因此,本研究采用结合XGBoost和SHAP的可解释机器学习模型,分析社会经济属性、感知绿地可达性以及感知绿地特征对这些模式的相对重要性和非线性效应。30%的样本被随机选中组成训练集,其余样本组成测试集。本研究通过网格搜索方法确定 XGBoost 模型的超参数最优组合。
4.1 居民绿地使用行为模式的分类
基于LPA结果识别出三种居民绿地使用行为模式:“近距离-短时长-高频率”(n = 775)、“中等距离-中等时长-常规频率”(n = 354)和“远距离-长时长-低频率”(n = 136)(图2)。
图2 居民绿地使用行为三种潜在剖面的分布特征
4.2 XGBoost模型结果
研究训练的XGBoost模型准确率达到78.65%,展现出较强的整体预测表现。为详细评估模型表现,使用混淆矩阵将模型预测结果与三种绿地使用行为模式的实际结果进行比较(图3)。预测三种绿地使用行为模式的精度分别为76.57%、72.69%和86.64%,表明模型对每种绿地使用行为模式的预测表现较好。
图3 三种绿地使用行为模式的混淆矩阵
4.3 居民绿地使用行为模式的影响因素
本研究展示了这些模式中每个解释变量的预测系数(图4)。其中内圈为各影响因素对这三种绿地使用行为模式的相对贡献。
图4 各影响因素对3类绿地使用行为模式影响的系数与相对贡献
4.3.1 个人社会经济属性对绿地使用行为模式的影响
图5为SHAP摘要点图,展示了个人社会经济属性、感知绿地可达性、感知绿地特征、社区绿度及邻近绿地可达性对3种绿地使用行为模式的影响。
图5 各影响因素对3类绿地使用行为模式的SHAP摘要点图
结果显示,在个人社会经济属性中,居民教育水平是影响“近距离-短时长-高频率”(0.184)和“远距离-长时长-低频率”(0.335)这两种模式的关键因素。然而,它对“中等距离-中等时长-规律频率”模式的影响相对较小(0.112)(图4)。拥有学士学位及以上学历者更倾向于采用“近距离-短时长-高频率”模式,而拥有大专及以下学历者则偏好“远距离-长时长-低频率”模式(图5)。此外,家庭人均月收入是影响“中等距离-中等时长-常规频率”模式的主要社会经济属性因素(0.167)。它对此模式的影响超过教育水平的影响。
性别与是否拥有16岁以下儿童在“近距离-短时长-高频率”模式和“远距离-长时长-低频率”模式的影响预测系数明显。然而,它们对“中等距离-中等时长-常规频率”模式的影响微乎其微,系数为0.033 和0.033。更具体地说,女性居民和有16岁以下子女的家庭更倾向于“近距离-短时长-高频率”模式,而男性和无16岁以下儿童的人则倾向于“远距离-长时长-低频率”模式。此外,就业状态是影响“近距离-短时长-高频率”模式的关键因素,预测系数为 0.110(图4)。失业或退休者更倾向于采用此模式(图5a)。
4.3.2 居民感知的绿地可达性与绿地特征的影响
感知绿地可达性是影响居民3种不同行为模式的最重要因素(0.824、0.336 和0.513)。认为绿地“非常方便可达”或“方便可达”的居民更倾向于“近距离-短时长-高频率”的模式。相反,认为“一般可达”或“不便可达”的居民更倾向于“中等距离-中等时长-常规频率”的模式。当被认为“非常不可达”时,居民倾向于选择“远距离-长时长-低频率”模式(图5)。
居民感知绿地特征对3种行为模式的影响各不相同。认为绿地安全程度高且植物多样性适中的居民更可能采用“近距离-短时长-高频率”模式(图5a);相反,认为绿地动物多样性低至中等水平的居民倾向于采用“中等距离-中等时长-规律频率”的模式(图5b);植物多样性低、安全性低以及附近绿地动物多样性过高,会促使居民“远距离-长时长-低频率”的绿地使用行为模式(图5c)。
4.4 社区绿度和邻近绿地可达性的非线性效应
社区绿度和邻近绿地可达性是影响居民绿地使用行为模式的两个主要因素。此外,它们与3种绿地使用行为模式之间存在显著且复杂的非线性关系(图6)。
图6 社区绿度、居住地与邻近绿地的最短距离与3类绿地使用行为模式SHAP依赖图
当社区绿度在0.1到0.25之间时,图6a中的SHAP值大于0,表明社区绿度在此区间内的居民更倾向于“近距离-短时长-高频率”的使用模式,且社区绿度越小,出现这种模式的可能性越高。当社区绿度值在0.25到0.5之间时,驱使居民表现出“中等距离-中等时长-常规频率”和“远距离-长时长-低频率”的行为模式(SHAP值>0)。然而,当社区绿度值超过0.5时,居民再次表现出“近距离-短时长-高频率”模式(图6a),且值越大,可能性越高。
邻近绿地可达性与绿地使用模式之间也存在类似的非线性效应。当距离在500米以内或超过2000米时,居民更倾向于“近距离-短时长-高频率”模式(图6d)。相反,当距离在500-1000米范围内时,居民则选择“中等距离-中等时长-常规频率”的行为模式(图6e)。当距离在1000-2000米范围内时,居民更倾向于采用“远距离-长时长-低频率”模式(图6f)。
本研究以广州为例,通过潜在剖面分析识别出3种居民绿地使用行为模式,对城市规划和公共卫生都具有重要意义,也能让规划师更好地优化绿地空间分布与设计。此外,采用XGBoost-SHAP模型探究居民个人社会经济属性、感知绿地可达性、感知绿地特征、社区绿度以及邻近绿地可达性在3类绿地使用行为模式中的影响,发现各影响因素在这3类绿地使用模式中发挥着不一样的作用,城市绿地相关规划和政策制定应充分考虑不同社会群体在绿地使用方面的偏好与需求。在城市绿地设计和日常管理中,应尤为重视提升绿地安全与植物种类多样化,这些都是促进居民绿地使用的有效策略。同时,我们不应忽视绿地与居民绿地使用行为之间关系的尺度与非线性效应,否则相关规划和政策的有效性有可能会产生偏差。
注:以上总结仅代表个人对论文的理解,仅供研究参考所用,不用于商业用途。若上述理解内容有误,请以论文原文为主。