王紫维、韩民等-ES&T letters:机器学习识别页岩气钻井液中的高危水污染物
页岩气是全球能源工业向低碳转型的重要过渡资源,水平钻井技术页岩气开采的核心技术,钻井作业使用的钻井液含有大量未知的化学物质。对于页岩气开采区域的地下水保护,持久、迁移性毒害化学物质(PMT)和高持久性和高迁移性(vPvM)物质需要重点关注,原因是这类物质不容易被天然屏障或水处理过程去除,能够逐水迁移,在地下水中扩散,影响水质。
目前,PMT/vPvM物质的识别高度依赖于高质量的实验数据。然而,许多化学物质缺乏相应的实验数据,阻碍了PMT/vPvM物质的快速预判与识别。中国科学院广州地球化学研究所有机地球化学国家重点实验室王紫维、韩民博士、金彪特任研究员针对页岩气钻井液的化学组成不清,其中高危水污染物PMT/ vPvM不明等问题,将非靶向分析技术和机器学习模型耦合,在页岩气钻井液样品中检测了371种化学物质(图1),这些化合物主要分布于C7~C14之间,其中脂环族化合物占比最大(约48.2%),再基于“一站式”PMT识别机器学习模型,在检测出的化学物质中识别出29种PMT/vPvM物质(图2)。
为了探索机器学习模型的预测机制以及验证模型的可靠性,基于SHAP(机器学习解释工具)方法对模型预测结果进行了全局解释和局部解释(图3)。结果表明我们的模型可以基于化学结构进行合理预测。此外,研究人员注意到预测的PMT/vPvM 物质大多数为多环芳烃。通过构建基于分子指纹的因果模型,我们计算了与多环芳烃相关的分子结构对PMT/vPvM属性的因果效应,结果表明芳香性可能是部分多环芳烃具有PMT/vPvM特性的主要原因。综上,本研究通过结合非靶向分析技术和PMT机器学习模型,为页岩气开采区域地下水污染预警和风险评估提供了优控污染物的备选清单,也为我国页岩气产业绿色开发提供了相关科学依据。
研究成果近期发表在《Environmental Science & Technology Letters》期刊。项目获国家重点研发计划“页岩气开采场地特征污染物筛查与污染防控”(2019YFC1805500)资助。非靶向分析使用了广州禾信研制的国产飞行时间质谱。
论文信息:Wang, Ziwei(王紫维), Han, Min(韩民), and Jin, Biao*(金彪). Identifying Candidate Persistent, Mobile, and Toxic (PMT) and Very Persistent and Very Mobile (vPvM) Substances in Shale Gas Drilling Fluids by Combining Nontarget Analysis and Machine Learning Model. Environmental Science & Technology Letters. 2024. DOI: 10.1021/acs.estlett.3c00943.
图1. 页岩气钻井液样品中检测到的371种化学物质
(A) GC GC 总离子色谱图,(B) 钻井液中化合物的分类
图2. 钻井液中候选PMT/vPvM物质的分子结构以及可能来源
图3. 基于SHAP方法对模型预测结果 (A) 模型解释全局解释图,(B) 1,3,5-三甲基苯的模型解释瀑布图,(C) 反式十氢化萘的模型解释瀑布图