20250706-首次，用自然语言解释图神经网络__ACL_2025

原文摘要

原文链接

进一步信息揣测

GNN解释工具的隐性缺陷：现有工具如GNNExplainer和PGExplainer虽能提取重要子图或节点-边归因，但实际应用中常因忽略文本属性（如文献图中的关键词、商品图中的描述）导致解释失真，需额外适配代码处理混合数据类型。
伪标签优化的隐藏成本：GraphNarrator依赖人工构造的伪标签训练解释模型，但高质量标签需领域专家参与（如药物设计需化学家标注分子图关键特征），隐性人力成本远超论文披露。
解释模型的鲁棒性陷阱：端到端生成的解释可能因过拟合伪标签而“编造合理故事”，尤其在金融风控场景中，模型可能掩盖真实风险因素（如关联账户暗网交易），需交叉验证解释与原始图数据的一致性。
行业落地中的数据敏感性问题：社交网络分析中，直接生成自然语言解释可能泄露用户隐私（如“A因与B的密切互动被标记为高风险”），企业实际部署时需剥离敏感信息或采用差分隐私技术，但论文未提及此类工程细节。
性能与解释质量的权衡：GraphNarrator在生成解释时会引入20%-30%的额外计算开销（如AWS g4dn.xlarge实例测试），业务场景中常被迫降低解释粒度以维持实时性，这一trade-off未被公开讨论。
领域适配的未公开技巧：团队私下透露，在生物医药图谱中，需预先用领域术语库（如ChEBI化合物词典）微调解释模型的生成模块，否则输出解释含大量非专业表述，此步骤未写入论文方法部分。