描述单个机器学习模型决策的框架
现代机器学习模型,例如神经网络,通常被称为“黑匣子”,因为它们非常复杂,以至于即使是设计它们的研究人员也无法完全理解它们是如何做出预测的。
为了提供一些见解,研究人员使用试图描述单个模型决策的解释方法。例如,他们可能会在电影评论中突出显示影响模型决定评论是正面的单词。
但是,如果人类不能轻易理解,甚至误解它们,这些解释方法就没有任何用处。因此,麻省理工学院的研究人员创建了一个数学框架来正式量化和评估机器学习模型解释的可理解性。如果研究人员仅评估少数个别解释以尝试理解整个模型,这有助于查明可能遗漏的模型行为见解。
“有了这个框架,我们不仅可以非常清楚地了解我们从这些本地解释中对模型的了解,更重要的是,我们不了解它,”电气工程和计算机科学专业的毕业生Yilun Zhou 说计算机科学和人工智能实验室 (CSAIL) 的学生,也是介绍该框架的论文的主要作者。
周的合著者包括微软研究院高级研究员 Marco Tulio Ribeiro 和高级作者、航空航天学教授、CSAIL 交互式机器人组主任 Julie Shah。该研究将在计算语言学协会北美分会会议上发表。
了解当地的解释
理解机器学习模型的一种方法是找到另一个模仿其预测但使用透明推理模式的模型。然而,最近的神经网络模型非常复杂,以至于这种技术通常会失败。相反,研究人员求助于使用关注个人输入的本地解释。通常,这些解释会突出显示文本中的单词,以表明它们对模型做出的一个预测的重要性。
然后,人们隐含地将这些局部解释推广到整体模型行为。有人可能会看到,当模型确定电影评论具有积极情绪时,局部解释方法突出显示积极词(如“难忘”、“完美无瑕”或“迷人”)是最有影响力的。然后他们可能会假设所有积极的词都会对模型的预测做出积极的贡献,但情况可能并非总是如此,周说。
研究人员开发了一个框架,称为 ExSum(解释摘要的缩写),将这些类型的声明形式化为可以使用可量化指标进行测试的规则。ExSum 评估整个数据集上的规则,而不仅仅是为其构造的单个实例。
使用图形用户界面,个人编写可以调整、调整和评估的规则。例如,当研究一个学习将电影评论分类为正面或负面的模型时,人们可能会写一条规则说“否定词具有负面显着性”,这意味着像“不”、“不”和“无”这样的词对电影评论的情绪产生负面影响。
使用 ExSum,用户可以使用三个特定指标查看该规则是否成立:覆盖率、有效性和清晰度。覆盖率衡量规则在整个数据集中的适用范围。有效性突出显示符合规则的单个示例的百分比。清晰度描述了规则的精确程度;一个高度有效的规则可能非常通用,以至于对理解模型没有用处。
测试假设
如果研究人员想要更深入地了解她的模型的行为方式,她可以使用 ExSum 来测试特定的假设,Zhou 说。
如果她怀疑她的模型在性别方面具有歧视性,她可以制定规则说男性代词有正贡献,女性代词有负贡献。如果这些规则具有很高的有效性,则意味着它们总体上是正确的,并且模型可能存在偏差。
ExSum 还可以揭示有关模型行为的意外信息。例如,在评估电影评论分类器时,研究人员惊讶地发现,与正面词相比,负面词往往对模型的决策有更尖锐和更尖锐的贡献。周解释说,这可能是由于评论作家在批评电影时试图保持礼貌而不那么直率。
“要真正确认你的理解,你需要在很多情况下更严格地评估这些说法。据我们所知,这种细粒度级别的理解在以前的作品中从未发现过,”他说。
“从本地解释到全球理解是文献中的一个巨大差距。ExSum 是填补这一差距的良好第一步,”Ribeiro 补充道。
扩展框架
在未来,周希望通过将可理解性的概念扩展到其他标准和解释形式,如反事实解释(表明如何修改输入以改变模型预测)来建立这项工作。目前,他们专注于特征归因方法,这些方法描述了模型用于做出决策的各个特征(如电影评论中的文字)。
此外,他希望进一步增强框架和用户界面,以便人们可以更快地创建规则。编写规则可能需要数小时的人工参与——而某种程度的人工参与至关重要,因为人类最终必须能够掌握解释——但人工智能的帮助可以简化这一过程。
在思考 ExSum 的未来时,周希望他们的工作强调需要改变研究人员对机器学习模型解释的看法。
“在这项工作之前,如果你有一个正确的本地解释,你就完成了。你已经达到了解释你的模型的圣杯。我们提出了这个额外的维度来确保这些解释是可以理解的。可理解性需要成为评估的另一个指标我们的解释,”周说。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
安徽淮南长安猎手K50作为一款备受关注的皮卡车型,其2025款在配置和性能上都有所升级。对于想要购买这款车的消...浏览全文>>
-
安徽阜阳的大众高尔夫GTI作为一款备受年轻消费者喜爱的性能车型,其价格和配置一直是大家关注的重点。高尔夫GT...浏览全文>>
-
近年来,新能源汽车市场发展迅猛,大众品牌凭借其深厚的技术积累和可靠的产品品质,在国内市场上占据了重要地...浏览全文>>
-
QQ多米作为一款备受关注的小型车,凭借其时尚的外观设计和实用的配置,吸引了众多消费者的关注。为了帮助大家...浏览全文>>
-
随着新能源汽车市场的持续升温,上汽大众ID 6 X凭借其宽敞的7座空间和出色的续航能力,成为不少家庭用户的关...浏览全文>>
-
淮南途锐新能源2024款车型以其卓越的性能和环保特性吸引了众多消费者的关注。作为一款高端插电式混合动力SUV,...浏览全文>>
-
近年来,随着新能源汽车的普及和政策支持的不断加大,越来越多消费者将目光投向了插电混动车型。作为一款备受...浏览全文>>
-
2025款生活家PHEV作为一款备受关注的新能源车型,凭借其出色的性能和环保特性,吸引了众多消费者的目光。在购...浏览全文>>
-
长安汽车旗下高端新能源品牌——启源,在2024款新车的推出中再次吸引了广泛关注。作为该品牌的旗舰车型之一,...浏览全文>>
-
近年来,新能源汽车市场持续火热,各大品牌纷纷推出新款车型以满足消费者需求。在众多选择中,2025款安徽池州I...浏览全文>>
- iPhone用户现在可以通过iOS18.1更新更改其Apple帐户的主要电子邮件地址
- 当你看到T-Mobile用户赢得手机手表和耳机时你会羡慕不已
- Ubuntu24.10OracularOriole推出最新内核工具链GNOME47和增强的安全性
- 搭载M4的MacBookPro在Cinebench上击败了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能强大的159美元UBoomX便携式扬声器
- iPhone16Pro iPhone16ProMax表现优于基本机型扭转了之前的趋势
- Waze迎来魔兽世界改版
- SquareEnix将心爱的RPG移植到MetaQuest3
- 苹果正在设计全新操作系统瞄准新类别的产品
- 小米RedmiA27U显示器采用4K面板和90WUSBC端口
- 苹果将为iPhone17系列采用新电池技术
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements软件的永久许可
- AppleiPhoneSE4将配备更新的OLED显示屏
- InfinixZeroFlip首次亮相作为新款可折叠Android智能手机其价格低于摩托罗拉Razr2024
- OnePlus13型号 充电规格在最新泄漏中被登记
- Insta360AcePro2主要规格终于泄露GoPro和DJI运动相机竞争对手将配备50MP传感器5nm和2倍数码变焦
- XboxElite无线控制器系列2通过Xbox设计实验室获得透明面板
- 索尼INZONEM10S华硕ROGSwiftOLEDPG27AQDP新品上市但售价更高
- 谷歌终止PixelBuds的点击通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 对AppleIntelligence功能的评价从一般到还可以
- GalaxyS25Plus看起来很时髦但三星是否选择像iPhone一样的通用设计
- 优质48英寸三星S90DOLED电视在亚马逊上降至历史最低价同时赠送100美元Xbox礼品卡和1年保护计划
- AOC推出四款新型游戏显示器具有快速刷新率和低价格
- Valve出售部分SteamDeck型号-GBLCD型号售价296.65美元512GBLCD型号售价336.75美元
- Beats在其产品线中增加了手机保护壳推出适用于iPhone16系列的MagSafe保护壳
- 三星在IFA2024上展示AI产品
- 新的AIPlaygroundDesign工具你可以简单地与之交谈就像ChatGPT一样
- 极简主义Linux发行版Peropesis2.7附带存档和ISO管理工具
- GAMEBABY控制器和外壳混合套装现已接受预订