一种提高人工智能公平性和准确性的技术
使机器学习模型的预测总体上更准确的方法可能会降低代表性不足的子组的准确性。一种新方法可以提供帮助。对于使用机器学习模型帮助他们做出决策的工作人员来说,知道何时信任模型的预测并不总是那么容易,尤其是因为这些模型通常非常复杂,以至于它们的内部运作仍然是个谜。
用户有时会使用一种称为选择性回归的技术,其中模型估计每个预测的置信水平,并在其置信度过低时拒绝预测。然后人类可以检查这些案例,收集更多信息,并手动对每个案例做出决定。
但是,虽然选择性回归已被证明可以提高模型的整体性能,但麻省理工学院和MIT-IBMWatsonAI实验室的研究人员发现,该技术可能对数据集中代表性不足的人群产生相反的效果。随着模型的置信度随着选择性回归的增加而增加,其做出正确预测的机会也会增加,但这并不总是发生在所有子组中。
例如,一个建议贷款批准的模型平均可能会产生更少的错误,但它实际上可能会对黑人或女性申请人做出更多错误的预测。发生这种情况的一个原因是模型的置信度度量是使用代表人数过多的组进行训练的,并且对于这些代表人数不足的组可能不准确。
一旦他们发现了这个问题,麻省理工学院的研究人员就开发了两种算法来解决这个问题。他们使用真实世界的数据集表明,这些算法减少了影响边缘化子组的性能差异。
“最终,这是关于你将哪些样本交给人类来处理的更智能。我们希望确保巧妙地考虑跨组的错误率,而不是仅仅最小化模型的一些广泛的错误率,”麻省理工学院高级作者、电气工程和计算机科学系住友工程学教授GregWornell说(EECS),他领导电子研究实验室(RLE)的信号、信息和算法实验室,并且是MIT-IBMWatsonAI实验室的成员。
加入Wornell的还有共同主要作者AbhinShah(EECS研究生)和YuhengBu(RLE博士后);以及MIT-IBMWatsonAI实验室的研究人员JoshuaKa-WingLeeSM'17、ScD'21和SubhroDas、RameswarPanda和PrasannaSattigeri。该论文将在国际机器学习会议上发表。
回归是一种估计因变量和自变量之间关系的技术。在机器学习中,回归分析通常用于预测任务,例如根据房屋的特征(卧室数量、平方英尺等)预测房屋的价格。通过选择性回归,机器学习模型可以做出两种选择之一对于每个输入——如果它对其决策没有足够的信心,它可以做出预测或放弃预测。
当模型弃权时,它会减少进行预测的样本比例,称为覆盖率。通过仅对它高度自信的输入进行预测,模型的整体性能应该会提高。但这也会放大数据集中存在的偏差,当模型没有来自某些子组的足够数据时,就会出现偏差。对于代表性不足的个人,这可能会导致错误或错误的预测。
麻省理工学院的研究人员旨在确保随着模型的整体错误率随着选择性回归的提高而提高,每个子组的性能也会得到提高。他们称之为单调选择性风险。
“为这个特定问题提出正确的公平概念是一项挑战。但是通过执行这个标准,单调选择性风险,我们可以确保当你减少覆盖范围时,模型性能实际上在所有子组中变得更好,”Shah说。
一种算法保证模型用于进行预测的特征包含有关数据集中敏感属性的所有信息,例如种族和性别,这些信息与感兴趣的目标变量相关。敏感属性是可能不用于决策的特征,通常是由于法律或组织政策。第二种算法采用校准技术来确保模型对输入做出相同的预测,无论是否将任何敏感属性添加到该输入。
研究人员通过将这些算法应用于可用于高风险决策的真实数据集来测试这些算法。一是保险数据集,用于使用人口统计数据预测向患者收取的年度医疗费用总额;另一个是数据集,用于使用社会经济信息预测社区中的暴力数量。两个数据集都包含个人的敏感属性。
当他们在用于选择性回归的标准机器学习方法之上实施他们的算法时,他们通过降低每个数据集中少数子组的错误率来减少差异。此外,这是在没有显着影响整体错误率的情况下完成的。
“我们看到,如果我们不施加某些限制,在模型非常自信的情况下,它实际上可能会犯更多错误,这在某些应用中可能会非常昂贵,例如医疗保健。因此,如果我们扭转趋势并使其更直观,我们会发现很多这样的错误。这项工作的一个主要目标是避免错误被悄无声息地发现,”Sattigeri说。
Shah说,研究人员计划将他们的解决方案应用于其他应用程序,例如预测房价、学生GPA或贷款利率,以查看算法是否需要针对这些任务进行校准。他们还想探索在模型训练过程中使用不太敏感信息的技术,以避免隐私问题。
他们希望改进选择性回归中的置信度估计,以防止模型置信度低但预测正确的情况。Sattigeri说,这可以减少人类的工作量并进一步简化决策过程。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
安徽淮南长安猎手K50作为一款备受关注的皮卡车型,其2025款在配置和性能上都有所升级。对于想要购买这款车的消...浏览全文>>
-
安徽阜阳的大众高尔夫GTI作为一款备受年轻消费者喜爱的性能车型,其价格和配置一直是大家关注的重点。高尔夫GT...浏览全文>>
-
近年来,新能源汽车市场发展迅猛,大众品牌凭借其深厚的技术积累和可靠的产品品质,在国内市场上占据了重要地...浏览全文>>
-
QQ多米作为一款备受关注的小型车,凭借其时尚的外观设计和实用的配置,吸引了众多消费者的关注。为了帮助大家...浏览全文>>
-
随着新能源汽车市场的持续升温,上汽大众ID 6 X凭借其宽敞的7座空间和出色的续航能力,成为不少家庭用户的关...浏览全文>>
-
淮南途锐新能源2024款车型以其卓越的性能和环保特性吸引了众多消费者的关注。作为一款高端插电式混合动力SUV,...浏览全文>>
-
近年来,随着新能源汽车的普及和政策支持的不断加大,越来越多消费者将目光投向了插电混动车型。作为一款备受...浏览全文>>
-
2025款生活家PHEV作为一款备受关注的新能源车型,凭借其出色的性能和环保特性,吸引了众多消费者的目光。在购...浏览全文>>
-
长安汽车旗下高端新能源品牌——启源,在2024款新车的推出中再次吸引了广泛关注。作为该品牌的旗舰车型之一,...浏览全文>>
-
近年来,新能源汽车市场持续火热,各大品牌纷纷推出新款车型以满足消费者需求。在众多选择中,2025款安徽池州I...浏览全文>>
- iPhone用户现在可以通过iOS18.1更新更改其Apple帐户的主要电子邮件地址
- 当你看到T-Mobile用户赢得手机手表和耳机时你会羡慕不已
- Ubuntu24.10OracularOriole推出最新内核工具链GNOME47和增强的安全性
- 搭载M4的MacBookPro在Cinebench上击败了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能强大的159美元UBoomX便携式扬声器
- iPhone16Pro iPhone16ProMax表现优于基本机型扭转了之前的趋势
- Waze迎来魔兽世界改版
- SquareEnix将心爱的RPG移植到MetaQuest3
- 苹果正在设计全新操作系统瞄准新类别的产品
- 小米RedmiA27U显示器采用4K面板和90WUSBC端口
- 苹果将为iPhone17系列采用新电池技术
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements软件的永久许可
- AppleiPhoneSE4将配备更新的OLED显示屏
- InfinixZeroFlip首次亮相作为新款可折叠Android智能手机其价格低于摩托罗拉Razr2024
- OnePlus13型号 充电规格在最新泄漏中被登记
- Insta360AcePro2主要规格终于泄露GoPro和DJI运动相机竞争对手将配备50MP传感器5nm和2倍数码变焦
- XboxElite无线控制器系列2通过Xbox设计实验室获得透明面板
- 索尼INZONEM10S华硕ROGSwiftOLEDPG27AQDP新品上市但售价更高
- 谷歌终止PixelBuds的点击通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 对AppleIntelligence功能的评价从一般到还可以
- GalaxyS25Plus看起来很时髦但三星是否选择像iPhone一样的通用设计
- 优质48英寸三星S90DOLED电视在亚马逊上降至历史最低价同时赠送100美元Xbox礼品卡和1年保护计划
- AOC推出四款新型游戏显示器具有快速刷新率和低价格
- Valve出售部分SteamDeck型号-GBLCD型号售价296.65美元512GBLCD型号售价336.75美元
- Beats在其产品线中增加了手机保护壳推出适用于iPhone16系列的MagSafe保护壳
- 三星在IFA2024上展示AI产品
- 新的AIPlaygroundDesign工具你可以简单地与之交谈就像ChatGPT一样
- 极简主义Linux发行版Peropesis2.7附带存档和ISO管理工具
- GAMEBABY控制器和外壳混合套装现已接受预订