走向可以像人类一样推理代码的深度学习模型
无论公司从事何种业务,软件都扮演着越来越重要的角色,从管理库存到与客户互动。因此,对软件开发人员的需求比以往任何时候都大,这推动了将一些占用他们时间的更简单任务自动化的趋势。
Eclipse 和 Visual Studio 等生产力工具会建议代码片段,开发人员可以在编写时轻松放入他们的工作中。这些自动化功能由复杂的语言模型提供支持,这些语言模型在吸收了数千个示例后学会了读写计算机代码。但是,与在没有明确指令的情况下在大数据集上训练的其他深度学习模型一样,专为代码处理而设计的语言模型也存在内置漏洞。
由 MIT 和 IBM 研究人员构建的框架发现并修复了自动编程工具中的弱点,这些弱点使它们容易受到攻击。一种工具(如图)随着程序员编写和建议代码而阅读。在这里,它从 Python 的 NumPy 库中的数千个选项中挑选最适合手头任务的函数。图片来源:麻省理工学院的 Shashank Srikant
“除非你真的很小心,否则黑客可以巧妙地操纵这些模型的输入,让它们预测任何事情,”麻省理工学院电气工程和计算机科学系的研究生Shashank Srikant说 。“我们正在努力研究并防止这种情况发生。”
在一篇新论文中,Srikant 和 MIT-IBM Watson AI Lab推出了一种自动方法,用于查找代码处理模型中的弱点并重新训练它们以提高抵御攻击的能力。这是 MIT 研究员Una-May O'Reilly 和 IBM 附属研究员 Sijia Liu共同努力的一部分, 旨在利用 AI 使自动化编程工具更智能、更安全。该团队将在国际学习代表会议上展示其结果。
一台能够自我编程的机器曾经看起来像科幻小说。但是,计算能力的指数级增长、自然语言处理的进步以及互联网上的大量免费代码使得软件设计的至少某些方面的自动化成为可能。
在 GitHub 和其他程序共享网站上接受过训练,代码处理模型学习生成程序,就像其他语言模型学习编写新闻故事或诗歌一样。这使他们能够充当智能助手,预测软件开发人员接下来会做什么,并提供帮助。他们可能会建议适合手头任务的程序,或者生成程序摘要来记录软件的工作方式。还可以训练代码处理模型来查找和修复错误。但是,尽管它们具有提高生产力和改进软件质量的潜力,但它们带来了研究人员刚刚开始发现的安全风险。
Srikant 和他的同事发现,代码处理模型可以通过简单地重命名变量、插入虚假的打印语句或将其他修饰操作引入模型试图处理的程序来欺骗。 这些经过巧妙修改的程序正常运行,但会欺骗模型错误地处理它们,从而做出错误的决定。
这些错误会对所有类型的代码处理模型产生严重的后果。恶意软件检测模型可能会被欺骗,将恶意程序误认为良性程序。代码完成模型可能会被欺骗提供错误或恶意的建议。在这两种情况下,病毒都可能被毫无戒心的程序员偷偷溜走。一个类似的问题困扰着计算机视觉模型:正如麻省理工学院的其他研究表明的那样,编辑输入图像中的几个关键像素,模型可能会将猪混淆为飞机,将乌龟混淆 为步枪。
就像最好的语言模型一样,代码处理模型有一个关键缺陷:它们是单词和短语之间统计关系的专家,但只能模糊地掌握它们的真正含义。例如,OpenAI 的 GPT-3 语言模型可以写出从雄辩到荒谬的散文,但只有人类读者才能分辨出其中的区别。
代码处理模型也不例外。“如果他们真的在学习程序的内在属性,那么应该很难欺骗他们,”Srikant 说。“但他们不是。他们目前相对容易被欺骗。”
在论文中,研究人员提出了一个框架,用于自动更改程序以暴露处理它们的模型中的弱点。它解决了一个两部分的优化问题;算法识别程序中添加或替换文本会导致模型出现最大错误的站点。它还确定了哪些类型的编辑构成了最大的威胁。
研究人员说,该框架揭示的是某些模型是多么脆弱。当对程序进行一次编辑时,他们的文本摘要模型失败了三分之一;他们报告说,在进行了五次编辑时,有一半以上的时间都失败了。另一方面,他们表明该模型能够从错误中学习, 并在此过程中潜在地获得对编程的更深入理解。
该研究的共同资深作者刘说:“我们用于攻击模型并针对这些特定漏洞对其进行重新训练的框架,可能有助于代码处理模型更好地掌握程序的意图。” “这是一个有待探索的令人兴奋的方向。”
在后台,一个更大的问题仍然存在:这些黑盒深度学习模型到底在学习什么?“他们是否像人类一样推理代码,如果不是,我们如何制作它们?” 奥莱利说。“这是我们面临的巨大挑战。”
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
安徽淮南长安猎手K50作为一款备受关注的皮卡车型,其2025款在配置和性能上都有所升级。对于想要购买这款车的消...浏览全文>>
-
安徽阜阳的大众高尔夫GTI作为一款备受年轻消费者喜爱的性能车型,其价格和配置一直是大家关注的重点。高尔夫GT...浏览全文>>
-
近年来,新能源汽车市场发展迅猛,大众品牌凭借其深厚的技术积累和可靠的产品品质,在国内市场上占据了重要地...浏览全文>>
-
QQ多米作为一款备受关注的小型车,凭借其时尚的外观设计和实用的配置,吸引了众多消费者的关注。为了帮助大家...浏览全文>>
-
随着新能源汽车市场的持续升温,上汽大众ID 6 X凭借其宽敞的7座空间和出色的续航能力,成为不少家庭用户的关...浏览全文>>
-
淮南途锐新能源2024款车型以其卓越的性能和环保特性吸引了众多消费者的关注。作为一款高端插电式混合动力SUV,...浏览全文>>
-
近年来,随着新能源汽车的普及和政策支持的不断加大,越来越多消费者将目光投向了插电混动车型。作为一款备受...浏览全文>>
-
2025款生活家PHEV作为一款备受关注的新能源车型,凭借其出色的性能和环保特性,吸引了众多消费者的目光。在购...浏览全文>>
-
长安汽车旗下高端新能源品牌——启源,在2024款新车的推出中再次吸引了广泛关注。作为该品牌的旗舰车型之一,...浏览全文>>
-
近年来,新能源汽车市场持续火热,各大品牌纷纷推出新款车型以满足消费者需求。在众多选择中,2025款安徽池州I...浏览全文>>
- iPhone用户现在可以通过iOS18.1更新更改其Apple帐户的主要电子邮件地址
- 当你看到T-Mobile用户赢得手机手表和耳机时你会羡慕不已
- Ubuntu24.10OracularOriole推出最新内核工具链GNOME47和增强的安全性
- 搭载M4的MacBookPro在Cinebench上击败了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能强大的159美元UBoomX便携式扬声器
- iPhone16Pro iPhone16ProMax表现优于基本机型扭转了之前的趋势
- Waze迎来魔兽世界改版
- SquareEnix将心爱的RPG移植到MetaQuest3
- 苹果正在设计全新操作系统瞄准新类别的产品
- 小米RedmiA27U显示器采用4K面板和90WUSBC端口
- 苹果将为iPhone17系列采用新电池技术
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements软件的永久许可
- AppleiPhoneSE4将配备更新的OLED显示屏
- InfinixZeroFlip首次亮相作为新款可折叠Android智能手机其价格低于摩托罗拉Razr2024
- OnePlus13型号 充电规格在最新泄漏中被登记
- Insta360AcePro2主要规格终于泄露GoPro和DJI运动相机竞争对手将配备50MP传感器5nm和2倍数码变焦
- XboxElite无线控制器系列2通过Xbox设计实验室获得透明面板
- 索尼INZONEM10S华硕ROGSwiftOLEDPG27AQDP新品上市但售价更高
- 谷歌终止PixelBuds的点击通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 对AppleIntelligence功能的评价从一般到还可以
- GalaxyS25Plus看起来很时髦但三星是否选择像iPhone一样的通用设计
- 优质48英寸三星S90DOLED电视在亚马逊上降至历史最低价同时赠送100美元Xbox礼品卡和1年保护计划
- AOC推出四款新型游戏显示器具有快速刷新率和低价格
- Valve出售部分SteamDeck型号-GBLCD型号售价296.65美元512GBLCD型号售价336.75美元
- Beats在其产品线中增加了手机保护壳推出适用于iPhone16系列的MagSafe保护壳
- 三星在IFA2024上展示AI产品
- 新的AIPlaygroundDesign工具你可以简单地与之交谈就像ChatGPT一样
- 极简主义Linux发行版Peropesis2.7附带存档和ISO管理工具
- GAMEBABY控制器和外壳混合套装现已接受预订