缩小用于建模语言的大规模神经网络
一种新的方法可以降低计算成本,并增加对最新自然语言处理的可访问性。您不需要用大锤敲碎螺母。乔纳森·弗兰克(Jonathan Frankle)正在研究人工智能,而不是开心果,但他的“彩票假设”也采用了相同的哲学。假设隐藏在大规模神经网络中的精益子网可以更有效地完成相同的任务。诀窍是找到那些被称为中奖彩票的“幸运”子网。
深度学习神经网络可能规模庞大,需要强大的计算能力。在对彩票假说的测试中,麻省理工学院的研究人员发现了隐藏在BERT模型中的更精简,更有效的子网。图片来源:麻省理工学院Jose-Luis Olivares
在一篇新论文中,Frankle及其同事发现了潜伏在BERT中的此类子网,BERT是一种用于自然语言处理(NLP)的先进神经网络方法。作为人工智能的一个分支,NLP旨在通过预测文本生成或在线聊天机器人等应用程序来解密和分析人类语言。在计算方面,BERT体积庞大,通常需要大多数用户无法获得的超级计算能力。访问BERT的中奖彩票可以公平地进行比赛,从而可能使更多用户在智能手机上开发有效的NLP工具-无需大锤。
弗兰克勒说:“我们正在达到必须使这些模型更精简,更高效的地步。”他补充说,这一进步有一天可能会“减少NLP的准入门槛”。
麻省理工学院计算机科学与人工智能实验室的迈克尔·卡宾小组的博士生Frankle是该研究的共同作者,该研究将于下个月在神经信息处理系统会议上发表。德克萨斯大学奥斯汀分校的陈天龙是该论文的主要作者,其中包括得克萨斯州A&M的合作者Wang Zhangyang Wang,以及所有MIT-IBM Watson AI Lab的合作者Chang Shiyu,Sisi Liu和Zhang Zhang 。
您今天可能已经与BERT网络进行了互动。这是Google搜索引擎的基础技术之一,自Google于2018年发布BERT以来,它一直引起研究人员的兴奋。BERT是一种创建神经网络的方法,即使用分层节点或“神经元”的算法来学习执行神经网络。通过培训大量实例来完成任务。BERT是通过反复尝试填写写作段落中遗漏的单词来进行训练的,它的功能在于此初始训练数据集的庞大大小。然后,用户可以将BERT的神经网络微调至特定任务,例如构建客户服务聊天机器人。但是争吵的BERT需要大量的处理能力。
“如今,标准的BERT模型(花园品种)具有3.4亿个参数,” Frankle说,并补充说,这个数字可以达到10亿。对如此庞大的网络进行微调可能需要一台超级计算机。“这简直太贵了。这远远超出了您或我的计算能力。”
陈同意。他说,尽管BERT迅速流行,但此类模型“仍受庞大的网络规模的影响”。幸运的是,“彩票假设似乎是一种解决方案。”
为了削减计算成本,Chen和他的同事试图找出隐藏在BERT中的较小模型。他们通过迭代修剪整个BERT网络的参数进行了实验,然后将新子网的性能与原始BERT模型的性能进行了比较。他们对一系列NLP任务进行了此比较,从回答问题到填充句子中的空白词。
研究人员发现,根据任务的不同,成功的子网比最初的BERT模型瘦40%至90%。此外,他们能够在运行任何针对任务的微调之前识别出那些中奖彩票,这一发现可以进一步降低NLP的计算成本。在某些情况下,为一项任务选择的子网可以重新用于另一项任务,尽管Frankle指出这种可移植性并不普遍。尽管如此,弗兰克勒还是对该小组的结果感到满意。
他说:“我什至为这项工作感到震惊。” “这不是我想当然的事情。我期待比我们得到的结果更混乱。”
Facebook AI Research的科学家阿里·莫尔科斯(Ari Morcos)认为,在BERT模式中发现中奖彩票是“令人信服的”。“这些模型正在变得越来越普遍,” Morcos说。“因此,了解彩票假设是否成立很重要。” 他补充说,这一发现可能使类似BERT的模型使用更少的计算能力运行,“鉴于这些超大型模型当前的运行成本非常高,这可能会产生很大的影响。”
弗兰克(Frankle)同意。他希望这项工作可以使BERT更加易于使用,因为它逆转了NLP模型不断增长的趋势。他说:“我不知道我们可以使用这些超级计算机式的计算来做多大的事情。” “我们将不得不减少进入壁垒。” 确定一个精简的,赢得彩票的子网可以做到这一点-允许缺乏Google或Facebook计算能力的开发人员仍然可以执行最先进的NLP。弗兰克勒说:“希望这将降低成本,这将使每个人都更容易使用…………那些只有一台笔记本电脑的小家伙。” “对我来说,真是令人兴奋。”
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
安徽淮南长安猎手K50作为一款备受关注的皮卡车型,其2025款在配置和性能上都有所升级。对于想要购买这款车的消...浏览全文>>
-
安徽阜阳的大众高尔夫GTI作为一款备受年轻消费者喜爱的性能车型,其价格和配置一直是大家关注的重点。高尔夫GT...浏览全文>>
-
近年来,新能源汽车市场发展迅猛,大众品牌凭借其深厚的技术积累和可靠的产品品质,在国内市场上占据了重要地...浏览全文>>
-
QQ多米作为一款备受关注的小型车,凭借其时尚的外观设计和实用的配置,吸引了众多消费者的关注。为了帮助大家...浏览全文>>
-
随着新能源汽车市场的持续升温,上汽大众ID 6 X凭借其宽敞的7座空间和出色的续航能力,成为不少家庭用户的关...浏览全文>>
-
淮南途锐新能源2024款车型以其卓越的性能和环保特性吸引了众多消费者的关注。作为一款高端插电式混合动力SUV,...浏览全文>>
-
近年来,随着新能源汽车的普及和政策支持的不断加大,越来越多消费者将目光投向了插电混动车型。作为一款备受...浏览全文>>
-
2025款生活家PHEV作为一款备受关注的新能源车型,凭借其出色的性能和环保特性,吸引了众多消费者的目光。在购...浏览全文>>
-
长安汽车旗下高端新能源品牌——启源,在2024款新车的推出中再次吸引了广泛关注。作为该品牌的旗舰车型之一,...浏览全文>>
-
近年来,新能源汽车市场持续火热,各大品牌纷纷推出新款车型以满足消费者需求。在众多选择中,2025款安徽池州I...浏览全文>>
- iPhone用户现在可以通过iOS18.1更新更改其Apple帐户的主要电子邮件地址
- 当你看到T-Mobile用户赢得手机手表和耳机时你会羡慕不已
- Ubuntu24.10OracularOriole推出最新内核工具链GNOME47和增强的安全性
- 搭载M4的MacBookPro在Cinebench上击败了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能强大的159美元UBoomX便携式扬声器
- iPhone16Pro iPhone16ProMax表现优于基本机型扭转了之前的趋势
- Waze迎来魔兽世界改版
- SquareEnix将心爱的RPG移植到MetaQuest3
- 苹果正在设计全新操作系统瞄准新类别的产品
- 小米RedmiA27U显示器采用4K面板和90WUSBC端口
- 苹果将为iPhone17系列采用新电池技术
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements软件的永久许可
- AppleiPhoneSE4将配备更新的OLED显示屏
- InfinixZeroFlip首次亮相作为新款可折叠Android智能手机其价格低于摩托罗拉Razr2024
- OnePlus13型号 充电规格在最新泄漏中被登记
- Insta360AcePro2主要规格终于泄露GoPro和DJI运动相机竞争对手将配备50MP传感器5nm和2倍数码变焦
- XboxElite无线控制器系列2通过Xbox设计实验室获得透明面板
- 索尼INZONEM10S华硕ROGSwiftOLEDPG27AQDP新品上市但售价更高
- 谷歌终止PixelBuds的点击通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 对AppleIntelligence功能的评价从一般到还可以
- GalaxyS25Plus看起来很时髦但三星是否选择像iPhone一样的通用设计
- 优质48英寸三星S90DOLED电视在亚马逊上降至历史最低价同时赠送100美元Xbox礼品卡和1年保护计划
- AOC推出四款新型游戏显示器具有快速刷新率和低价格
- Valve出售部分SteamDeck型号-GBLCD型号售价296.65美元512GBLCD型号售价336.75美元
- Beats在其产品线中增加了手机保护壳推出适用于iPhone16系列的MagSafe保护壳
- 三星在IFA2024上展示AI产品
- 新的AIPlaygroundDesign工具你可以简单地与之交谈就像ChatGPT一样
- 极简主义Linux发行版Peropesis2.7附带存档和ISO管理工具
- GAMEBABY控制器和外壳混合套装现已接受预订