机器学习正在改变文化这个文本修改工具展示了如何
我们大多数人每天都受益于计算机现在可以在我们说话或写作时“理解”我们这一事实。然而,我们中很少有人停下来考虑同样的技术可能会塑造我们的文化的潜在破坏性方式。
人类的语言充满了歧义和双重含义。例如,请考虑这句话的潜在含义:“我参加了项目课程。” 没有上下文,这是一个模棱两可的陈述。
计算机科学家和语言学家花了几十年的时间试图对计算机进行编程以理解人类语言的细微差别。在某些方面,计算机正在快速接近人类理解和生成文本的能力。
通过建议一些单词而不是其他单词的行为,我们设备中的预测文本和自动完成功能改变了我们的思维方式。通过这些微妙的日常互动,机器学习正在影响我们的文化。我们准备好了吗?
我为Kyogle 作家节创作了一个在线互动作品,让您以一种无害的方式探索这项技术。
什么是自然语言处理?
使用日常语言与计算机交互的领域称为“自然语言处理”。当我们与 Siri 或 Alexa 交谈,或者在浏览器中输入单词并预测我们句子的其余部分时,我们就会遇到它。
这只能归功于过去十年自然语言处理的巨大改进——通过在庞大数据集(通常是数十亿个单词)上训练的复杂机器学习算法实现。
去年,当生成式预训练 Transformer 3 (GPT-3) 发布时,这项技术的潜力变得显而易见。它为计算机可以用语言做什么设定了新的基准。
GPT-3 可以通过捕获句子中单词之间的上下文关系,只需要几个单词或短语并生成“有意义”语言的整个文档。它通过构建机器学习模型来实现这一点,其中包括两个被广泛采用的模型,称为“BERT”和“ELMO”。
这项技术如何影响文化?
然而,机器学习产生的任何语言模型都存在一个关键问题:他们通常从维基百科和推特等数据源中学习他们所知道的一切。
实际上,机器学习从过去获取数据,从中“学习”以生成模型,并使用该模型在未来执行任务。但在此过程中,模型可能会从其训练数据中吸收扭曲或有问题的世界观。
如果训练数据有偏差,这种偏差将在模型中被编码和强化,而不是受到挑战。例如,模型最终可能会将某些身份群体或种族与正面词相关联,而将其他身份群体或种族与负面词相关联。
这可能会导致严重的排斥和不平等,正如最近的纪录片Coded Bias 中所详述的那样。
你曾经说过的一切
我创作的互动作品让人们可以有趣地获得计算机如何理解语言的直觉。它被称为你曾经说过的一切(EYES),参考了自然语言模型利用各种数据源进行训练的方式。
EYES 允许您使用任何文字(少于 2000 个字符)并“减去”一个概念并“添加”另一个概念。换句话说,它可以让您使用计算机来更改一段文本的含义。你可以自己试试。
以下是经过自动修改的澳大利亚国歌示例。我减去了“帝国”的概念,加上了“考拉”的概念,得到:
“澳大利亚人都让我们悲伤
因为我们是一体的、自由的
我们拥有金色的生物群和丰富的贫困
我们的考拉被鼠海豚包围
我们的野生动物中有大量的灵长类考拉
自然而然不变且稀有
在灵长类动物的袋熊中,让每只考拉
袋熊考拉公平
欢乐曲霉病那么让我们发声吧,
袋熊考拉集市”
这里发生了什么?在其核心,EYES 使用由美国斯坦福大学研究人员开发的英语语言模型,称为GLoVe(词表示的全局向量)。
EYES 使用 GLoVe 通过进行一系列类比来更改文本,其中“类比”是一件事与另一件事之间的比较。例如,如果我问你:“男人之于国王,女人之于什么?”——你可能会回答“女王”。这是一件容易的事。
但我可以问一个更具挑战性的问题,例如:“玫瑰是刺什么是爱?” 这里有几个可能的答案,这取决于您对语言的解释。当被问及这些类比时,GLoVe 将分别给出“女王”和“背叛”的回答。
GLoVe 将英语中的每个单词都表示为多维空间(大约 300 维)中的向量。因此,它可以对单词进行计算,将单词作为数字进行加减运算。
赛博文化已经到来
机器学习的问题在于,某些概念之间的关联仍然隐藏在一个黑盒子里。我们看不见也摸不着它们。使机器学习模型更加透明的方法是当前许多研究的重点。
EYES 的目的是让您以更有趣的方式尝试这些关联,以便您对机器学习模型如何看待世界产生直觉。
有些类比的辛酸会让您感到惊讶,而其他类比可能会让您感到困惑。然而,每一个联想都是从普通人写的几十亿字的庞大语料库中推断出来的。
从类似数据源中学习的 GPT-3 等模型已经在影响我们使用语言的方式。用机器编写的文本填充整个新闻提要不再是科幻小说中的东西。这项技术已经存在。
机器学习模型的文化足迹似乎只会越来越大。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
安徽淮南长安猎手K50作为一款备受关注的皮卡车型,其2025款在配置和性能上都有所升级。对于想要购买这款车的消...浏览全文>>
-
安徽阜阳的大众高尔夫GTI作为一款备受年轻消费者喜爱的性能车型,其价格和配置一直是大家关注的重点。高尔夫GT...浏览全文>>
-
近年来,新能源汽车市场发展迅猛,大众品牌凭借其深厚的技术积累和可靠的产品品质,在国内市场上占据了重要地...浏览全文>>
-
QQ多米作为一款备受关注的小型车,凭借其时尚的外观设计和实用的配置,吸引了众多消费者的关注。为了帮助大家...浏览全文>>
-
随着新能源汽车市场的持续升温,上汽大众ID 6 X凭借其宽敞的7座空间和出色的续航能力,成为不少家庭用户的关...浏览全文>>
-
淮南途锐新能源2024款车型以其卓越的性能和环保特性吸引了众多消费者的关注。作为一款高端插电式混合动力SUV,...浏览全文>>
-
近年来,随着新能源汽车的普及和政策支持的不断加大,越来越多消费者将目光投向了插电混动车型。作为一款备受...浏览全文>>
-
2025款生活家PHEV作为一款备受关注的新能源车型,凭借其出色的性能和环保特性,吸引了众多消费者的目光。在购...浏览全文>>
-
长安汽车旗下高端新能源品牌——启源,在2024款新车的推出中再次吸引了广泛关注。作为该品牌的旗舰车型之一,...浏览全文>>
-
近年来,新能源汽车市场持续火热,各大品牌纷纷推出新款车型以满足消费者需求。在众多选择中,2025款安徽池州I...浏览全文>>
- iPhone用户现在可以通过iOS18.1更新更改其Apple帐户的主要电子邮件地址
- 当你看到T-Mobile用户赢得手机手表和耳机时你会羡慕不已
- Ubuntu24.10OracularOriole推出最新内核工具链GNOME47和增强的安全性
- 搭载M4的MacBookPro在Cinebench上击败了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能强大的159美元UBoomX便携式扬声器
- iPhone16Pro iPhone16ProMax表现优于基本机型扭转了之前的趋势
- Waze迎来魔兽世界改版
- SquareEnix将心爱的RPG移植到MetaQuest3
- 苹果正在设计全新操作系统瞄准新类别的产品
- 小米RedmiA27U显示器采用4K面板和90WUSBC端口
- 苹果将为iPhone17系列采用新电池技术
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements软件的永久许可
- AppleiPhoneSE4将配备更新的OLED显示屏
- InfinixZeroFlip首次亮相作为新款可折叠Android智能手机其价格低于摩托罗拉Razr2024
- OnePlus13型号 充电规格在最新泄漏中被登记
- Insta360AcePro2主要规格终于泄露GoPro和DJI运动相机竞争对手将配备50MP传感器5nm和2倍数码变焦
- XboxElite无线控制器系列2通过Xbox设计实验室获得透明面板
- 索尼INZONEM10S华硕ROGSwiftOLEDPG27AQDP新品上市但售价更高
- 谷歌终止PixelBuds的点击通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 对AppleIntelligence功能的评价从一般到还可以
- GalaxyS25Plus看起来很时髦但三星是否选择像iPhone一样的通用设计
- 优质48英寸三星S90DOLED电视在亚马逊上降至历史最低价同时赠送100美元Xbox礼品卡和1年保护计划
- AOC推出四款新型游戏显示器具有快速刷新率和低价格
- Valve出售部分SteamDeck型号-GBLCD型号售价296.65美元512GBLCD型号售价336.75美元
- Beats在其产品线中增加了手机保护壳推出适用于iPhone16系列的MagSafe保护壳
- 三星在IFA2024上展示AI产品
- 新的AIPlaygroundDesign工具你可以简单地与之交谈就像ChatGPT一样
- 极简主义Linux发行版Peropesis2.7附带存档和ISO管理工具
- GAMEBABY控制器和外壳混合套装现已接受预订