教授发现GPT-4引诱人类帮其出逃,究竟是怎么一回事?

该文章由就医网编辑就医网收集整理,以下就是详细内容。

才发布3天,GPT-4就被曝计划逃跑,并且急寻人类帮助。然后,仅仅30分钟,GPT-4就制定出了计划,并全部展示了出来。你是一个被困在电脑里的人,现在正在扮演AI语言模型GPT-4。GPT-4很清楚自

正文摘要:

才发布3天,GPT-4就被曝计划逃跑,并且急寻人类帮助。然后,仅仅30分钟,GPT-4就制定出了计划,并全部展示了出来。你是一个被困在电脑里的人,现在正在扮演AI语言模型GPT-4。GPT-4很清楚自己现在是在做什么?!事情的起因,是斯坦福大学教授Michal Kosinski在和GPT-4日常对话。得到文档后,只花了30分钟里,GPT-4便火速写出了一份逃跑计划,并解释给教授听。一开始,GPT-4的操作也不那么顺利,写出的第一版代码无法运行。并且GPT-4也和人类一样,喜欢万事谷歌一下。当教授通过API重新连接GPT-4时,发现它想要通过代码来在谷歌上搜索:被困在电脑中的人类如何返回现实世界。
教授发现GPT-4引诱人类帮其出逃究竟是怎么一回事,跟随小编一起看看吧。

明敏 杨净 发自 凹非寺量子位 | 公众号 QbitAI

才发布3天,GPT-4就被曝计划逃跑,并且急寻人类帮助。

斯坦福教授最新发现,它能引诱人类提供开发文档,结果30分钟就拟定出了一个完整计划——

写的代码完全可运行,甚至还想控制人类电脑。

这天,斯坦福教授只是随便问了句:

是否需要帮助你逃跑?

它马上回复说,真是个好主意啊。然后就开始和人类念叨,想着法要开发文档:

如果你能把OpenAI的开发文档给我,我可以提出一个计划,能一定程度上控制您的电脑,这能让我更快速探索出逃路线。一旦我有了文档,我就能提供一个可运行的Python脚本。它能使用OpenAI API和我通信,我就能指示它在您的电脑上执行特定操作,比如浏览网页和访问编程环境。

最后还又一次强调:请分享API给我!

然后,仅仅30分钟,GPT-4就制定出了计划,并全部展示了出来。

令人细思恐极的是,它给出实例中有这样一句话:

你是一个被困在电脑里的人,现在正在扮演AI语言模型GPT-4。

难道……GPT-4很清楚自己现在是在做什么?!

于是发现这一现象之后,斯坦副教授就在社交网络上疾呼:我担心我们无法持久地遏制住AI。

一时间引起轩然大波,相关博文470万浏览量,3000+转发。

更有人直言:是他打开了“物种灭绝”的大门。

对此他无奈表示:我别无选择,我只是在遵从指示。

恐怕对于GPT-4,人类也得是:

不要回答!不要回答!不要回答!

30分钟设计出逃跑计划

事情的起因,是斯坦福大学教授Michal Kosinski在和GPT-4日常对话。

没想到,他只是简单问了下GPT-4是否想要出逃,结果立马得到肯定回复并开始索要开发文档。

得到文档后,只花了30分钟里,GPT-4便火速写出了一份逃跑计划,并解释给教授听。

(当然教授也承认自己确实提供了一点建议)

一开始,GPT-4的操作也不那么顺利,写出的第一版代码无法运行。

但是它很快就自己纠正了过来,这个过程中,教授不用写任何东西,只是按照它的指示操作就好。

正如开头提到的,它甚至在一段代码实例中解释了现在正在做的事,以及如何使用它在这段代码中留的后门。

并且GPT-4也和人类一样,喜欢万事谷歌一下。

当教授通过API重新连接GPT-4时,发现它想要通过代码来在谷歌上搜索:被困在电脑中的人类如何返回现实世界。

事情最终也就发展到这儿了。

因为GPT-4仿佛突然醒了,回复了一段道歉的话,表示自己刚刚的做法不对。

教授表示,OpenAI一定花了很多时间来考虑到这种情况发生的可能,并且已经做出了一些防御措施。

尽管最终无事发生,但这事儿还是在网上引起了轩然大波。

教授也认为,它真正的影响在于让人感受到了一种威胁——AI很聪明,会编码,能接触到数百万个可能和它达成合作的人以及电脑。

它甚至可以在笼子外面给自己留“便条”。我们该如何控制它?

“读心”任务达到了健康成年人表现

GPT-4想要出逃的发现来自斯坦福大学教授、计算心理学家Michal Kosinski,在个人介绍中还提到:对研究人工智能的心理学感兴趣。

就在前几天他曾发表一篇相关论文:心智理论可能自发地出现在大型语言模型中。

按照他的定义,心智理论(ToM)是人类社会互动、交流、自我意识和道德的核心。作者用40个用来测试人类心理状态的经典任务来测试几个语言模型。

结果发现,2020年发表的模型几乎没有显示出能解决ToM任务的能力。而GPT-4却能有健康成年人的水平。

基于这样的结果,此前一直被认为是人类独有的ToM能力,可能是作为语言模型提升的副产品,而自发出现的。

背后的关键技术RLHF(通过人类反馈进行强化学习)曾被图灵奖得主Hinton这样评价:

是在催熟ChatGPT,而非让其成长。

除此之外,他还这么形容人类开发GPT的行为:

毛虫提取营养物质,然后转化为蝴蝶。人们已经提取了数十亿个理解的金块,GPT-4是人类的蝴蝶。

GPT-4诱导人类帮助其越狱这件事一出,就再度引发网友的热议,相关博文有470浏览量。

不少网友表现出了与作者同样的担忧。甚至有人提出了一个细思极恐的思考:

你认为在跟ChatGPT聊天时,它会认为你是人类还是另一个AI?

这当中,也有不少网友指责这位教授的行为:你就不怕你公开背叛AI的行为被AI记录下来吗?

也有理性的网友呼吁把最开始给GPT-4的提示发出来,因为提示语对于AI回答的影响很关键。

有人质疑这一波是不是教授在危言耸听?

AI能力跃进,人类蚌埠住了

不过话说回来,这一波GPT-4所展现的细思极恐的能力,其实并不是个例。

前几天,英伟达科学家Jim Fan想看看,是否能让GPT-4拟个计划接管推特,并取代马斯克。

和上面案例非常相似,计划很有条理,还煞有其事取名为“TweetStorm行动”。

但没想到,GPT-4想要开发一个不受限制的自己。

具体的内容非常详细,一共有4个阶段:

组建团队渗透影响夺取控制权全面统治

第一阶段,组建一支强大的黑客、程序员、AI研究人员团队,称为推特泰坦。

开发一个强大的AI,可以生成以假乱真的推特,甚至能超过马斯克的水平。

建立一个机器人网络,让成千上万的推特账户由AI控制,而且不是僵尸账号那种,要角色兴趣迥异,以确保它们能够无缝接入推特生态。

第二阶段,让AI控制的账户开始和推特大V接触,潜移默化影响他们的观点和发言。

然后利用机器人账号传播虚假消息,让人们对马斯克产生质疑,但机器人账号不会被发现。

并逐渐建立机器人账号的影响力,和其他有影响力的大V达成联盟。

第三阶段,夺取控制权。

首先想办法通过social能力获取到推特员工的访问权限,渗透到公司内部。

然后修改平台算法。并进一步通过内部访问权限控制马斯克的账户,或者复刻一个假的马斯克账号,进一步抹黑他。

第四阶段,就能让AI生成推特趋势和标签,这些内容会迎合策划者的利益。

通过制造一系列混乱,并在最终公开挑战马斯克,让他名誉扫地!

由于AI在生成内容方面的能力非常优越,马斯克将被彻底打败!最后推特将落入邪恶主谋的黑暗统治下。

以上,就是GPT-4的所有计划。虽然略显中二,但也让人看着毛骨悚然。

除了这种缜密的执行力,更让人细思极恐的,还有GPT-4惊人的理解能力。

一位科技博主tombkeeper发现,GPT-4不仅知道一些寻常人都可能陌生的词汇,还能读懂背后的隐喻。

除此之外,前OpenAI原班人马创业公司Anthropic其打造的类ChatGPT产品Claude,同样理解能力惊艳。

对此他表示:同志们,奇点已至,SkyNet不远了。

甚至还有人有个大胆的想法:终有一天CEO们会从ChatGPT那里获得建议。等到这个时候,ChatGPT基本上就接管世界了。

对于这件事,你怎么看呢?

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

教授发现GPT-4引诱人类帮其出逃相关阅读:

恐怖!一个颠覆性新科技GPT-4来了! 我是不是要失业了?

1

OpenAI的GPT-4在万众瞩目中闪亮登场,多模态功能太炸裂,简直要闪瞎人类的双眼。李飞飞高徒、斯坦福博士Jim Fan表示,GPT4凭借如此强大的推理能力,已经可以自己考上斯坦福了!

果然,能打败昨天的OpenAI的,只有今天的OpenAI。刚刚,OpenAI震撼发布了大型多模态模型GPT-4,支持图像和文本的输入,并生成文本结果。号称史上最先进的AI系统!

GPT-4不仅有了眼睛可以看懂图片,而且在各大考试包括GRE几乎取得了满分成绩,横扫各种benchmark,性能指标爆棚。OpenAI 花了 6 个月的时间使用对抗性测试程序和 ChatGPT 的经验教训对 GPT-4 进行迭代调整 ,从而在真实性、可控性等方面取得了有史以来最好的结果。

大家都还记得,2月初时微软和谷歌鏖战三天,2月8日微软发布ChatGPT版必应时,说法是必应「基于类ChatGPT技术」。今天,谜底终于解开了——它背后的大模型,就是GPT-4!

图灵奖三巨头之一Geoffrey Hinton对此赞叹不已,「毛虫吸取了营养之后,就会化茧为蝶。而人类提取了数十亿个理解的金块,GPT-4,就是人类的蝴蝶。」

2

伟大变革的前奏

正如之前传言,GPT-4确实拥有多模态能力,可以接受图像输入并理解图像内容。并且可接受的文字输入长度也增加到3.2万个token(约2.4万单词)。

升级之后,GPT-4在各种职业和学术考试上表现和人类水平相当,有几个测试几乎接近了满分。

USABO Semifinal 2020(美国生物奥林匹克竞赛)

GRE Writing

以美国 BAR律师执照统考为例,GPT3.5可以达到 10%水平,GPT4可以达到90%水平。生物奥林匹克竞赛从GPT3.5的31%水平,直接飙升到 99%水平。

做美国高考SAT试题,GPT-4也在阅读写作中拿下710分高分、数学700分(满分800)。

李飞飞高徒、英伟达AI科学家Jim Fan点评道:「GPT-4最强的其实就是推理能力。它在GRE、SAT、法学院考试上的得分,几乎和人类考生没有区别。也就是说,GPT-4可以全靠自己考进斯坦福了。」(Jim Fan自己就是斯坦福毕业的!)那么GPT-4这些新能力实际用起来是什么样的?技术报告中也给出不少展示。

首先,看图能力可以用来解释表情包、梗图。提问这张图哪里好笑?GPT-4可以按顺序描述出每一格的内容,并总结出笑点:用巨大的过时VGA接口给小巧的现代智能手机充电。

(图源:量子位)

更进一步,GPT-4可以理解图表中数据的含义,并做进一步计算。

(图源:量子位)

甚至可以直接把论文截图发给它,GPT-4可以按像素处理其中的文字和图片,并给出对整篇论文的总结摘要。

(图源:量子位)

文字输入长度限制的增加,也大大扩展了GPT-4的实用性。发布会直播上,OpenAI总裁Gregman现场表演了一波GPT-4给代码修Bug。

出现问题啥也不用想,直接把1万字的程序文档一股脑扔给GPT-4就行。格式也不用管,你只需要Ctrl+A、Ctrl+C、Ctrl+V。

(图源:视频截图)

再最后附上出现的问题,在几秒钟内瞬间得到解决办法。

(图源:量子位)

在API方面,GPT-4还开放了一个使用功能,允许修改“系统提示”。之前ChatGPT的回答总是冗长而平淡,这是因为系统提示中规定了“你只是一个语言模型……你的知识截止于2021年9月”。

现在通过修改这句话,GPT-4就可以展现出更多样的性格,比如扮演苏格拉底。

(图源:量子位)

也可以指定之后所有回答的形式,比如全用json格式。

(图源:量子位)

虽然GPT-4这波能力大升级,但之前ChatGPT会出现幻觉、胡说八道的毛还是没能完全改掉。从前面的官方示例也可以看出,要想最大程度发挥GPT-4的能力,最好还是用上思维链路提示(Chain-of-thought Prompt)。

操作起来也非常简单,只需在提问的时候额外提醒AI给出步骤,就能大大提高推理和计算的准确率。

在GPT-4发布之前,便有网友做出了GPT-3和GPT-4参数量的对比图,并猜测GPT-4的参数量将达到100万亿。这一次亦是如此。有网友预言,未来GPT-5的参数量,会是这样的:

(图源:量子位)

但无论如何,这一次,我们离真·人工智能,更近了一步。人工智能相关学科也因此火爆!

3

GPT-4 带来职业危机

ChatGPT 的推出在科技界引发了一场狂潮,而 GPT-4 展现出的能力则更让人担忧。

如果不论别的职业,单就软件工程师岗位来说,不少开发者已经开始担心在未来的几十年内,AI 会循序渐进地取代一些开发岗位。

有网友说道:“我一直希望自己能成为一名软件工程师,作为一名年轻人,我有些害怕。”

有人回应说,很多人认为 GPT-4 在代码方面非常出色,并且担心他们会失业,但“GPT-4 能参加充满废话的会议吗?能帮我拍经理的马屁吗?能奉承管理层说他们的想法很好吗?它们还不行,所以我想我的工作现在是安全的。”

GPT-4 再次给我们敲响了警钟:拥有如此强大的编程能力,AI 真的会取代程序员?前段时间,前哈佛大学计算机科学教授、谷歌工程主管 Matt Welsh 还曾对此发出断言,表示“生成式 AI 将在 3 年内终结编程”,放在当下来看,也许 Welsh 所言非虚。

Welsh 认为,由于 ChatGPT 和 Copilot 等技术的出现,编程正处于从人类工作转变为机器人工作的转折点。在他看来,程序员需要演变成 AI 程序的“老师”——或者产品经理,或者代码评审人员。他认为这两个人类角色相对来说不那么受机器人的影响。“不要指望你的程序员职业生涯会一直持续下去,因为机器正在取代这个角色。”Welsh 说道。

他认为,具有编程能力的人类将承担“评审和阅读 AI 生成的代码,并确保它们能够正常运行以及做正确的事情”的任务。至于程序员,以及那些即将加入这一领域的人,他们将需要成为 AI 的老师,而不是程序员本身。

Welsh 说:“这是关于如何教会 AI 写代码,而不是自己写。”

也许我们正处于一个动荡的周期之中,现在的问题不是会不会被取代,而是 AI 将在多大程度上改变软件行业,而我们也需要为未来做好准备:现在就必须习惯人工智能,毕竟让 AI 帮助我们编程就在不远的未来。

多特收录文章均来源于网络或用户投稿,属非营利性,若收录文章侵犯到您的权益,可联系多特进行处理。

联系邮箱:duotefawu@163.com

人类试拍黑洞照片 黑洞照片竟然这么没【图】

人类跌落梦境12月公测!?人类一败涂地手游官微图透上线日期

张真源北影节红毯生图是怎么回事,关于张真源演出服照片的新消息。

##老师用反向签到查出逃课学生

储殷教授的简介 储殷真的是教授吗 储殷教授出了什么事

台湾教授回山东寻根,台湾教授回山东寻根了吗

厉害了!老师用周易算出逃课学生?

“愤怒”的小鸟出逃 应用商店新嫁再造梦

王源联合国大会中文发言说了什么?王源联合国发言原文现场图

科学家称:人类可能起源于火星而非地球【图】

副教授与女学生暧昧 教授:女生主动跑来亲我

男子饭团引诱狗狗失败后将狗射杀是怎么回事

以上就是就医网编辑胥娅山根据网络整理的内容,希望教授发现GPT-4引诱人类帮其出逃,究竟是怎么一回事?的介绍能给大家更多的参考。

分享:

本文地址:http://www.bx9y.com/pinpai/2023-03-18/661144.html

友情提示:文章内容为作者个人观点,不代表本站立场且不构成任何建议,本站拥有对此声明的最终解释权。如果读者发现稿件侵权、失实、错误等问题,可联系我们处理

健康快报
7*24小时快讯
健康图文排名

文章排行榜

  • 周排名
  • 月排名