OpenAI 的GPT-4o道德推理超越人类专家,AI伦理判断获新突破

【HowToTech科技】6月24日消息,近期研究显示,OpenAI的最新聊天机器人GPT-4o在道德解释和建议方面展现出了令人瞩目的能力,其表现甚至超越了“公认的”道德专家。

据The
Decoder于当地时间周六的报道,由美国北卡罗莱纳大学教堂山分校与艾伦AI研究所的科研人员联手进行的两项研究,对GPT模型与人类的道德推理能力进行了深入的比较分析。这些研究旨在探索大型语言模型是否可以被视为“道德专家”。

OpenAI 的GPT-4o道德推理超越人类专家,AI伦理判断获新突破

在第一项研究中,科研人员邀请了501名美国成年人参与。他们比较了GPT-3.5-turbo模型与其他人类参与者所提供的道德解释。结果令人惊讶,人们普遍认为GPT给出的解释在道德层面更为合理、更值得信赖,同时也显得更为周到。评估者们甚至认为,与其他参与者相比,人工智能的评估更为可靠。尽管差异并不显著,但这一关键发现揭示了AI在道德推理方面已达到甚至可能超越人类水平。

OpenAI 的GPT-4o道德推理超越人类专家,AI伦理判断获新突破

第二项研究则更具挑战性,科研人员将OpenAI最新的GPT-4o模型所生成的建议与《纽约时报》“伦理学家”专栏中的知名伦理学家Kwame Anthony
Appiah的建议进行了对比。共有900名参与者对50个“伦理困境”中的建议质量进行了评分。结果再次令人震惊,GPT-4o在几乎所有方面都超越了人类专家。人们普遍认为,AI生成的建议在道德上更为正确、更值得信赖、更为周到且更为准确。仅在感知细微差别方面,人工智能与人类专家之间未表现出显著差异。

据HowToTech科技了解,研究团队认为这些结果充分表明,AI完全有可能通过“比较道德图灵测试”(cMTT)。此外,文本分析还显示,在提供建议时,GPT-4o使用的道德和积极语言明显多于人类专家,这或许可以部分解释为何AI的建议能够获得更高的评分,当然,这并非唯一因素。

然而,这项研究主要针对的是美国参与者。未来,科研人员仍需进一步探讨人们如何看待AI生成的道德推理在不同文化背景下的差异。

大鱼的头像

这个人很懒,什么都没有留下~

延伸阅读:

OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens

【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...

大鱼的头像
大鱼
2024 年 8 月 1 日
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战

7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...

大鱼的头像
大鱼
2024 年 7 月 31 日
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型

“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...

大鱼的头像
大鱼
2024 年 7 月 31 日
阿里通义免费开放奥运AI大模型

7月31日,阿里通义宣布免费开放奥运AI大模型,具备最强奥运专业知识,并集合同声传译级别的中法互译功能。即日起,用户可以...

大鱼的头像
大鱼
2024 年 7 月 31 日
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式

【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...

大鱼的头像
大鱼
2024 年 7 月 31 日