推广 热搜： 百度搜索引擎企业可以选择使用 page

ChatGPT已经通过“图灵测试”？科学家称该人工智能有人类的智力

日期：2024-12-31 作者：2kzvw caijiyuan

核心提示：自1950年首次提出以来，通过“图灵测试”一直被视为人工智能（AI）的最高目标之一。但现在，研究人员声称ChatGPT成为第一个通过

自1950年首次提出以来，通过“图灵测试”一直被视为人工智能（AI）的最高目标之一。

但现在，研究人员声称ChatGPT成为第一个通过这个著名人类智能测试的AI。

由计算机先驱阿兰·图灵提出的图灵测试认为，如果人类无法分辨他们是在与人类还是机器交谈，那么这个AI应该被认为是具有真正智能的。

在一篇预印本论文中，加州大学圣地亚哥分校的认知科学家们论证说，ChatGPT-4在超过一半的时间里可以欺骗测试对象，使他们认为自己在与人类交谈。

然而，研究人员表示，这可能更多地说明了图灵测试本身的问题，而不是现代AI的智能水平。

早在1950年，英国二战密码破译者阿兰·图灵创建了他认为是计算机智能的最终测试。

他设想，一个人类参与者坐在屏幕前，通过纯文本界面与人类或计算机交谈。

如果计算机在广泛的主题中都无法被区分为非人类，图灵推断，我们就不得不承认它和人类一样聪明。

为了重现这个著名的测试，研究人员要求500名参与者与四个不同的代理人交谈：三个AI和一个人类。

这些AI包括ChatGPT-4、ChatGPT-3.5（OpenAI的两个版本）和一个1960年代的聊天程序ELIZA。

参与者被置于一个聊天室中，并被告知他们需要说服对方自己是人类，或者找出他们在与谁交谈。

随后，参与者有五分钟的时间进行聊天，然后被问及他们认为自己是在与计算机还是人类交谈，为什么这么认为，以及他们的自信程度。

尽管过时的ELIZA只能在22%的时间里欺骗参与者，但ChatGPT-3.5在50%的对话中未被察觉。

更先进的ChatGPT-4表现更好，参与者在54%的时间里认为它是人类。

这意味着ChatGPT-4比随机猜测更频繁地被认为是人类。

如果这一比例看起来不高，值得注意的是，参与者在67%的对话中正确识别人类为人类。

研究人员写道，这些结果“提供了第一个有力的实证证明，表明任何人工系统通过了互动的双人图灵测试”。

需要注意的是，这是一篇预印本论文，意味着其目前正在等待同行评审，因此这些结果需要谨慎对待。

然而，如果这些结果得到支持，这将是首次有力证据表明AI通过了阿兰·图灵设想的图灵测试。

电气与电子工程师协会（IEEE）的AI研究员Nell Watson告诉Live Science：“机器可以像人类一样拼凑出事后的合理解释。

“所有这些元素意味着AI系统表现出人类般的弱点和怪癖，使它们比之前仅有固定响应列表的方法更像人类。”

重要的是，ELIZA程序的低表现也有助于支持这些结果的重要性。

尽管在前沿技术测试中包括一个1960年代的程序看起来很奇怪，但这个模型被包括进来是为了测试所谓的“ELIZA效应”。

ELIZA效应的意思是人类可能会将人类特征赋予即使是非常简单的系统。

但事实是，人们被ChatGPT而不是ELIZA所欺骗，这表明这一结果“非同寻常”。

研究人员还指出，公众对AI的看法变化可能改变了我们从图灵测试中应预期的结果。

他们写道：“乍一看，低的人类通过率可能令人惊讶。

“如果测试衡量的是人类特征，人类不应该是100%吗？”

在1950年，这一假设完全合理，因为在一个没有先进AI的世界中，我们会认为任何听起来像人类的东西就是人类。

但随着公众对AI的认知增加，我们对AI的信心增加，我们更可能将人类误认为AI。

这可能意味着人类与ChatGPT-4通过率之间的小差距更能作为计算机智能的证据。

今年2月，斯坦福大学的研究人员发现ChatGPT可以通过一个版本的图灵测试，即AI回答一个广泛使用的人格测试。

尽管那些研究人员发现ChatGPT-4的结果与人类无异，但这篇最新的论文是AI首次通过基于对话的强大双人图灵测试之一。

不过，研究人员也承认，图灵测试有长期存在并且有效的批评。

研究人员指出，“风格和社会情感因素在通过图灵测试中比传统的智力概念起更大的作用”。

审问者更有可能引用风格、个性和语气作为识别其对话伙伴是机器人的原因，而不是与智力相关的任何因素。

同样，识别机器人的最成功策略之一是询问人类体验，这种方法在75%的时间里有效。

这表明图灵测试并不真正证明一个系统是智能的，而是衡量其模仿或欺骗人的能力。

研究人员认为，这最多只能“概率性地”支持ChatGPT具有智能的说法。

但这并不意味着图灵测试毫无价值，研究人员指出，模仿人类的能力将带来巨大的经济和社会后果。

研究人员表示，足够具有说服力的AI可以“在传统上由人类工人担任的客户面对面岗位上发挥经济价值，误导公众或其人类操作员，并侵蚀真实人类互动中的社会信任”。

最终，图灵测试可能只是我们在评估AI系统发展时需要考量的一部分。

沃森女士说：“纯粹的智力只能走到这一步。真正重要的是具有足够的智能来理解情况、他人的技能，并有同理心将这些元素结合在一起。

本文地址：http://ww.kub2b.com/tnews/3892.html 企库往 http://ww.kub2b.com/ , 查看更多

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

更多>同类生活信息

文章列表

相关文章

最新动态

推荐图文

生活信息

点击排行

• 耐水弹力海棉	• 耐水高强度海棉
• 防潮耐水EVA材料	• 耐油耐水海绵
• 供应耐水海绵	• 看了OPPO、vivo的新旗舰手机样张后，决定还是继
• 微信借钱不求人，6个步骤轻松搞定...手机微信怎	• 小米8系列手机，有它才叫防摔保护手机爆屏「小
• 米其林指南开启江苏篇章，“江苏味”如何与世界	• 重磅发布！5.4%！