当前位置:周记财经 > 资讯 > 正文内容

多项测试超越90%的人类,GPT-4会引发新一轮风暴吗

更新时间:2026-06-28 02:40:12 资讯3年前 (2023-04-15)47
3月15日,美东时间3月14日,OpenAI宣布推出大型语言模型的最新版本――GPT-4,该版本比以前的版本“更大”,称它可以接收图像和文本输入,输出文本,“比以往任何更具创造性和协作性”,并且“由于它有更广泛的常识和解决问题的能力,可以更准确地解决难题”。在内部评估中,它产生正确回应的可能性比GPT-3.5高40%。它将用于付费版ChatGPT Plus。ChatGPT是最近科技界最火爆的话题,GPT-3是世界上最大的大语言模型之一,其惊人的表现也让外界猜测下一代的GPT-4到底有多强大。据报道,GPT-4多项测试超越90%的人类,这不免成为人们关注的焦点。

3月15日,美东时间3月14日,OpenAI宣布推出大型语言模型的最新版本――GPT-4,该版本比以前的版本“更大”,称它可以接收图像和文本输入,输出文本,“比以往任何更具创造性和协作性”,并且“由于它有更广泛的常识和解决问题的能力,可以更准确地解决难题”。在内部评估中,它产生正确回应的可能性比GPT-3.5高40%。它将用于付费版ChatGPT Plus。

ChatGPT是最近科技界最火爆的话题,GPT-3是世界上最大的大语言模型之一,其惊人的表现也让外界猜测下一代的GPT-4到底有多强大。

OpenAI官方发布的宣传片中GPT的最新一代版本ChatGPT-4,相比上一代,其AI能力再度提升,同时支持输入的内容不再仅限于文字,还支持图像内容的输入,成为一个能够理解照片的人工智能。虽然ChatGPT-4未能实现音频解析,但新功能让人兴奋不已。

多项测试超越90%的人类,GPT-4会引发新一轮风暴吗

同时根据OpenAI介绍,GPT-4是一个多模态大型语言模型,即支持图像和文本输入,以文本形式输出;扩写能力增强,能处理超过25000个单词的文本。

OpenAI表示,新模型将产生更少的错误答案,更少地偏离谈话轨道,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。例如,GPT-4模拟律师考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。

虽然GPT-4更具创造力,并且能够处理更细微的指令,但官方也警告说,这些系统保留了许多与早期语言模型相同的问题,包括编造信息的倾向以及生成暴力和有害文本的能力,尽管如此,用户们还是为之振奋。

北京商报记者向GPT-4和GPT-3.5中输入“帮我出一个北京一日游的攻略”的问题。

由输入结果可知,在北京一日游的攻略中GPT-4明显时间安排与提醒更加细致贴心,内容上更丰富清晰,而同时GPT-3.5出现了序号错误。

再向二者输入第二个问题“解释一下幂函数”。

从答案可以看出,在幂函数的介绍上,GPT-4与GPT-3.5相比清晰地将定义、举例、应用表达出来,更具有逻辑性。

接着再同时输入“哈利波特是怎样的魔法师”。

在对哈利波特的介绍中,将“父母在他很小时被黑巫师伏地魔杀害”的内容表述成“年幼失去双亲”,显然GPT-4在语言上更加精炼。

GPT-4在不断学习之下,ChatGPT也变得更为聪明、准确。GPT-4相较于GPT-3.5更加具备规范和精确的语言能力,同时也具备更精确的知识。

据报道,GPT-4多项测试超越90%的人类,这不免成为人们关注的焦点。

北京光大银行(601818)一位计算机程序员向北京商报记者表示,目前对于银行这种要求严谨精确的系统来讲,短期内程序员是不会被机器替代的,机器还是存在更多的不确定性。在银行一直使用的是较为“老”而稳定的程序。

GPT-4的更新让大众受益,同样ChatGPT的开发者OpenAI在GPT-4的研发上已经取得了不少进展,各种猜测纷纭,有说其训练参数高达100万亿的,有说微软已经把GPT-4纳入最新版本的必应中。

本周,AI行业或将迎来“疯狂星期四”。百度此前宣布,将于3月16日(周四)发布旗下首款类ChatGPT产品“文心一言”。微软也透露,本周内将推出拥有更高性能的GPT-4。虽然目前尚未透露具体发布时间,不过考虑到3月16日也是微软的AI活动日,活动主题为“用人工智能重塑生产力”,而公司CEO将上台演讲,外界普遍认为当天这款产品将正式亮相。

北京商报记者 陶凤 实习记者 李想

返回列表

上一篇:股票601336

下一篇:永大集团股票

相关文章

谷歌人工智能Bard学会写代码啦!距离竞品的差距还是有“亿点点”大

谷歌人工智能Bard学会写代码啦!距离竞品的差距还是有“亿点点”大

  财联社4月21日讯 当地时间周五早晨,谷歌在官方博客宣布,苦苦追赶竞品OpenAI的Bard人工智能,终于拥有帮助用户生成并修正代码的能力了。  谷歌生成式模型的首席产品经理Paige Baile...

AI“百模大战”帷幕拉开:A股一众概念股傍上流量密码“直道冲锋”,业绩烂泥也想“弯道超车”,基金经理并未“大干快上”

AI“百模大战”帷幕拉开:A股一众概念股傍上流量密码“直道冲锋”,业绩烂泥也想“弯道超车”,基金经理并未“大干快上”

AI大模型技术掀起新一轮产业革命,不过有人戏称,大模型的涌现,比大模型能力的涌现都要快。AI领域从业者表示,即便是国外跑得最快的OpenAI以及微软,目前在商业化落地上虽已有进展但也不能说成熟稳定。另...

AI大战白热化 Wedbush称微软处于领先地位

AI大战白热化 Wedbush称微软处于领先地位

微软、谷歌等科技公司正在展开一场人工智能大战。不过,Wedbush Securities认为,微软在竞争中处于领先地位,这要归功于其对OpenAi的数十亿美元投资。Wedbush分析师Dan Ives...

OpenAI 确认通过 API 收集的数据不会用于训练 ChatGPT

OpenAI 确认通过 API 收集的数据不会用于训练 ChatGPT

IT之家 5 月 6 日消息,OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)向 CNBC 确认,该公司不再使用 API 客户数据来训练其大型语言模型。 OpenAI 于今年 3 月初...

OpenAI下周向ChatGPT Plus用户推出网络浏览和插件

OpenAI下周向ChatGPT Plus用户推出网络浏览和插件

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   雷递网 乐天 5月13日   人工智能公司OpenAI日前发文称,将在下周向所有ChatGPT Plus 用户推出网...

ChatGPT联网和插件功能它来了!真正迈向“可定制化的AI伙伴”

ChatGPT联网和插件功能它来了!真正迈向“可定制化的AI伙伴”

  财联社5月13日讯(编辑 周子意)人们期待已久的ChatGPT联网和插件功能要来了。ChatGPT开发商OpenAI公司周五(5月13日)发文称,“我们将在下周向所有ChatGPT Plus 用户...