北美商业电讯

| 简体 | 繁体 | 2024年11月22日
+
订阅

GPT-4重磅发布:不仅吊打ChatGPT,还吊打90%的人类?!

更新于2023-03-15 17:23

ChatGPT刷屏热潮还没过,其开发商OpenAI又扔下一枚重磅炸弹。

强势来袭

美东时间3月14日,OpenAI公布了其大型语言模型的最新版本——GPT-4。

据OpenAI介绍,GPT-4是一个多模态大型语言模型,能接受图像和文本输入,输出文本内容。虽然GPT-4在许多现实场景中的能力不如人类,但在各种专业测试和学术基准上的表现与人类水平相当。

比如,在美国BAR律师执照统考模拟中,GPT-4在考生中排名前10%左右,击败了90%的人类;在“美国高考”SAT的数学考试中,GPT-4得分约为前11%。

由于出众的考试能力,GPT-4甚至被网友戏称为“硅谷做题家”。

功能大升级

对于外界关注的GPT-4与其前身GPT-3.5(ChatGPT 的基础)之间的区别,OpenAI在其报告中也给出了详细的对比说明。

从下图可以看出,在大多数为人类设计的模拟考试中,GPT-4的表现都远胜于GPT-3.5。

另外,GPT-4对于英语以外的语种支持也得到极大的优化。

在测试的26种语言中,GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能,其中包括部分低资源语言如拉脱维亚语、威尔士语等。在中文语境中,GPT-4能够达到80.1%的准确性。

GPT-4单次提问的字数限制也进行了提升,在对GPT-4提问的时候,一次性能够输入长达25000单词。

值得注意的是,与之前只能处理文本的GPT模型相比,GPT-4功能最大的突破之一就是能接受图像和文本输入,输出文本内容。

比如,GPT-4能看着一张图解释这张图的笑点在哪里,并对图片中的每部分进行描述。

GPT-4还能描述出一张图片的不和谐之处。

GPT-4甚至能阅读论文截图,对内容和图表进行总结和解释。

局限性仍在

尽管功能强大,但GPT-4仍存在局限性。

OpenAI称,它并不完全可靠,可能会出现推理错误 ,“GPT-4缺乏对绝大多数数据切断后(2021年9月)发生的事件的了解,并且无法从中吸取经验教训……它有时会出现简单的推理错误,它会轻信用户明显的虚假陈述,有时它会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。”

基于此,OpenAI提醒,用户在使用语言模型时应格外小心,最好辅助以人工审查、附加上下文、或完全避免在高风险情况下使用它。

另外,GPT-4目前不提供免费版本,仅向ChatGPT Plus的付费订阅用户及企业和开发者开放。

科技巨头内卷继续

据悉,目前已有多家公司要将GPT-4结合到他们的产品中,比如,Stripe使用GPT-4扫描商业网站并向客户支持人员提供摘要,Duolingo将 GPT-4构建到新的语言学习订阅层中。摩根士丹利正在创建一个由GPT-4驱动的系统,该系统将从公司文件中检索信息并将其提供给金融分析师。可汗学院正在利用GPT-4构建某种自动化导师。

GPT-4此番来势汹汹,势必将再次引发全球科技大厂的内卷。

为反击ChatGPT,Google前不久宣布将推出一款名为Bard的实验性对话AI服务。而在昨日,谷歌宣布开放自家的大语言模型 API 「PaLM API」,还发布了一款帮助开发者快速构建AI程序的工具 MakerSuite。谷歌表示,此举是为了帮助开发者们快速构建生成式AI应用。

微软则选择继续扩大与OpenAI的合作伙伴关系,除了向OpenAI追加数十亿美元投资,微软还将ChatGPT整合入自家搜索引擎Bing,以及Office办公套件:Word、Excel、PPT。

值得注意的是,被视为中国版ChatGPT的百度AI产品“文心一言”将于3月16日发布。


主编精选,篇篇重磅,请点击订阅“邮件订阅

编辑:Ke
版权声明:本文版权归北美商业电讯所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。
评论
用户名: 登录可见
匿名
发表评论
×

分享到微信朋友圈

打开微信点击底部的“发现”
使用“扫一扫”即可将网页分享至朋友圈