OpenAI o1起源
OpenAI 在9月12日推出了新的OpenAI o1(OpenAI o1官网入口 https://openai.com/o1/),这是一种新的大型语言模型,经过强化学习训练来执行复杂的推理。
o1 在回答之前会思考——它可以在响应用户之前产生一个很长的内部思维链。就像人类一样,通过培训,它们学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。
作为早期模型,它尚不具备 ChatGPT 的许多有用功能,例如浏览网页以获取信息以及上传文件和图像。对于许多常见情况,GPT-4o 在短期内将更加强大。
但对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。鉴于此,OpenAI将计数器重置为 1,并将该系列命名为 「OpenAI o1」。
「关于o1、o1-preview、o1-mini的关系」
1、o1-preview是o1的第一个版本,也叫预览版。所以目前而言,在下一个版本更新之前o1-preview就是o1。 2、o1-mini就是o1的更快、更便宜的版本,特别擅长不需要广泛常识知识的编码、数学和科学任务。
OpenAI o1如何使用
使用方式有2种,可以在网页和API使用,具体方式如下:
一、OpenAI o1网页版:
在chatgpt官网https://chatgpt.com登录
「使用限制」:o1-preview 的每周速率限制为 30 条消息,o1-mini 的每周速率限制为 50 条。
二、OpenAI o1-API:
目前,只有符合API 5级资格的开发人员可以使用 API 中的 o1-preview 和 o1-mini 模型,速率限制为 20 RPM。API用户等级如下图:
按照这个标准,大部分人都不符合。那么就无法使用o1的API了吗?当然不是!
我们还可以选择国内的那些较大的ChatGPT中转站的API,他们大都可以拿到资格,之间购买他们的即可。
OpenAI o1模型能力
「能力测试」: o1模型更新在物理、化学和生物学方面具有挑战性的基准任务上的表现与博士生类似。我们还发现它在数学和编码方面表现出色。在国际数学奥林匹克(IMO)资格考试中,GPT-4o 只正确解决了 13% 的问题,而o1的得分为 83%。OpenAI o1 在竞争性编程问题 (Codeforces) 中排名第 89%,在美国数学奥林匹克 (AIME) 预选赛中跻身美国前 500 名学生之列。
「安全测试」: 在最难的越狱安全测试中,GPT-4o 得分为 22(评分范围为 0-100),而o1-preview 模型得分为 84。
「目标群体」: 如果您正在解决科学、编码、数学和类似领域的复杂问题,这些增强的推理能力可能特别有用。例如,医疗保健研究人员可以使用 o1 来注释细胞测序数据,物理学家可以使用 o1 生成量子光学所需的复杂数学公式,所有领域的开发人员可以使用 o1 来构建和执行多步骤工作流程。
「适用场景」: o1 模型在推理方面提供了显着的进步,但它们并不打算在所有用例中取代 GPT-4o 。对于需要图像输入、函数调用或持续快速响应时间的应用程序,GPT-4o 和 GPT-4o mini模型将仍然是正确的选择。但是,如果您的目标是开发需要深度推理并且可以适应更长响应时间的应用程序,那么 o1 模型可能是一个绝佳的选择。
对话ChatGPT,聊聊养老那些事儿
今年以来,ChatGPT靠“花式整活”火出圈,吟诗作赋、小说论文、高数代码等样样精通,又被称为“全能网友”。那么,在如今很多人都比较焦虑的“养老领域”,ChatGPT能提供有价值的回答吗?我们与Cha...
深入ChatGPT与AI营销前沿,助力提升成都产区酒企竞争力和创新力
为进一步加强协会会员单位沟通交流,凝聚共识,推动行业健康发展,搭建数字化创新发展时期的资源共享平台,帮助会员单位学习电商运营、直播带货方面的知识。5月16日,在邛崃市酒业青创企业家协会与副会长单位三十...
终于有本书讲清了ChatGPT和AIGC的前世今生!
AIGC的各大门派是谁?典型技术都有什么?AIGC为什么在绘画领域先破圈?ChatGPT的有哪些局限性?为何科技企业争相推出大模型?人类的创新能力会被AIGC取代吗……诸如此类的这些话题呈现爆发性增长...
问ChatGPT:情商低不会说话怎么办?
(图片来自网络,侵删)点击下方👇“九月与AI对话”关注公众号九月:情商低不会说话怎么办?ChatGPT:如果你感觉自己的情商较低,不擅长表达和沟通,可以采取以下措施来提升你的情商和说话技巧:1. 自...
ChatGPT之父舌战国会山!OpenAI欲与政府联手,权力通天
新智元报道编辑:编辑部【新智元导读】Sam Altman也迎来「周受资时刻」了,在国会山听证会上,他备受议员尊敬。OpenAI和政府一联合,他是要成为rulemaker、登顶硅谷之王了?上次是...
70多种插件加持,联网版ChatGPT评测来了
机器之心报道编辑:泽南、陈萍说不上无所不能,但也可以说是上天入地。自 ChatGPT 推出以来,大语言模型充斥着新闻版面。很多公司都在试图追赶 OpenAI,但作为先行者,ChatGPT 显得一骑绝尘...