2024年9月13日,OpenAI公司宣布推出其全新的AI模型:o1,在数学、编程和科学问题的解决处理能力上取得了显著进步。该模型通过自我对弈强化学习(Self-play RL)和思维链(Chain of Thought, CoT)技术,展现出复杂逻辑推理和问题解决能力,同时也为多个领域的应用提供了新的机遇。
o1大模型在这些领域的具体表现:
- 竞赛级数学领域:在国际数学奥林匹克(IMO)资格考试中,o1大模型正确解答了83%的问题,这一比例远高于GPT-4o的13%。这表明o1在处理复杂的数学问题时具有更高的准确性和推理能力。
- 复杂编程领域:在编程竞赛平台Codeforces中,o1大模型的表现排在所有人类参与者89%的百分位,这意味着它能够编写出高质量的代码,并解决编程中的难题。此外,o1大模型在国际信息学奥林匹克竞赛(IOI)赛题上得到了213分,达到了排名前49%的水平,显示了其在编程领域的高级技能。
- 物理/化学/生物等领域:o1大模型在物理、化学和生物学等领域的挑战性基准测试中,表现出与博士生相似的水平。它能够进行深入的思考和推理,解决科学问题,这在以往的模型中是难以见到的。
1 全球市场AI应用情况
根据 SimilarWeb 统计及非凡产研整理,2024 年 8 月全球访问量 Top20 的 AI 应用以头部互联网公司和垂类龙头为主,月访问量过亿的应用共 11 款,较 7 月持平。Top20 应用访问量合计较上月环比上升 3.9%。访问量排名前五的应用分别为来自微软的聊天机器人ChatGPT 和搜索引擎 Bing、在线设计工具 Canva、来自谷歌的聊天机器人 Gemini 以及角色扮演 AI 聊天机器人 Character.AI。
2024 年 8 月全球访问量增速最快的应用分别为 KLING AI、Midjourney、SpicyChat.AI, 访问量分别同比增长 591.54%、20.65%、17.26%。其中 KLING AI(可灵 AI)是由快手大模型团队自研打造的视频生成大模型,现已支持文生视频、图生视频、视频续写、运镜控制、首尾帧等多个能力(详见AI周报6.30-7.6)
2 国内市场AI应用情况
根据 SimilarWeb 统计及非凡产研整理,2024 年 8 月国内 Top20 的 AI 应用访问量均超过百万次。访问量排名前三的应用分别为 Kimi.ai、文心一言、豆包,访问量分别为 2,285万次、1,900 万次、1,080 万次。国内 Top20 应用访问量合计较上月环比上升 2.0%。
2024 年8 月国内访问量 Top50的 AI应用中增速最快的应用分别为百度 Chat、腾讯元宝、 沉浸式翻译,分别同比增长 159.37%、35.13%、31.38%。
其中,沉浸式翻译是一款浏览器插件,支持多种主流浏览器和平台。它不仅可以在Chrome、Edge、火狐(Firefox)、Safari等桌面端浏览器上使用,还可以在iOS和Android移动端设备上安装。此外,该插件还支持Windows、macOS等操作系统。关于翻译接口方面,沉浸式翻译内置了多种翻译引擎,包括Google翻译、DeepL、OpenAI(ChatGPT)、Bing翻译、有道翻译、彩云小译、百度翻译、火山翻译、小牛翻译等。