11月14日,金融时报消息,OpenAI正在向微软寻求新一轮融资,用于开发超级智能向AGI(通用人工智能)迈进,包括最新模型GPT-5。
最近,OpenAI召开了首届开发者大会,推出了GPT-4 Turbo、自定义GPT、Assistants API、GPT商店等一系列重磅产品,意在构建更强、更广的ChatGPT商业生态,但距AGI还有不小的距离。
OpenAI表示,正在开发的最新模型GPT-5,是实现AGI的核心功能之一。但这需要耗费巨量资金用于构建算力环境、运营成本、人力成本等。所以,与微软继续合作是其最佳选择之一。
关于AGI的更详细介绍,可以查看《谷歌提出AGI的6大原则,和5大能力等级》这篇文章。
OpenAI首席执行官兼联合创始人Sam Altman在接受《金融时报》采访时表示,我们与微软的合作良好,预计随着时间推移,会从微软和其他投资者那里获得更多的融资,用于开发更强大的模型。
关于GPT-5
对于GPT-5的开发进展,Sam认为,除了更强的技术架构之外,需要海量数据集进行训练包括互联网公开的和非公开的专属私有数据。所以,短缺的训练数据将是开发GPT-5的一个重要难点。
为了解决这一难题, OpenAI成立了“数据合作伙伴联盟”, 将与组织合作生成用于训练 AI 模型的公共和私有数据集。(申请加入该数据联盟:https://openai.com/form/data-partnerships)
这有助于大模型深度了解全球各个行业的运作模式、不同种族的语言/文化、人类的工作思维/意图,为AGI实现跨行业、应用执行任务,奠定重要的基础。
OpenAI搜集的数据类型包括文本、图像、视频、音频等,尤其是那些超长的跨语言的非公开数据,能深刻表达人类意图、情感的内容。
目前,OpenAI提供了两种数据合作模式:公开数据集,主要用于训练OpenAI的开源模型,例如,语音模型Whisper;私有数据集,用于训练最新研发模型、微调和自定义模型,同时会保证用户的敏感数据不会被搜集。
目前,冰岛已经参与了这个计划,帮助大模型熟悉冰岛的语言、工作模式;非营利法律组织Free Law Project也参与了,提升大模型对法律工作模式的深度理解。
关于GPT-5功能方面,Sam表示,GPT-5将比OpenAI之前发布的所有模型都特殊、复杂。从技术层面来看,很难精准预测该模型到底有哪些新功能。
对于开发人员本身,都像是在开发一个“未知的魔盒”,这是一件非常有趣的事情。不过有一点是可以确认的,GPT-5的安全性和稳定性将比之前的更好。
OpenAI的救星——微软
在2018年,马斯克因为理念不同离开OpenAI后,让其陷入了孤立无援的状态。在2019年,7月22日微软向OpenAI投资了10亿美元,将其拉离了生死线,并正式开启“大模型狂奔模式”。
同年,OpenAI发布了GPT-2模型,引起了业界广泛关注。GPT-2在许多自然语言处理任务上取得了令人瞩目的成绩,但也因其潜在的滥用风险而在发布时受到了限制。
2020年,得益于微软的资金和技术支持,OpenAI加快了研究进程发布了当时世界上最强大拥有1750亿参数的GPT-3模型,在文本生成、摘要、问答、翻译等多种任务上表现出色。
2021年,微软将GPT-3实现商业化内置在Microsoft Power Platform 低代码产品矩阵中,并通过该模型开发了低代码语言Power Fx。
所以,微软除了是OpenAI的投资者还是其伯乐,在整个公司的发展和产品迭代方面发挥巨大作用。
如果没有当年微软的10亿美元,可能我们就无法看到现在影响全球的ChatGPT。
本文素材来源金融时报官网、OpenAI官网,如有侵权请联系删除