中国大模型开源创新与合作的新篇章 | 2023 CCF中国开源大会

news2024/10/6 22:33:27

2023年10月21日至22日,由中国计算机学会(CCF)和开放原子开源基金会联合主办的CCF中国开源大会(CCF ChinaOSC)在湖南省长沙市北辰国际会议中心成功召开。此次大会以“开源联合,聚力共赢”为主题,旨在推动国内外开源事业的交流与合作,共同探讨开源未来的发展方向和趋势。

2023 CCF中国开源大会现场

高文院士:大模型开源推动技术创新与产业发展

在21日的主论坛会议上,鹏城实验室主任、中国工程院院士高文发表了题为《鹏城·脑海预训练大模型底座与开源合作》的报告。高文院士详细介绍了鹏城脑海预训练大模型的底座技术和应用场景,并强调了开源合作的重要性。他指出,以ChatGPT为代表的聊天预训练大模型已经对人类经济生活产生了巨大的影响。而这种影响背后,强大的算力基础是大模型能够理解海量数据并不断演化的关键因素。

高文院士表示,基于鹏城云脑II先进自主E级智能算力平台,鹏城实验室正在持续训练鹏城·脑海大模型底座。脑海是一个完全自主可控、开源开放的自然语言稠密大模型,参数级别达到2000亿,性能达到国际先进水平。他强调,鹏城·脑海大模型底座的输出内容符合中文核心价值观,这对于推动大模型在国内的发展具有重要意义。

高文院士还指出,开源已经成为推动技术创新和产业发展的重要力量,而大模型开源更是未来发展的重要方向之一。通过开源开放的方式,可以汇聚全球的智慧和力量,加速大模型的研发进程,并且推动大模型在各个行业和领域的应用。他表示,鹏城实验室已经开放基于鹏城·脑海自然语言预训练大模型底座的合作,将持续共建大模型开源联合体,助力国产自主创新的大模型生态发展。

大模型开源创新研究联合体:联接资源,推动创新

为进一步推动大规模模型的研究和发展,促进学术界和工业界的交流与合作,以及汇聚全球的智慧和力量,会上进行了“大模型开源创新研究联合体”的成立仪式。由OpenI启智社区运营中心主任余跃博士为大家简单介绍关于成立“大模型开源创新研究联合体”的背景和目的。他表示,该联合体的主要目标是通过将三种创新体相互联接以构建更好的大模型开源发展生态。

第一种是对计算资源跨域协作的联接。目前通过中国算力网加入联合体的有鹏城云脑以及来自全国的8家智算中心。这种联接方式旨在优化和整合各中心的资源,打破孤立,实现资源共享,以推动大规模模型的开发和研究。

第二种是对包括了鹏城·脑海在内的大模型主体的联接。鹏城·脑海是一个强大的AI模型,具备深度学习和推理能力。通过联接这些模型,开发者可以更方便地利用这些模型进行研究和开发,进一步推动大模型的发展和应用。

第三种是对包括科研机构、高校、企业等群智主体的联接。这种联接方式旨在促进学术界和工业界的交流与合作,汇聚全球的智慧和力量,共同推动大模型技术的不断发展和应用。

在成立仪式上,由中国工程院院士王怀民、余跃博士以及来自北京昇腾人工智能计算中心、天津人工智能计算中心、沈阳人工智能计算中心、大连人工智能计算中心、长春算力中心、西安未来人工智能计算中心、武汉超算中心&人工智能计算中心、成都智算中心8家计算中心代表上台联合见证了这一重要时刻。大模型开源创新研究联合体将成为人工智能领域的一个重要平台,为未来的技术创新和发展奠定坚实的基础。

中国大模型开源之路:专家探讨文化、技术与企业实践

繁荣中国开源生态,促进中国开源发展,离不开产学研的参与和努力。会上,由中国科学院院士、CCF开源发展委员会主任王怀民主持了以“中国大模型的开源发展之路”为主题的开源高峰论坛,与会嘉宾包括高文院士、复旦大学计算机学院教授邱锡鹏、清华大学计算机系WeBank讲席教授唐杰、阿里云CTO周靖人以及百川智能创始人兼CEO王小川。这些嘉宾就中国大模型的开源发展问题进行了深入探讨,并提出了宝贵的建议。

其中,高文院士强调了开源的重要性,认为开源本身是一种文化。传统的软件开源与大模型的开源并没有本质差别,都需要构建合作伙伴关系、建立生态。大模型开源后,其影响力将更广泛,更多的开发者和企业将能够基于它来开发更多应用与服务。他还特别提到OpenI启智社区,其独特之处在于它成功地从实验性科研项目发展成为备受开发者喜爱的开源社区。他认为,吸引并服务好年轻人是关键,让社区成为大家喜爱的聚集地是社区建设最重要的任务。

唐杰教授则从技术角度出发,探讨了大模型的开源技术挑战和解决方案。他认为,解决模型的可解释性、隐私保护以及跨语言、跨领域等问题是大模型开源的关键。同时,他还分享了如何利用强化学习等技术来优化大模型的性能。

邱锡鹏教授表示,大模型的开源将促进更多的创新和合作。他认为,在开源社区中,应该注重培养年轻的人才,让他们成为推动大模型开源发展的重要力量。

周靖人则从企业的角度出发,分享了阿里云和魔搭社区在大模型开源方面的探索和实践。他认为,企业应该积极参与大模型的开源工作,通过合作来推动技术的发展,同时也要注重保护知识产权。

王小川提出模型开源比以往的项目开源更积极,开源之后,大家能基于模型很快搭建自己的服务平台,可用性较以往大有提升。他表示,百川智能将致力于推动大模型的开源发展,通过建立合作伙伴关系、培养人才以及加强技术研发等方面来推动中国大模型开源的进步和发展。

最后,王怀民院士总结了本次对中国大模型的开源发展之路的讨论,他表示,我们感受到中国建设的大模型开源创新环境具有吸引力,吸引中国开发者乃至全球创新者的关注。未来期待基于大模型开源激发我国人工智能应用创新,助力中国信息产业发展。

中国大模型开源事业的健康发展、开源生态的良性构建,离不开政府、企业、科研机构以及各界开源爱好者的持续支持和广泛参与。最后,OpenI启智社区热烈欢迎对鹏城·脑海大模型开源感兴趣的组织机构通过以下联系方式加入大模型开源创新研究联合体,期待在各方的支持下,中国的大模型开源事业能够取得更大的突破和进步。

鹏城·脑海大模型网址:

OpenI - 启智AI开源社区提供普惠算力!

联系邮箱:

secretariat@openi.org.cn

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1124134.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

硬件信息查看工具 EtreCheckpro mac中文版功能介绍

etrecheckpro mac中文版是一款专业的硬件信息查看工具,它能够快速的检测Mac电脑的软硬件信息,加强用户对自己计算机的了解,EtreCheckPro for Mac下载首先会对电脑的软硬件信息进行扫描收集,之后才会显示出来。EtreCheck Mac版报告…

数据结构 哈希表

数据结构 哈希表 文章目录 数据结构 哈希表1. 概念2. 冲突-概念3. 冲突-避免3.1 哈希函数设计3.2 负载因子调节 4.冲突-解决4.1 闭散列4.2 开散列(哈希桶)4.3 哈希桶实现 5. 性能分析6. 和java类集的关系 1. 概念 顺序结构以及平衡树中,元素关键码与其存储位置之间…

k8s----11、service

services 1、概述2、存在的意义2.1 服务发现2.2 负载均衡 3、pod与service的关系4、service 三种类型4.1 、 ClusterIP4.2 、NodePort4.3 、LoadBalancer 1、概述 Service 是 Kubernetes 最核心概念,通过创建 Service,可以为一组具有相同功能的容器应 用提供一个统…

说说腾讯云新用户那些事以及产品首单说明

腾讯云新用户是什么意思?新用户是指从未在腾讯云购买过云产品的用户,新用户可以购买特价服务器你不会不知道吧?一定要珍惜你的新用户资格,因为腾讯云很多优惠价格都是新用户专享的。腾讯云百科txybk.com来详细说下什么是腾讯云新用…

Windows安装cygwin + swoole,并配置crontab定时任务

一、Windows安装cygwin 安装包下载 自行搜索安装包进行下载,目前官网无法打开。官网地址:http://www.cygwin.com/ cygwin安装详细教程 1. 打开安装包:setup-x86_64.exe 2. 点击“下一页”,选择第一种方式后再点击“下一页” 3…

NFTScan | 10.16~10.22 NFT 市场热点汇总

欢迎来到由 NFT 基础设施 NFTScan 出品的 NFT 生态热点事件每周汇总。 周期:2023.10.16~ 2023.10.22 NFT Hot News 01/y00ts:迁移回以太坊的跨链桥已上线,将承担第一天所有 Gas 费 10 月 16 日,y00ts 发推称,将 y00…

Etsy店铺防防关联,自养号防关联环境搭建要点

Etsy是美国一个在线销售手工工艺品的网站,主要为客户提供定制化的手工制品和古董收藏品等。同时,该平台还为设计师、工匠和买家提供了一个可靠的交易平台。 在Etsy平台上,用户可以开设店铺,销售各类产品,包括摄影、艺…

halcon 多车牌识别

文章目录 车牌定位字符分割字符识别多张图片 车牌定位 dev_close_window() dev_open_window(0,0,512,400,black,WindowHandle) list_image_files(C:/Users/Augustine/Desktop/车牌照图片,jpg,[],ImageFiles) for i:0 to |ImageFiles|-1 by 1read_image(Image, ImageFiles[i])*…

GoLong的学习之路(一)语法之变量与常量

目录 GoLang变量批量声明变量的初始化类型推导短变量声明匿名变量 常量iota(特殊)(需要重点记忆) GoLang go的诞生为了解决在21世纪多核和网络化环境越来越复杂的变成问题而发明的Go语言。 go语言是从Ken Thomepson发明的B语言和…

RPA对财务报表的影响

在企业的财务管理中,财务报表分析能够帮助管理人员及时掌握企业的生产经营状况与财务状况,并为管理人员的科学决策提供财务数据支撑,规避企业经营风险。然而,传统的财务报表准备过程通常是繁琐、耗时和容易出错的,RPA技…

如何给R128在FreeRTOS下配置/data目录

在调试音频、usb等模块时,会发现SDK的根目录下没有/data该目录,导致无法存储所需要的文件,这就是因为/data目录没有配置好的原因。 1、选上配置 首先需要选上的配置: 运行mrtos_menuconfig,选上COMPONENT_LITTLEFS …

IDC报告:腾讯云领跑工业云市场,装备制造领域位列行业第一

10月23日,全球领先的IT市场研究和咨询公司IDC发布了《中国工业云IaaSPaaS市场份额,2022:分化初现》报告,腾讯云凭借领先的技术优势和助力实体经济数字化转型成果,成为头部厂商中增速最快的云计算厂商。在装备制造领域&…

服务器数据恢复-raid0硬盘故障导致服务器崩溃的数据恢复案例

服务器故障&分析: 某公司一台服务器,共2块磁盘组建了一组raid0磁盘阵列。RAID0阵列中有1块硬盘出现故障离线,导致服务器崩溃。 通过和用户方的沟通,北亚企安数据恢复工程师初步判断:故障服务器中出现故障离线的硬盘…

为什么学完了 C#觉得自己什么都干不了?

为什么学完了 C#觉得自己什么都干不了? 俺一向的观点:(1)学跟干是两码事。学,你要往外掏钱或时间或两个都得掏。干,是你从别人兜里掏钱。(2)如果没有干的需求,那么可以啥…

软件外包开发迭代管理工具

软件迭代的管理工具有助于团队有效地规划、跟踪和管理迭代开发过程,确保项目按时交付,并与团队成员之间进行协作。以下是一些常用的软件迭代管理工具,希望对大家有所帮助。北京木奇移动技术有限公司,专业的软件外包开发公司&#…

【触想智能】工控一体机与5G物联网技术结合是未来发展趋势

工控一体机也叫工业电脑一体机,是工业应用非常重要的一种产品。目前,工控一体机在工业领域的应用已经非常普及,在繁忙的生产车间、数字化机床、自助服务终端设备等场景中,我们都有看到它的身影。 工控一体机应用的普及已经潜移默化…

Java程序设计2023-第四次上机练习

8-1三子棋 编写程序,实现简单的三子棋游戏。在三子棋中,双方在33的棋盘中轮流下棋,一方用*示,另一方用O表示。如果一方的3个棋子占据了同一行,同一列或者对角线,则该方获胜。如果棋盘已被棋子占满&#xf…

LLM实战(二)| 使用ChatGPT API提取文本topic

在大模型前时代,构建机器学习模型通常需要标注数据,然后使用这些标注数据来训练机器学习模型,这个过程一般需要几个月的时间,然而,在大模型时代下,几个小时就可以完成,比如情感分类,…

Windows环境如何使用Zblog+cpoalr搭建个人网站并远程访问?

文章目录 1. 前言2. Z-blog网站搭建2.1 XAMPP环境设置2.2 Z-blog安装2.3 Z-blog网页测试2.4 Cpolar安装和注册 3. 本地网页发布3.1. Cpolar云端设置3.2 Cpolar本地设置 4. 公网访问测试5. 结语 1. 前言 想要成为一个合格的技术宅或程序员,自己搭建网站制作网页是绕…

sql server 生成连续日期和数字

在sqlserver里,可以利用系统表master..spt_values里面存储的连续数字0到2047,结合dateadd()函数生成连续的日期 select convert (varchar(10),dateadd(d, number, getdate()),23) as workday from master..spt_values where type…