开发者朋友们大家好:
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE (Real Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@Asui,@CY
01有话题的新闻
1、百度文心一言推出专业版,定价为 59.9 元/月
百度上线文心一言专业版,单月购买定价为 59.9 元/月,连续包月优惠价 49.9 元/月。此前已经向用户开放的文心一言基础版,仍可免费使用。据介绍,文心一言会员版基于文心大模型 4.0。基于 4.0 的专业版具备更强的模型能力和图片生成能力。支持各种插件,适合需要使用文心一言进行代码编程、文案撰写、绘画设计等专业工作需求的用户。(@TechWeb)
2、阿里巴巴平头哥发布首颗 SSD 主控芯片镇岳 510
在 2023 云栖大会上,阿里巴巴平头哥发布旗下首颗 SSD 主控芯片镇岳 510,该芯片为云计算场景深度定制,实现 4μs 超低时延,误码率低至 10^-18。镇岳 510 将率先在阿里云数据中心部署,可应用于 AI、在线交易、大数据分析、高性能数据库、软件定义存储等业务场景。(@IT之家)
3、ChatGPT 真实参数只有 200 亿,首次被微软曝光!
近日,整个大模型圈都在谈论同一件事。微软论文里一张“乍一看不足为奇”的统计图,泄露了“天机”。引领全球风暴的 ChatGPT,背后大模型参数竟只有 200 亿?论文一经发布,就吸引了国内外众多关注。不少网友还不相信:确定不是拼写错了?
也有人开始了阴谋论,或许这是 OpenAI 开源的“前菜”,故意而为之 ——因为不少大模型已经追赶上来了,而且早在今年 5 月,外媒就曾爆料 OpenAI 准备开源新大语言模型。值得一提的是,早在今年 2 月份福布斯一则新闻报道里,就曾透露过 ChatGPT 只有 200 亿参数。(@量子位)
4、印度取消电脑进口禁令 联想、小米等 110 家公司获得进口许可
印度新"进口管理制度"已生效,苹果、戴尔、三星、联想等 110 家公司获准进口电脑产品与服务器。此前印度取消了许可制度,改为企业在门户网站上登记进口数量和价值,授权至 2024 年 9 月。新制度旨在监控个人电脑进口,同时刺激本国制造业。(@腾讯科技)
5、更多硬件加入了对 AV1 编解码器的支持
苹果最新发布的 M3 系列处理器包含了对 AV1 编解码器的硬件解码支持,苹果上个月推出的 iPhone 15 Pro 和 iPhone 15 Pro Max 也都有 AV1 的硬件解码器,Android 中高端手机今年逐渐开始采用的高通骁龙 8 Gen2 支持 AV1。随着 Android 14 强制要求支持 AV1,AV1 编解码器的硬件支持正逐渐普及。AV1 是 AOMedia 在 2018 年释出的开源免专利费编解码器。Google 旗下的流媒体平台如 YouTube,英特尔、英伟达和 AMD 的最新显卡都加入了 AV1 硬件加速支持。(@Solidot)
6、华为小米后,vivo 推出自研蓝河操作系统
11 月 1 日,vivo 推出自研蓝河操作系统 BlueOS。据介绍,蓝河操作系统的系统框架语言由 Rust 编写,拥有应用开发新范式、虚拟显卡框架和超级协程机制,并采用分布式设计理念,兼容行业标准协议。
vivo 表示,首款搭载蓝河操作系统的产品,将会是 vivo WATCH 3。(@界面新闻)
7、未经允许生成其声音,影星斯嘉丽・约翰逊对一家 AI 开发商提起法律诉讼
11 月 2 日消息,据 Variety 报道,影星斯嘉丽・约翰逊正对一家 AI 应用开发商提起法律诉讼,因为该公司的一则广告擅自使用了她的姓名、肖像乃至声音。
报道称,这家开发商为一款名为「Lisa AI:90s Yearbook&Avatar」的 App 制作了这段广告,展现了斯嘉丽・约翰逊在拍摄《黑寡妇》时的幕后花絮。广告中的斯嘉丽说道:「大家好吗?我是斯嘉丽,请跟我走吧。」但随后,一个利用 AI 生成的声音「说」,「它能够制作的不仅是头像,你还可以利用 AI 创作视频。」其音色与斯嘉丽・约翰逊本人的相似。
在广告的最下方,开发商添加了「这段影像由 Lisa AI 制作,与当事人无关」的字样。斯嘉丽・约翰逊的律师表示,「我们不会对这类事件掉以轻心,按照一贯做法,我们将采取一切法律措施来处理这件事。」(@IT之家)
8、首款国产 5G 基站核心芯片上架淘宝
赶在双 11 前,国资委旗下淘宝店开业,16 款代表中国智造的新一批“大国重器”集中上架淘宝。一款“破风 8676”芯片是中国首款商用可重构 5G 射频收发芯片,此前,此类 5G 基站核心芯片大部分还是国外垄断,因此这款芯片实现了射频收发芯片的国内空白,成为了我国通讯史上里程碑式事件。(@观察者网)
02有思考的文章
1、对话智源林咏华:有些大模型的评测基准已经失去意义(@未来科技力)
智源研究院理事长张宏江在为图灵奖获得者 Yann LeCun 的自传《科学之路》作序时有这样一句话:
“历史上多数突破性研究成果的出现都是偶然事件,而研究机构所有努力都是为了提升这类偶然事件发生的概率。”
朝着 ChatGPT 追赶,修炼基础大模型,成了从去年年末开始全球 AI 领域最直觉性的奋斗路径。现在是 ChatGPT 出现的 11 个月之后,几乎一年。智源研究院拿出最新开源模型的时候,闭源的 GPT-4 在相当多的任务类型上一骑绝尘,Claude-2 在身后紧追,全球围绕开源模型 Llama 2 所建立的上下游生态在迅速丰富,而国内冒出的大模型厂商已经几乎达到 100 家。
大模型的发展跑的太快了,最直白的参照是模型能力评价方法的严重滞后。“如果我们根本不能预测这个模型它能做什么,那我们又该用什么题去考它呢?”智能研究院副院长兼总工程师林咏华提出了这样的问题。
10 月 26 日,2023 界面 REAL 科技大会后,我们有机会和这位智源研究院内部,语言大模型、大模型技术栈、AI 系统研发的负责人有一次对话的机会。现在将其中一些关于大模型评测方式现状,以及中国开发者该如何看待开源这件事的讨论整理出来。
2、从 1080P 到广播级 4K,实时互动的高清画质究竟进化到了什么程度?(@巨头财经)
从阴极射线管(CRT)的发明、液晶显示技术的诞生,到智能手机时代的高分辨率屏幕、HDMI2.0 版本推出进入真 4K 时代,再到如今,处处都是高清显示屏、高清直播、高清视频流、高清 VR 体验。数字高清这条技术道路演进,基本追寻摩尔定律,每 18 个月高清效果提升一倍,每 18 个月高清显示成本降低一半(没那么严谨,总体是吻合的)。
人类这种碳基生命,对高清体验有三层有趣的潜意识:
第一层,高适应性。无论多快速的技术迭代,人类总是能更快速地适应,毫无障碍;
第二层,不满足性。原理也很简单,和人类生命数十亿年进化比,数字化还在初阶阶段,从理论上来讲,人的眼睛视网膜有几百万个锥形细胞,还含有上亿个棒状细胞,最少达 5 亿像素,比当前最先进的相机还要先进;
第三层,不可逆性。比如近视人群,一戴上适合的眼镜就很难摘下;比如习惯了 4K 视频,再也无法忍受 360p/480p 的观感。
这些年,消费者对观看直播、视频互动时的视频画质要求越来越高,用户的音视频消费习惯,逐渐从简单的信息交换转向追求真实还原。实时互动的高清画质究竟进化到了什么程度了呢?
写在最后:
我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
素材来源官方媒体/网络新闻