Meta/东京电子/FPT软件等共同贡献,Aitomatic发布首个半导体行业开源大模型,「锁死」企业技术自主权

news2024/9/21 18:36:02

2024 年初,研究机构 Market.us 发布报告预测,全球半导体市场规模将大幅增长,预计 2024 年可达到 6,731 亿美元,到 2032 年预计将增长至 1.3 万亿美元。

毫无疑问,这个万亿级市场与充满想象空间的 AI 密不可分。技术层面,无论是通信还是推理,都需要芯片提供支持;产业链上,无论是消费电子还是产业端应用,无论是硅谷巨头还是初创企业,都不得不「仰仗」芯片厂商才能践行其创新方案。

近年来,国内外的多家科技巨擘都或多或少地感受到了半导体行业的高壁垒,同时,英伟达市值在一年内从 1 万亿美元到 3 万亿美元的飙升,也再次昭示了,其技术护城河之强硬并非朝夕可争。尽管如此,我们还是能够看到越来越多的初创企业投身其中,OpenAI、亚马逊、谷歌等巨头也纷纷下场,试图通过自研芯片实现一定程度的自主化并降低对英伟达的依赖性、提高议价权。

此外,半导体领域的研发经验与资金支撑也十分重要。尤其是在先进制程工艺逼近摩尔定律极限之际,如何通过优化设计架构、创新工艺流程等方法,来满足持续走高的 AI 应用需求,已经成为了半导体行业的新一代技术攻坚挑战。

不过,在这个数据驱动创新的时代,AI 也开始「反哺」半导体行业, 为其突破技术瓶颈开辟新思路。

近日,工业领域 AI 革新领军企业 Aitomatic 宣布推出世界上首个专为半导体行业设计的开源 AI 大语言模型 SemiKong,旨在优化半导体工艺及制造技术。

值得关注的是,Aitomatic 此前已经发布了 AI Agent aiKO、aiVA,并基于 domain-specific knowledge 在半导体、制造业、暖通空调、汽车等领域,实现了成熟应用,能够解决复杂问题。

AI 反哺半导体,Aitomatic 已有成熟项目

SemiKong 并不是大语言模型在半导体领域的首秀。今年 1 月,英伟达发布了一个以自家内部数据为基础训练而成的定制大语言模型——ChipNeMo,在预训练期间所用到的内部数据训练语料库就有 231 亿 token,涵盖设计、验证、基础设施,以及相关的内部文档。所以,该模型发布后并未对外公开使用权,而是仅供员工内部使用。

* 点击查看完整报道:自己卷自己?英伟达发布大模型 ChipNeMo,专为芯片设计定制

而开源的 SemiKong 则是获得了 AI Alliance 的大力支持。

Aitomatic 首席执行官、SemiKong 项目的负责人 Christopher Nguyen,同时也是 AI Alliance 基础模型重点领域的联合负责人。他表示,SemiKong 对于以竞争保密著称的半导体行业来说是史无前例的。在鼓励公司/工具/工艺/设备等层面的专有差异化和竞争的同时,共享基础层研发成果是利大于弊的。

在这里插入图片描述

Christopher Nguyen 在其社交平台上发声

生于开源环境下的 SemiKong 集百家之长,基于 AI Alliance 成员 Meta 的开源 Llama 3 模型,利用东京电子 (Tokyo Electron)、FPT Software 等半导体企业的 AI 专业知识,在半导体工艺的准确性、相关性和理解方面都有显著改进,表现优于通用模型。

值得注意的是,这不是 Aitomatic 首次试水半导体行业。

Aitomatic 曾推出了名为 aiKO 的 AI Agent, 基于企业用户的专业知识、数据,为其构建专属 Agent,企业对于其 Agent 拥有「完全所有权 (Full Ownership)」。同时,由于使用了企业的内部数据,以及相关专家的专业知识进行训练,使其 Agent 能够更好地适应公司的业务逻辑是实际需求。

具体而言,全球领先的半导体巨头东京电子利用 Aitomatic aiKO Agent 创建了半导体优化 Al Agent,通过消化学习工程师过往筛选的冗长数据表,为光刻等复杂工艺中的异常情况提供即时、精确的建议,使得诊断时间缩短 4 倍,停机时间减少 10%。

例如,当工艺工程师需要设计 4 纳米的沉积层时,aiKO 能迅速提出精确的温度和气流参数,从而减少所需的实验次数,加快得出结果的时间。aiKO 通过分析问题、找出原因并提供逐步指导,从而最大限度地减少耗时的试错并优化设备功能。

不难发现,无论是开源的 SemiKong 还是其为企业定制的 AI Agent,Aitomatic 的方案与英伟达的 ChipNeMo 有许多相似之处,为半导体行业内的传统制造厂商的 AI 革新提供了新的选择。

从某种程度上来看,半导体厂商是站在了 AI 产业链的始端,但同时,其中的大多数也都是传统的制造业企业,在数字化转型以及应用创新 AI 技术方面缺乏经验与领路人。而通用的制造业数字化方案又很难对细分且精密的半导体制造有深刻的理解,所以,如果企业不从内部将门打开,AI 是很难走进半导体行业的。

而 Aitomatic 则是利用半导体厂商的设计文档、调试实验数据等宝贵资源,面向企业的业务流程与实际痛点,训练定制化的 AI Agent,仅供该企业可用,很大程度上削减了传统半导体制造企业在数据安全等方面的顾虑,正如其官网宣传时所言:Your knowledge, your IP, solving your industrial challenges.

创始人 Christopher Nguyen 博士:开源框架保障企业技术自主权

Aitomatic 频频在半导体领域进行落地探索与其创始人的工作经历密不可分。

在这里插入图片描述

Christopher Nguyen

公司联合创始人兼 CEO Christopher Nguyen 博士曾多次以技术创始人的身份参与创业,在其过往的 40 年职业生涯中,他曾参与英特尔第一批闪存晶体管的制造,还曾担任谷歌首任工程总监,在 Google Apps 开发中发挥重要作用。同时,作为一名教授,他还与合作伙伴共同创立了香港科技大学计算机工程专业。

或许正是因为参与了一众硅谷巨头的初始爬坡阶段,并拥有多次创业经历,Christopher Nguyen 博士对于新技术浪潮的发展有着更加深刻的认知。其曾在 Forbes 撰文介绍了「采用 AI 的 5 点思考」,分别是 Size, Ownership, Level, Industry, Domain Knowledge。
原文链接:
https://www.forbes.com/sites/forbestechcouncil/2023/12/12/five-considerations-when-adopting-ai-an-executives-solid-compass/

其中,他提出「拥有或租赁 AI 模型就像是房地产领域的买房或租赁问题。在开源基础上开发 AI 系统则反映了房屋所有权的好处, 其允许企业定制自己的 AI 系统,将特定领域的知识和专有见解嵌入其中,不仅能提高 AI 在实现组织目标方面的效率,还能加强对技术的控制。」

此外,他认为,「在专业模型和通用模型之间做出选择具有战略意义,就像选择经验丰富的建筑师或能工巧匠一样。在需要精确性和特定专业知识的领域,专业人工智能模型至关重要,就像工匠大师一样,针对特定领域进行微调,以高精度应对挑战,专注的专业知识使其在特定领域中表现卓越。」

而他的观点也直观的体现在了 Aitomatic 的发展路径与产品上。除了上文已经介绍的专业模型外,公司也将其 AI Agent 拓展到了开源领域,发布了开源项目 OpenSSA,作为轻量级专业 Agent 框架,能够帮助大家创建特定领域的 AI Agent。
项目地址:

https://github.com/aitomatic/openssa

正如 Christopher Nguyen 博士所言,「人工智能的独立性对工业公司至关重要,专注于专业领域的专业知识是竞争力的关键」。 而开源的 OpenSSA 则能够确保工业企业保持对其领域特定 IP 的自主权,实现安全、无限制的 AI 部署,这对于边缘技术至关重要。

One more thing: AI Alliance

在推出 OpenSSA 时,Aitomatic 还宣布已成为 AI Alliance 的首批成员。 这一 AI 联盟的豪华阵容包含了英特尔、AMD、IBM、Meta、Oracle、Hugging Face、索尼集团、美国达特茅斯学院、美国康奈尔大学、美国耶鲁大学、日本东京大学、Linux 基金会等全球 50 多家机构。

AI Alliance 的重点关注领域包括了:

  • 开发部署基准和评估标准、工具和其他资源,以便在全球范围内负责任、可扩展地开发和使用 AI 系统等

  • 开放基础模型,启用具有多种模式的开放基础模型生态系统

  • 发展 AI 加速硬件生态系统

  • 支持全球 AI 技能建设、教育和探索性研究

作为该联盟的首批成员,Alliance 发布的 SemiKong 也是深受其益,目前披露的是已经使用了东京电子的相关数据,未来,如果联盟中的其他半导体企业能够开放出更多可用、高价值的数据资源,势必会令 SemiKong 的准确性与覆盖面有所提升,成为半导体领域的全能 AI Agent。

参考资料:
1.https://www.aitomatic.com/newsroom/newsroom
2.https://mp.weixin.qq.com/s/1_2F

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1964970.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【根号分治】 通知

通知 分析: 这道题根号分治看起来就没有前面几题那么明显了 emm当然也可能是我境界还没到 我们考虑如果暴力修改,复杂度是 O ( n m ) O(nm) O(nm),其实m为这个点的度数 考虑根号分治的思想,我们令 m M m\sqrt M mM ​ 并命度数大…

申瓯通信设备有限公司在线录音管理系统(复现过程)

漏洞简介 申瓯通信设备有限公司在线录音管理系统 index.php接口处存在任意文件读取漏洞,恶意攻击者可能利用该漏洞读取服务器上的敏感文件,例如客户记录、财务数据或源代码,导致数据泄露 一.复现过程 fofa搜索语句:title"在线录音管…

idea显示properties文件中文乱码的解决方法

1.如下 File-》Settings-》File Encodings,修改如下图中绿框标注的内容 2.点击Apply-->OK 3.修改完成后显示

ROS八股

目录 一、ros1和ros2的区别是什么? 二、rostopic 和 rosserver的区别是什么? 三、讲一下ros的navigation框架 一、ros1和ros2的区别是什么? ROS 1和ROS 2是两个主要版本的机器人操作系统,它们在多个方面存在显著差异&#xff…

【Stable Diffusion】(基础篇七)—— lora

lora 本系列博客笔记主要参考B站nenly同学的视频教程,传送门:B站第一套系统的AI绘画课!零基础学会Stable Diffusion,这绝对是你看过的最容易上手的AI绘画教程 | SD WebUI 保姆级攻略_哔哩哔哩_bilibili 除了大模型和VAE之外&…

MySQL:集合运算符

集合运算符 MySQL中的 集合运算符(Set operators)主要用于结合两个或多个SELECT语句的结果集,这些结果集应该具有相同的列数和数据类型,以便能够进行比较或合并。 需要注意的是,MySQL本身并没有直接称为“Set operat…

Flask目录结构路由重定向简单实例讲解——轻量级的 Python Web 框架

假设一个flask目录结构如下: my_flask_app/ │ ├── app.py ├── routes/ │ ├── __init__.py │ ├── ZhejiangProvince/ │ │ ├── __init__.py │ │ ├── la.py │ │ └── el.py │ ├── GuangdongProvince/ │ │ ├…

常见服务限流方法

一、令牌桶算法(Token Bucket) 原理其实很简单,就是设置同一时刻服务器能处理请求的最大数量,如果超过这个数据,则需要等待,或者不处理请求。相当于设置最大并发量,但是细节是,还设…

解决nginx端口转发后,获取不到真实IP问题

文章目录 1,设置nginx端口转发1.2,无法获取客户端真实IP 2,nginx配置文件增加配置,保留客户端信息2.2,可以看到真实IP信息 1,设置nginx端口转发 location /AWAPI/ {proxy_pass http://172.28.43.19:9607; …

组件化开发

1.组件化开发 组件化:一个页面可以拆分成一个个组件,每个组件有着自己独立的结构[html]、样式[css]、行为 [js]。好处:便于维护,利于复用 → 提升开发效率。组件分类:普通组件、根组件。比如:下面这个页面…

二级MySQL(十二)——分组聚合查询

首先整理常用的聚合函数: 函数名说明COUNT(*)记录数COUNT(列名)一列的记录数MAX(列名)一列的最大值 MIN(列名) 一列的最小值 SUM(列名)一列…

M12电连接器航插插座L-code

M12电连接器概述 M12电连接器是一种广泛应用于工业自动化、传感器、仪器仪表、数据通信和控制系统等领域的圆形连接器。它的核心特点在于其小巧的尺寸、强大的多信号传输能力和出色的防水性能,使其成为众多工业应用的首选。M12连接器通常具有3至12个引脚&#xff0…

redis主从复制、哨兵模式、集群

redis集群 高可用 redis集群的三种模式: 1.主从复制(奇书 3台 一主两从) 2.哨兵模式 (3台 一主两从) 3.cluster (集群 6 333) 主从复制:喝MySQL的主从复制类似,主可以写…

vite创建Vue2项目(配图详细)

参考文章:vite项目生成vue3并引入element-ui vite脚手架生成vue项目及其配置_viteconfig配置-CSDN博客 Vite 默认支持 Vue 3,但你也可以使用 Vite 来搭建 Vue 2 的项目。不过,这需要一些额外的配置,因为 Vue 2 不支持原生的 ES …

【电子通识】什么是SIM卡/eSIM?

什么是SIM卡。 1991年,世界第一张SIM卡被德国捷德公司开发,当时的SIM卡非常大,和银行IC卡一样: SIM卡的全名是“用户识别模块”(Subscriber Identity Module):这块镀金的电路芯片拥有身份识别功…

请大家监督:我要开启Python之路,首要任务最简单的搭建环境

任务说明: 如上图所示,Python稳稳第一,为何?因为Python可以做很多事情,比如:Web开发,网络爬虫,软件开发、数据分析、游戏开发,金融分析,人工智能与机器学习&a…

Java每日面试题(事务相关)(day5)

目录 什么是事务?spring事务的实现方式事务失效的8种情况 什么是事务? 事务是一个操作序列,要么全部执行成功,要么全部执行失败。事务有四个重要特性,称为 ACID 特性: Atomicity(原子性&#x…

从教学到分享,2024精选录屏工具

如果你在公司里承担会议记录的职责,那录屏这项技能你一定要学会。像录屏大师这样的工具可以帮你在远程会议中进行录屏操作,方便你后期整理会议内容。 1.福昕录屏大师 链接直达:https://www.foxitsoftware.cn/REC/ 这款录屏工具提供了多种…

自定义线程池(二)

上节回顾 在上一节当中,已经实现了一个线程池,在本节当中,我们需要添加拒绝策略。这里使用到了策略模式的设计模式,因为拒绝策略是多种的,我们需要将这个权利下放给调用者(由调用者来指定我要采取哪种策略…