崔曙光
加拿大皇家科学院
加拿大工程院双院院士
主要工作:适配改造人工智能算法,来满足通信网络性能
从基础LLM到专用LLM:四个必须面对的问题
- 如何选择合适的基础LLM规模
- 如何让基础LLM读懂专用领域信息
- 如何避免基础LLM的幻觉现象,保证有效输出
- 如何降低基础LLM的微调成本
1 6G与生成式人工智能技术简介
1.1 生成式人工智能技术
未来6G,需要一个智能的控制核心
2 自主探索生成式人工智能
主要开发的数据集:
面向6G网络控制面全任务需求 打造生成式网络大模型
传统AI算法局限性
- 模型设计开销大
DL算法的成功严重依赖于“黑盒”DNN模型
- 泛化性能弱
传统AI 算法在未知的数据分布或网络环境上泛化性能往往减弱
大语言模型:新的机遇
LLM不仅仅是NLP领域的专家,但能否应用于网络领域?
为什么要用LLM解决网络任务?
- 利用LLM强大的泛化能力完成所有网络任务,符合6G网络控制标准化需求
- 利用LLM强大的涌现能力在具体单项任务取得更佳的性能
3 生成式人工智能助力6G核心技术
3.1 网络控制面:NetLLM框架
首先选定基础LLM,不是越大越好,要考虑硬件限制、推理延迟等
- 多模态编码器
- 解决幻觉现象:基于领域知识,让LLM生成满足网络运行边界条件的高效答案,消除幻觉并建立 快速映射
- 成本问题:DD-LRNA
3.2 整合6G控制面和数据面:生成式语义通信
通信理念从“信息恢复”到“信息再生”转变