AI跟踪报道第53期-新加坡内哥谈技术-本周AI新闻: 谷歌老施讲,微软Phi 3.5和Search GPT

news2024/11/15 4:55:13

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

点击下面视频观看在B站本周AI更新:

B 站 链接 观看:

本周AI新闻: 谷歌老施讲,微软Phi 3.5和Search GPT_哔哩哔哩_bilibili想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅: https://rengongzhineng.io/1) Phi 3.5 https://huggingface.co/microsoft.2) https://www., 视频播放量 1、弹幕量 0、点赞数 0、投硬币枚数 0、收藏人数 0、转发人数 0, 视频作者 内哥谈技术, 作者简介 N哥,新加坡。订阅中文简报,成为AI领域的领跑者。https://rengongzhineng.io/,相关视频:谷歌商店安装教程,20240806美股日股崩盘前后村长Taylor个人的操作记录和未来展望和风险提醒,MHC Talker AI智能口型方案,支持MetaHuman角色,一键三连私信领取测试,本周AI新闻:一封前OpenAI研发人员关于AGI的公开信,本周AI新闻:Google 推出gemma 2, Kyutai 开源 Moshi 和 Runway Gen-3挑战 Sora,本周AI新闻: 熟悉的铛铛铛铛音乐响起的时候,Intel还Inside吗?,前谷歌CEO斯密特的斯坦福猛料,本周AI新闻: X推出的惊人逼真的但不受约束的图像生成器和 GooglePixel 9,本周AI新闻:阿尔茨海默病和艾滋病进展和AI制药巨大前景,本周AI新闻: 开源AI王者归来的一周icon-default.png?t=N7T8https://www.bilibili.com/video/BV1ADWdeSEfR/

想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅: https://rengongzhineng.io/

1) Phi 3.5 https://huggingface.co/microsoft.

2) https://www.midjourney.com/home

Phi-3 模型系列简介

Phi-3 模型系列是微软小型语言模型(SLM)家族的最新成员。它们的设计目标是提供高性能且经济实惠的解决方案,在语言、推理、编程和数学等多个基准测试中,表现优于同类甚至更大型的模型。Phi-3 模型的推出,为 Azure 用户提供了更多高质量的模型选择,帮助他们更好地构建生成式 AI 应用程序。

自 2024 年 4 月发布以来,微软从客户和社区成员那里收到了大量关于 Phi-3 模型改进建议的宝贵反馈。今天,微软自豪地宣布推出 Phi-3.5-miniPhi-3.5-vision 以及 Phi 家族的新成员 Phi-3.5-MoE,这是一种专家混合(MoE)模型。

  • Phi-3.5-mini 增强了多语言支持,支持 128K 上下文长度。
  • Phi-3.5-vision 改进了多帧图像理解和推理,提升了单帧图像基准测试的表现。
  • Phi-3.5-MoE 拥有 16 个专家模块和 6.6 亿个活跃参数,提供高性能、低延迟、多语言支持和强大的安全措施,同时保持 Phi 模型的效能,超越了更大型的模型。


Phi-3.5-MoE: 专家混合模型

Phi-3.5-MoE 是 Phi 模型家族的最新成员。它由 16 个专家组成,每个专家包含 38 亿个参数。整个模型的总参数量达到 420 亿,在使用两个专家时会激活 66 亿个参数。相比于同等规模的密集模型,这种 MoE 模型在质量和性能方面表现更好。

主要特点:

  • 支持语言:超过 20 种。
  • 安全策略:MoE 模型采用了健全的安全后训练策略,结合了开源和专有的合成指令和偏好数据集。这一过程整合了监督微调(SFT)和直接偏好优化(DPO),使用包括人工标注和合成数据集在内的数据,涵盖了帮助性、无害性以及多种安全类别。
  • 上下文长度:支持最高 128K 上下文长度,适合处理长上下文任务。

性能评估

通过多个基准测试,微软比较了 Phi-3.5-MoE 与其他模型的表现。尽管仅有 66 亿活跃参数,Phi-3.5-MoE 在语言理解、数学能力和推理能力方面达到了与更大模型相当甚至超越的水平。此外,该模型在多语言任务中也表现出色,能够与参数量更大的模型竞争。


Phi-3.5-mini 模型

Phi-3.5-mini 模型在多语言合成和高质量筛选数据上进行了进一步的预训练,随后经过了监督微调(SFT)、近端策略优化(PPO)和直接偏好优化(DPO)。这些步骤使用了人工标注、合成和翻译数据集。

主要特点:

  • 参数量:38 亿。
  • 多语言支持:该模型对多语言、多轮对话质量和推理能力进行了大幅提升,支持包括阿拉伯语、中文、英语等在内的多种语言。
  • 性能提升:Phi-3.5-mini 相较于 Phi-3-mini 在多语言支持方面有显著改进,尤其在阿拉伯语、荷兰语、芬兰语、波兰语、泰语和乌克兰语上提升了 25%-50%。

长上下文任务

Phi-3.5-mini 支持 128K 上下文长度,在总结长文档、基于长文档的问答以及信息检索等任务中表现优异。相比之下,Gemma-2 系列模型仅支持 8K 上下文长度,而 Phi-3.5-mini 在与更大型的开源权重模型如 Llama-3.1-8B-instructMistral-7B-instruct-v0.3Mistral-Nemo-12B-instruct-2407 的竞争中也表现出色。


Phi-3.5-vision 模型

Phi-3.5-vision 在多帧图像理解和推理方面引入了尖端技术,能够实现详细的图像比较、多图像摘要以及视频摘要。这一创新基于客户反馈开发,为各种场景提供了广泛的应用。

性能提升:Phi-3.5-vision 在多个单帧图像基准测试中表现显著提升,例如 MMMU 的表现从 40.4 提升到 43.0,而 MMBench 的表现则从 80.5 提升到 81.9。


安全性

Phi-3 系列模型 的开发遵循了微软的负责任 AI 标准,该标准是一套基于公司内部要求的规定,涵盖了责任、透明、公平、可靠性和安全、隐私和包容性等六项原则。Phi-3.5 系列模型采用了多层次的安全评估和后训练方法,并针对本次发布的多语言能力进行了额外的安全措施。

微软的安全训练和评估方法,涉及对多种语言和风险类别的测试,具体详见 Phi-3 安全后训练报告


优化变体

ONNX Runtime 提供了 Phi 系列模型的优化推理性能,用户可以将 Phi-3.5-mini 优化到各种硬件目标上。最新的 Phi-3.5 模型的 ONNX 变体将在未来几周发布。


更可预测的输出

微软正在将 Guidance 引入 Azure AI Studio 中的 Phi-3.5-mini 无服务器端点,通过定义适合应用程序的结构,使输出更加可预测。通过 Guidance,用户可以消除昂贵的重试操作,并限制模型从预定义列表中选择,或者将输出限制为提供上下文中的直接引用,从而减少 30%-50% 的成本和延迟。


结语

Phi-3.5-mini 在 LLM 领域中脱颖而出,以 38 亿参数、128K 上下文长度和多语言支持为特点。它在广泛的语言支持和英语性能之间达到了微妙的平衡。对于处理多语言知识密集型任务,建议在 RAG(检索增强生成) 设置中使用 Phi-3.5-mini,通过利用外部数据源来显著提升模型在不同语言中的表现。

Phi-3.5-MoE 配备 16 个小专家模块,提供高质量表现和低延迟,支持 128K 上下文长度和多种语言,并具有强大的安全措施,超越了更大型的模型。

Phi-3.5-vision 在多帧图像理解和推理方面取得了突破,提升了单帧图像基准测试的表现。

Phi-3.5 模型系列 为开源社区和 Azure 客户提供了高性价比、高性能的选择,推动了小型语言模型和生成式 AI 的发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2071021.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JavaScript初级——DOM和事件简介

一、什么是DOM? 二、模型 三、对象的 HTML DOM 树 四、节点 浏览器已经为我们提供了文档节点对象,这个对象是window属性,可以再网页中直接使用,文档节点代表的是整个网页。 五、事件简介 事件,就是用户和浏览器之间的交…

致远oa员工离职之后无法获取登录名

故事 前几天在做致远oa的携程平台的人员同步,碰见一个问题,致远oa人员离职之后,无法获取到人员的登录名,导致无法再携程平台做离职处理,因为客户要求的是用登录名作为携程编号 技术支持 感谢大佬对文章的技术支持 …

【git】git进阶-blame/stash单个文件/rebase和merge/cherry-pick命令/reflog和log

文章目录 git blame查看单个文件修改历史git stash单个文件git rebase命令git rebase和git merge区别git cherry-pick命令git reflog和git log区别 git blame查看单个文件修改历史 git blame:查看文件中每行最后的修改作者 git blame your_filegit log和git show结合…

探索Facebook的AI算法:如何优化用户体验

在数字化时代,社交媒体平台不断引领着技术创新的潮流。作为全球领先的社交平台之一,Facebook在人工智能(AI)算法的应用上取得了显著进展,极大地提升了用户的社交体验。本文将探讨Facebook如何通过先进的AI算法优化用户…

如何实现一棵红黑树

目录 1.什么是红黑树 2.红黑树的实现 2.1红黑树的插入 新插入的结点应该是什么颜色的呢? 插入情况的分析 ​编辑插入代码如下所示 2.2红黑树的查找 2.2检测红黑树 1.什么是红黑树? 红黑树是一棵接近平衡的二叉搜索树。由于AVL树在频繁大量改变数据…

MySQL字符串比较忽略尾随空格

问题 今天遇到一个线上问题,排查过程中发现,MySQL 查询条件使用字符串判断等时会自动忽略字符串尾部的空格,示例如下: MySQL 表格结构: CREATE TABLE users (id int(11) NOT NULL,name varchar(50) DEFAULT NULL,ag…

深度学习一(Datawhale X 李宏毅苹果书 AI夏令营)

一,机器学习基础 机器学习(Machine Learning, ML)是让机器具备学习能力的过程,其核心在于使机器能够自动寻找并应用复杂的函数,以解决各种任务如语音识别、图像识别和策略决策(如AlphaGo)。这些…

YoloV8改进策略:卷积篇|ACConv2d模块在YoloV8中的创新应用与显著性能提升|简单易用|即插即用

摘要 在本文中,我们创新性地将ACConv2d模块引入到YoloV8目标检测模型中,通过对YoloV8中原有的Conv卷积层进行替换,实现了模型性能的大幅提升。ACConv2d模块基于不对称卷积块(ACB)的设计思想,利用1D非对称卷积(13和31卷积)来增强标准方形卷积核(如33卷积)的表征能力。…

spring揭秘11-aop05-aop应用经典场景及目标对象内部方法调用无法被拦截

文章目录 【README】【1】基于aop实现全局异常处理【2】基于aop实现权限检查【3】基于aop实现缓存【4】aop无法拦截目标对象内部方法调用的问题【4.1】问题概述【4.2】解决方法 【README】 本文总结自《spring揭秘》,作者王福强,非常棒的一本书&#xf…

TFTP error: ‘Permission denied‘ (0)

项目场景: 环境:ubuntu 5.4.150 开发板:s3c2440 在u-boot中,通过tftp传输uImage文件失败。 问题描述 SMDK2410 # tftp 0x30008000 uImage dm9000 i/o: 0x20000000, id: 0x90000a46 DM9000: running in 16 bit mode MAC: 00:0…

【变化检测】基于UNet建筑物变化检测

主要内容如下: 1、LEVIR-CD数据集介绍及下载 2、运行环境安装 3、基于likyoo变化检测代码模型训练与预测 4、Onnx运行及可视化 运行环境:Python3.8,torch1.12.0cu113 likyoo变化检测源码:https://github.com/likyoo/change_dete…

数据仓库中的表设计模式:全量表、增量表与拉链表

在现代数据仓库中,管理和分析海量数据需要高效且灵活的数据存储策略。全量表、增量表和拉链表是三种常见的数据存储模式,各自针对不同的数据管理需求提供了解决方案。全量表通过保存完整的数据快照确保数据的一致性,增量表则通过记录数据的变…

如何在 Ubuntu 系统中安装PyCharm集成开发环境?

在上一篇文章中,我们探讨了Jupyter notebook,今天再来看看另一款常用的Python 工具,Pycharm。 PyCharm也是我们日常开发和学习常用的Python 集成开发环境 (IDE),由 JetBrains 开发。 PyCharm 带有一整套可以帮助用户在使用Pytho…

大数据-91 Spark 集群 RDD 编程-高阶 RDD广播变量 RDD累加器 Spark程序优化

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完)HDFS(已更完)MapReduce(已更完&am…

【代码随想录训练营第42期 Day39打卡 - 打家劫舍问题 - LeetCode 198.打家劫舍 213.打家劫舍II 337.打家劫舍III

目录 一、做题心得 二、题目与题解 题目一:198.打家劫舍 题目链接 题解:动态规划 题目二:213.打家劫舍II 题目链接 题解:动态规划 题目三:337.打家劫舍III 题目链接 题解:动态规划 三、小结 一、…

卸载nomachine

网上的方法:提示找不到命令 我的方法: step1. 终端输入 sudo find / -name nxserver 2>/dev/null确认 NoMachine 的实际安装路径。你可以使用 find 命令在系统中查找 nxserver 脚本的位置。 找到路径后,你可以使用该路径来卸载 NoMachine。 如下图,紫色框中是我的路径…

【ACM出版】第三届公共管理、数字经济与互联网技术国际学术会议(ICPDI 2024,9月06-08)

第三届公共管理、数字经济与互联网技术国际学术会议(ICPDI 2024)定于2024年9月06-08日在中国-济南举行。 会议主要围绕公共管理、数字经济,互联网技术等研究领域展开讨论。会议旨在为从事公共管理、经济、大数据、互联网研究的专家学者提供一…

解决LabVIEW配置文件中文乱码问题

LabVIEW配置文件中的中文字符在程序调用时出现乱码,通常是由于字符编码不匹配引起的。LabVIEW默认使用ANSI编码格式,而配置文件可能使用了不同的编码格式(如UTF-8),导致中文字符在读取时无法正确解析。 解决方法 统一编…

导数的基本法则与常用导数公式的推导

目录 n 次幂函数导数公式的推导导数和的运算法则的证明正弦、余弦函数导数公式的推导代数证明两个重要极限(引理)及证明具体推导 几何直观 导数积的运算法则的证明导数商的法则的证明链式法则的证明有理幂函数求导法则的证明反函数求导法则的证明反正切函…

SSH 远程登录报错:kex_exchange_identification: Connection closed.....

一 问题起因 在公司,使用ssh登录远程服务器。有一天,mac终端提示:`kex_exchange_identification: Connection closed by remote host Connection closed by UNKNOWN port 65535`。 不知道为啥会出现这样的情形,最近这段时间登录都是正常的,不知道哪里抽风了,就提示这个。…