大模型日报20240401

news2024/11/27 6:17:51

大模型实时打《街霸》捉对PK,GPT-4居然不敌3.5,新型Benchmark火了

链接:https://news.miracleplus.com/share_link/22340

在这里插入图片描述

让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打?GitHub上一种你没有见过的船新Benchmark火了。与llmsys大模型竞技场中,两个大模型分别输出答案,再由人类评分不同——街霸Bench引入了两个AI之间的交互,且由游戏引擎中确定的规则评判胜负。这种新玩法吸引了不少网友来围观。由于项目是在Mistral举办的黑客马拉松活动上开发,所以开发者只使用OpenAI和Mistral系列模型进行了测试。排名结果也很出人意料。经过342场对战后,根据棋类、电竞常用的ELO算法得出的排行榜如下:最新版gpt-3.5-turbo成绩断崖式领先,Mistral小杯排第二。更小的模型超过了更大的如GPT-4和Mistral中杯大杯。

「理论与实践」AIPM 张涛:关于Diffusion你应该了解的一切

链接:https://news.miracleplus.com/share_link/22325
在这里插入图片描述
Stable Diffusion的亮相之初,在Github 排行榜,在不到两个月的时间内飙升至 33K star。

奇绩邀请了张涛老师来做分享,张涛老师为光年之外产品负责人,在这篇分享中,张涛老师以产品的角度带领技术小白了解Diffusion的底层原理,也进一步通过基于Diffusion的一些技术进展,SD在过去的一年半的时间里面,在整个行业里面构成了一个什么样子的生态?在这样子的生态里面,我们在产品上面的机会有哪些,以及作为产品经理,我们该如何去做。

告别微软,姜大昕带领这支精英团队攀登Scaling Law,万亿参数模型已有预览版

链接:https://news.miracleplus.com/share_link/22334

在这里插入图片描述

万亿参数模型对于算力、数据的海量需求也注定了,这不会是一场「百模大战」,而是少数一些玩家才能参与的角逐。就像前微软全球副总裁、如今的阶跃星辰创始人姜大昕所说,「GPT-3.5 会是一个分水岭,在超过 GPT-3.5 之后,可能只有极少数的公司会继续攀登 Scaling Law。在算力、系统、数据和算法等各个方面,万亿参数模型的难度都上升了几十倍。如果这里面有任何一个短板,Scaling Law 都很难攀登上去。」作为一位大模型领域的创业者,这番话其实也道出了姜大昕创业以来的一些体会。目前,他带领的阶跃星辰已经做出了超过 GPT-3.5 的千亿参数模型 Step-1 和比肩 GPT-4V 的多模态大模型 Step-1V,甚至正在打造的万亿参数 MoE 语言大模型 Step-2 也有了预览版。在姜大昕看来,他们的路径是非常清晰的,就是沿着「单模→多模→具身智能→世界模型」的路线一步步往下走。打造万亿参数(甚至更大的)模型是其中必要的一环,在此基础上,他们还将推进多模态理解与生成的融合与统一。

AI行业买英伟达GPU,花的钱比赚的多17倍

链接:https://news.miracleplus.com/share_link/22336
在这里插入图片描述

搞 AI 大模型,实在太烧钱了。如今的生成式 AI 有很大一部分是资本游戏,科技巨头利用自身强大的算力和数据占据领先位置,并正在使用先进 GPU 的并行算力将其推广落地。这么做的代价是什么?最近《华尔街日报》一篇有关明星创业公司的报道里给出了答案:投入是产出的 17 倍。

虽然投入大,但是不做又不行,做了可能不成功,不做肯定会面临失败。大公司对于技术的创新和投入需要有这种精神,这也是一个大公司的担当。

美国升级对中国芯片打压,蔓延到AI PC

链接:https://news.miracleplus.com/share_link/22342
在这里插入图片描述
据路透社报道,美国拜登政府上周五以国家安全为由,修订了旨在阻止中国获取美国人工智能(AI)芯片和芯片制造设备的规定。新修订的规则阐明,面向中国的AI芯片出口管制也将适用于包含这些芯片的笔记本电脑。

Gecko:从大语言模型中蒸馏的多功能文本嵌入

链接:https://news.miracleplus.com/share_link/22344
在这里插入图片描述

我们介绍了Gecko,这是一个紧凑且多功能的文本嵌入模型。Gecko通过利用一个关键思路实现了强大的检索性能:从大语言模型(LLMs)中提炼知识到一个检索器中。我们的两步提炼过程从使用LLMs生成多样化的合成配对数据开始。接下来,我们通过为每个查询检索一组候选段落,并使用相同的LLMs重新标记正面和负面难题段落,进一步提炼数据质量。Gecko的紧凑性证明了我们方法的有效性。在大规模文本嵌入基准测试(MTEB)中,具有256个嵌入维度的Gecko超越了所有现有768个嵌入尺寸的条目。具有768个嵌入维度的Gecko实现了66.31的平均分数,与7倍更大的模型和5倍更高维度的嵌入进行竞争。

lunary

链接:https://news.miracleplus.com/share_link/22353
在这里插入图片描述
Lunary 是一个旨在帮助 AI 开发人员将其应用程序投入生产的工具,提供成本分析、监控、快速模板、数据集调整、聊天和反馈跟踪以及评估等功能。它的设计旨在与任何模型兼容,易于集成(仅需2分钟),并且简单易于自行托管。

人工智能安全平台Rug.ai获得110万美元种子轮融资

链接:https://news.miracleplus.com/share_link/22356

在这里插入图片描述

据Foresight News报道,人工智能安全平台rug.ai在种子轮前融资中成功筹集了110万美元。本轮融资由No Limit Holdings领投,同时得到了Mask Network、Builder Capital、Formless Capital、Prismatic Capital、Hack VC合伙人Roshun Patel、Grass联合创始人drej、Pentoshi、Avi Felman、MacnBTC和Andrej Radonjic的支持。rug.ai利用人工智能技术,致力于提供端到端的链上安全解决方案,旨在帮助用户识别和防范潜在的安全威胁。
链接:https://rug.ai/signin

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1562969.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2013年认证杯SPSSPRO杯数学建模A题(第二阶段)护岸框架全过程文档及程序

2013年认证杯SPSSPRO杯数学建模 A题 护岸框架 原题再现: 在江河中,堤岸、江心洲的迎水区域被水流长期冲刷侵蚀。在河道整治工程中,需要在受侵蚀严重的部位设置一些人工设施,以减弱水流的冲刷,促进该处泥沙的淤积&…

C++ | Leetcode C++题解之第1题两数之和

题目&#xff1a; C 题解&#xff1a; class Solution { public:vector<int> twoSum(vector<int>& nums, int target) {unordered_map<int, int> hashtable;for (int i 0; i < nums.size(); i) {auto it hashtable.find(target - nums[i]);if (it …

系统设计理念:满足设计要求

在今天的文章中,我们将层层剥离并深入探讨系统设计要求的本质。 让我们了解系统设计的支柱以及如何创建强大且有弹性的应用程序。 什么是好的设计? 在我们深入讨论技术细节之前,让我们先讨论一下什么是好的设计。 当我们谈论系统架构中的良好设计时,我们关注几个关键原则:…

qt5-入门-自定义委托-简单例子

参考&#xff1a; Qt 自定义委托_w3cschool https://www.w3cschool.cn/learnroadqt/ov8h1j4z.html C GUI Programming with Qt 4, Second Edition 本地环境&#xff1a; win10专业版&#xff0c;64位&#xff0c;Qt 5.12 理论知识 Qt的model/view架构中&#xff0c;view只是…

Mysql实战--为什么表数据删掉一半,表文件大小不变

经常会有同学来问我&#xff0c;我的数据库占用空间太大&#xff0c;我把一个最大的表删掉了一半的数据&#xff0c;怎么表文件的大小还是没变&#xff1f; 那么今天&#xff0c;我就和你聊聊数据库表的空间回收&#xff0c;看看如何解决这个问题。 这里&#xff0c;我们还是针…

2024年04月在线IDE流行度最新排名

点击查看最新在线IDE流行度最新排名&#xff08;每月更新&#xff09; 2024年04月在线IDE流行度最新排名 TOP 在线IDE排名是通过分析在线ide名称在谷歌上被搜索的频率而创建的 在线IDE被搜索的次数越多&#xff0c;人们就会认为它越受欢迎。原始数据来自谷歌Trends 如果您相…

数据库之迁移常规操作(Postgresql篇)

一、docker安装postgresql 1. 拉取postgres docker pull postgres2. 创建容器 注&#xff1a;默认登录账户postgres, 密码123456, 对外暴露端口5432, 卷映射&#xff1a;可在物理机修改数据库配置文件 引用文章查看&#x1f440; docker run --name postgres -e POSTGRES_P…

《养育女孩》:教你如何培养独立、自信的女儿

粉丝福利&#xff1a;公众号内回复3可免费获取本期《养育女孩》的读书音频哦。​ 养育女孩&#xff0c;是一本由澳大利亚作家史蒂夫比达尔夫所著的育儿书籍。书中深入探讨了女孩的心理发展&#xff0c;以及父母和教育者如何支持她们成长为强大、自信和健康的女性。 比达尔夫将…

设计模式7--建造者模式

定义 案例一 案例二 优缺点

k8s笔记28--快速在ubuntu上基于二进制和源码安装containerd

k8s笔记28--快速在ubuntu上基于二进制和源码安装containerd 介绍containerd 安装方法二进制文件安装源码构建安装 注意事项说明 介绍 Containerd是一个工业标准的容器运行时&#xff0c;它强调简单、健壮和可移植性。它可作为Linux和Windows的守护进程&#xff0c;能管理主机系…

RK3588 NPU研究(一)

使用NPU进行AI计算&#xff0c;具体对应模型推理 对应代码位置 hardware/rockchip/rknpu2 examples: yolo5 编译 下载NDK工具https://developer.android.google.cn/ndk/downloads?hlzh-cn源码中使用16b&#xff0c;测试可以使用16/17/18/19/20&#xff0c;不可以使用21&…

C语言-atoi函数的模拟

模拟术语讲解 首先&#xff0c;需要定义一个标志位变量sign&#xff0c;用于表示转换结果的合法性1。定义一个函数My_atoi&#xff0c;用于实现atoi的功能1。在My_atoi函数中&#xff0c;首先遍历字符串&#xff0c;直到遇到第一个非空格字符1。如果第一个字符不是数字或正负号…

ROS安装教程(鱼香ROS快捷版)

文章目录 前言一、ROS版本二、ROS安装1.添加ROS源2.添加密钥3.安装ROS4.安装python依赖包&#xff08;可选&#xff09;5.初始化rosdep6.ROS 测试 总结 前言 对于初学者来说&#xff0c;ROS的安装往往是一个令人头疼的问题&#xff0c;复杂的步骤和网络问题常常成为入门的第一…

kubernetes-dashboard 安装配置

k8s 1.23以上的版本 https://raw.githubusercontent.com/kubernetes/dashboard/v2.7.0/aio/deploy/recommended.yaml 执行命令&#xff1a; kubectl apply -f https://raw.githubusercontent.com/kubernetes/dashboard/v2.7.0/aio/deploy/recommended.yaml 安装完成后&#x…

FSH6罗德与施瓦茨FSH6频谱分析仪

181/2461/8938产品概述&#xff1a; R&S FSH6频谱分析仪坚固耐用、方便易用&#xff0c;专为野外使用而设计。它重量轻、操作简单、设计合理且具有大量测量功能&#xff0c;是任何需要高效测量仪器进行户外工作的人不可或缺的工具。 R&S FSH6是一款手持式频谱分析仪&…

项目:USB键盘和鼠标的复合设备

我们的复合设备使用一个物理设备就可以完成多个功能。 使用复合设备同时完成USB键盘和鼠标功能&#xff0c;它的主要实现方式有两种&#xff0c; 第一个就是我们将多个设备描述符合并成一个&#xff0c;这个相对比较简单&#xff0c;我们只要根据相应的报告描述符处理数据就可…

基于springboot实现在线文档管理系统项目【项目源码+论文说明】计算机毕业设计

基于springboot实现在线文档管理系统演示 摘要 随着科学技术的飞速发展&#xff0c;社会的方方面面、各行各业都在努力与现代的先进技术接轨&#xff0c;通过科技手段来提高自身的优势&#xff0c;在线文档管理当然也不能排除在外。在线文档管理系统是以实际运用为开发背景&am…

3分钟教你最大化利用APP消息推送(Push)在运营中的优势

推送通知是指运营团队通过自有产品或外部工具&#xff0c;主动向用户的移动设备发送信息。用户可以直接在手机的锁屏和通知中心看到这些推送通知&#xff0c;点击通知中心的相关内容可以激活应用并跳转至特定页面。例如&#xff0c;我们在手机锁屏时接收到的微信消息&#xff0…

SSM框架学习——MyBatis关联映射

MyBatis关联映射 为什么要关联映射 实际开发中&#xff0c;对数据库操作常常会涉及多张表&#xff0c;所以在OOP中就涉及对象与对象的关联关系。针对多表操作&#xff0c;MyBatis提供关联映射。 关联关系概述 一对一&#xff1a;A类中定义B类的属性b&#xff0c;B类中定义A…

电脑常见故障检测方法与对应问题分析说明

电脑常见故障检测方法与对应问题分析说明 前言说明1、机器无法开机故障2、屏幕无法显示3、无法联网4、能开机但是无法进入系统&#xff0c;提示not boot5、USB接口无法识别U盘 前言说明 本文为小白向&#xff0c;许多内容属于经验学而非科学&#xff0c;还望大佬们轻喷。 如上…