小模型血战 phi3.5暂时胜出

小模型血战 phi3.5暂时胜出

news2026/2/14 6:41:05

背景

大模型推理成本高，训练成本高，百万美金训练一次，全量微调，加载到GPU显存都成本很高，创业公司没法搞，一般的公司想到还没想到用大模型挣钱了，就要这么大投入。基本犹豫就不投入，投入的基本也是弄上AI高大上的概念融资，用投资人的钱去烧。百团大战，打车争霸，那是能看到的挣钱。最终是要从用户身上挣的
大模型呢，openai，Anthropic公司,是TO B 和TO C能挣大钱，那投入国内有一家能顶住吗，没有！BAT们能烧出来扛起大旗不错了，其他都是炮灰。也许有一家像openai的基础模型公司 DeepSeek搞量化的有低成本钱。其余能上十亿百亿烧几年，继续为AGI买单，悬。
小模型是解决之道

GPT-4o mini掀小模型血战

1、小模型7B级别没上千亿的参数的

Meta llama3.1 7B
OpenAI带着GPT-4o mini首次入局小模型战场，
HuggingFace本周接连发布了小模型smlm
Mistral AI、Mistral-7B。
苹果也发布了70亿参数小模型DCLM，性能碾压Mistral-7B。而且数据训练代码全开源，真正的开源不像很多就开源了模型权重。
微软 Phi-3.5 最新体验地址这是azure AI studio 很多模型可以体验

phi3-mini 平均分66高于其余的小模型，Phi-3 Mini-128K-Instruct has 3.8B parameters 16G的显存就可以部署推理了

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2079213.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【B端产品知识总结】角色权限管理设计思想

【B端产品知识总结】角色权限管理设计思想

目录前言一、简单的用户权限二、基于角色的权限访问模型（RBAC） 三、RBAC模型的其他权限方案 1、用户组权限设计 2、继承角色权限设计 3、基于角色设计的约束四、权限控制的设计 1.页面权限 2.操作权限 3.业务权限 4.数据权限五、对于B端…

阅读更多...

【MyBatis】转义符+缓存机制

【MyBatis】转义符+缓存机制

目录一. 特殊符号处理二. MyBatis缓存机制 1. 什么是缓存？ 2. 一级缓存 3. 二级缓存一. 特殊符号处理 1. 在 mybatis 中的 xml 文件，一些特殊符号需要转译： <!--转义字符 " <" 号会报错，">&qu…

阅读更多...

哪个软件可以把试卷扫描成空白卷？这几款很不错

哪个软件可以把试卷扫描成空白卷？这几款很不错

哪个软件可以把试卷扫描成空白卷？在数字化学习日益普及的今天，将试卷扫描成空白卷成为了许多教师和学生提升学习效率的重要手段。传统的扫描仪不仅体积庞大、操作复杂，而且成本高昂，不太适合个人用户。那么要怎么做呢？…

阅读更多...

图纸文件怎么加密，六款图纸加密软件推荐

图纸文件怎么加密，六款图纸加密软件推荐

在现代设计与工程领域，图纸和设计文件的安全性至关重要。无论是建筑设计、机械工程还是电子电路图，图纸泄露都可能造成无法估量的损失。因此，选择一款可靠的图纸加密软件是保护知识产权的首要任务。在本文中，我们将推荐六款备受好…

阅读更多...

尚硅谷Java面试题第四季-Java基本功

尚硅谷Java面试题第四季-Java基本功

1.服务可用性多少个9是什么意思？ 2.Arrays.asList()把数组转换成集合大坑代码： public class Arrays_BugDemo {public static void main(String[] args){List<Integer> list Arrays.asList(1,2);list.add(3);list.forEach(System.out::println…

阅读更多...

【Notion的一些简单介绍】

【Notion的一些简单介绍】

🎥博主：程序员不想YY啊 💫CSDN优质创作者，CSDN实力新星，CSDN博客专家 🤗点赞🎈收藏⭐再看💫养成习惯 ✨希望本文对您有所裨益，如有不足之处，欢迎在评论区提出…

阅读更多...

鸿蒙位置服务

鸿蒙位置服务

位置服务 1、首先申请权限在module.json5文件下申请位置权限 "requestPermissions": [{"name": "ohos.permission.LOCATION", // 权限名称，为系统已定义的权限"reason": "$string:location_reason", // 申请权限的原因，…

阅读更多...

别让病毒毁了你的数据，用户必备的ClamAV扫描神器！

别让病毒毁了你的数据，用户必备的ClamAV扫描神器！

背景在Linux环境中，尽管由于其独特的权限管理和文件系统结构使得病毒感染的概率较低，但为了确保系统的安全性，尤其是在处理共享文件或邮件服务器时，安装和使用病毒扫描工具依然至关重要。ClamAV是一款开源的防病毒软件&#xff…

阅读更多...

KPaaS：微服务架构下的持续集成与部署（CI/CD）应用实践

KPaaS：微服务架构下的持续集成与部署（CI/CD）应用实践

在微服务架构下，CI/CD（持续集成/持续部署）已经成为软件开发过程中的一项关键实践。这种实践不仅提高了开发团队的工作效率，还确保了软件的质量和安全性。通过将代码更改频繁地集成到主分支，开发团队可以更早地发现潜在…

阅读更多...

oppo手机短信删除了怎么恢复？可用这2个恢复方法

oppo手机短信删除了怎么恢复？可用这2个恢复方法

日常使用OPPO手机时，如果不慎删除了重要的短信，怎么办？oppo手机短信删除了怎么恢复？今天小编就分享2种简单的恢复办法，帮大家找回那些被误删的短信。方法一：通过oppo手机的云端备份服务恢复短信 OPPO手机…

阅读更多...

1259：【例9.3】求最长不下降序列动态规划

1259：【例9.3】求最长不下降序列动态规划

1259：【例9.3】求最长不下降序列题目链接【输入样例】【输入样例】 14 13 7 9 16 38 24 37 18 44 19 21 22 63 15【输出样例】 max8 7 9 16 18 19 21 22 63思路： 确定状态： a[n]数组放数据， dp[n]数组放第i个位子前最长子序…

阅读更多...

产品经理如何提升系统思考能力

产品经理如何提升系统思考能力

很多工作年限比较短的产品经理，分析问题的时候最初看到的都是单点，只有积累了足够的经验和阅历后，才能看到单点之外的“全局”，才会慢慢形成自己的系统思考能力，才会提高自己的认知能力。产品经理如果想往更高层面发…

阅读更多...

nacos配置持久化到Mysql数据库

nacos配置持久化到Mysql数据库

Nacos持久化配置（Mac版本） 一：生成持久化nacos数据的表找到mysql-schema.sql表(如下图)，里面全部内容直接在mysql库中执行，生成表。 mysql-schema.sql位置： nacos/distribution/target/nacos-server-2.…

阅读更多...

erlang学习:gen_server书上案例22.6练习题5

erlang学习:gen_server书上案例22.6练习题5

检查是否有懒惰的工人，也就是接受工作但不按时完成的进程。把任务请求函数修改为返回{JobNumber, JobTime, F}，其中JobTime是工人必须完成任务的秒数。如果工人在JobTime 1时还未完成任务，服务器就应当向其发送一个hurry_up（快点…

阅读更多...

创建视频说明书二维码的具体步骤（三步操作）

创建视频说明书二维码的具体步骤（三步操作）

原创二维码教程，2024.8.27，长沙视频说明书二维码是一种创新且有效的工具，能够为用户提供直观的操作指导和使用体验，广泛应用于各种场景中。 1.电子产品说明书手机、平板和电脑：在包装盒内或产品说明书上加入视频二…

阅读更多...

kkfileview最新源码编译+部署+踩坑问题

kkfileview最新源码编译+部署+踩坑问题

kkFileView为文件文档在线预览解决方案，该项目使用流行的spring boot搭建，易上手和部署，基本支持主流办公文档的在线预览，如doc,docx,xls,xlsx,ppt,pptx,pdf,txt,zip,rar,图片,视频,音频等等，其开源免费，且…

阅读更多...

2535. 解密 [CSP-J 2022]

2535. 解密 [CSP-J 2022]

代码 #include <bits/stdc.h> using namespace std; long long m,n; int check(int x){if(x * (m - x) n) return 0;if(x * (m - x) < n) return 1;if(x * (m - x) > n) return 2; } int main(){int k;cin >> k;while(k--){long long e, d,p0,q0;scanf(&q…

阅读更多...

脑靶向肽；SHp ；CLEVSRKNC ；缺血归巢肽

脑靶向肽；SHp ；CLEVSRKNC ；缺血归巢肽

【脑靶向肽 SHp 简介】 SHp多肽是一种抗肿瘤多肽，它可以通过激活P53基因，调节细胞凋亡相关基因的蛋白表达，从而抑制肿瘤细胞的增殖并诱导细胞凋亡。在最新的研究中，SHp多肽被发现可以促进T细胞对肿瘤细胞的杀伤作用，显…

阅读更多...

【C++】提示并输入一个字符串，统计该字符串中字母个数、数字个数、空格个数、其他字符的个数

【C++】提示并输入一个字符串，统计该字符串中字母个数、数字个数、空格个数、其他字符的个数

1、提示并输入一个字符串，统计该字符串中字母个数、数字个数、空格个数、其他字符的个数 only只是一个简单的小练习 #include <iostream> #include <string>using namespace std;int main() {string str; //定义一个字符串类型cout<…

阅读更多...

《黑神话》的成功只是开始，国产3A拿什么和氪金游戏对抗？

《黑神话》的成功只是开始，国产3A拿什么和氪金游戏对抗？

声明：此篇为 ai123.cn 原创文章，转载请标明出处链接：https://ai123.cn/2240.html 《黑神话：悟空》作为国产3A游戏的代表，虽然在品质和口碑上取得了巨大成功，但其盈利能力相较于国产氪金游戏仍有一定差距。根…

阅读更多...

推荐文章

最新文章