【AI大模型】Kimi API大模型接口实现

news2025/1/23 0:59:15

一、Kimi大模型概述

Kimi,月之暗面旗下国产大模型。是北京月之暗面科技有限公司(Moonshot AI)于2023年10月9日推出的一款智能助手,主要应用场景为专业学术论文的翻译和理解、辅助分析法律问题、快速理解API开发文档等,是全球首个支持输入20万汉字的智能助手产品。

2024年3月18日,Kimi智能助手启动200万字无损上下文内测。

二、发展历程

2023年10月9日,Moonshot AI宣布在“长文本”领域实现了突破,推出首个支持输入20万汉字的智能助手产品Kimi Chat。10月10日,开放内测。11月16日,Kimi Chat面向全社会开放服务。

2024年7月1日,月之暗面官宣 Kimi 开放平台上下文缓存(Context Caching)功能开启公测。官方表示,该技术在 API 价格不变的前提下,可为开发者降低最高 90% 的长文本旗舰大模型使用成本,并提升模型响应速度。

2024年7月8日消息,据月之暗面消息,旗下大模型产品Kimi上线浏览器插件,目前有两个按钮:一个是点问笔,划选文字后就会出现;另一个是总结器,出现在网页右下角。

2024年3月18日,月之暗面宣布Kimi智能助手启动200万字无损上下文内测。

2024年4月18日,月之暗面官宣旗下Kimi智能助手更新:模型能力提升,更稳的基座能力;支持Kimi常用语,内置官方提示词;新增支持语音输入、输出、播报;支持搜索引用溯源。 4月24日,月之暗面宣布Kimi大模型学会“使用工具”,API已支持Tool Calling功能。 5月,Kimi推出付费打赏功能,开始试探C端付费意愿。

三、产品功能

Kimi主要有6项功能:长文总结和生成、联网搜索、数据处理、编写代码、用户交互、翻译。主要应用场景为专业学术论文的翻译和理解、辅助分析法律问题、快速理解API开发文档等,是全球首个支持输入20万汉字的智能助手产品,已启动200万字无损上下文内测。

Kimi智能助手在效率(免费榜)排名从2024年1月14日的第436名提升至3月19日的第11名。而尚未上线的GPT-4.5 Turbo上下文窗口指定为25.6万个token,能同时处理约20万个单词,Kimi升级后,长文本能力为其10倍。在2023年10月初次亮相时,该模型的处理能力还仅有约20万汉字。2024年3月18日,月之暗面宣布Kimi智能助手启动200万字无损上下文内测。

四、相关事件

​​​​​2024年3月21日,Kimi一度冲进App Store免费版应用第5名,超越了微信;其小程序、App、网页版均因超出承载能力而宕机。2024年3月,Kimi智能助手月访问量达1218万次,仅次于百度文心一言,超越了阿里通义千问、字节旗下豆包。

五、程序接口

from openai import OpenAI
import os

api_key = os.getenv("MOONSHOT_API_KEY")
client = OpenAI(
    api_key=api_key,
    base_url="https://api.moonshot.cn/v1",
)

completion = client.chat.completions.create(
    model="moonshot-v1-8k",
    messages=[
        {"role": "system",
         "content": "你是 Kimi,由 Moonshot AI 提供的人工智能助手,你更擅长中文和英文的对话。你会为用户提供安全,有帮助,准确的回答。"
                    "同时,你会拒绝一切涉及恐怖主义,种族歧视,黄色暴力等问题的回答。Moonshot AI 为专有名词,不可翻译成其他语言。"},
        {"role": "user", "content": "你好,我叫李雷,15+100等于多少?"}
    ],
    temperature=0.3,
)

print(completion.choices[0].message.content)

运行结果:

【参考文献】:Kimi(月之暗面旗下国产大模型)_百度百科

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2140045.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

关于http的206状态码和416状态码的意义、断点续传以及CORS使用Access-Control-Allow-Origin来允许跨域请求

一、关于http的206状态码和416状态码的意义及断点续传 HTTP 2xx范围内的状态码表明客户端发送的请求已经被服务器接受并且被成功处理了,HTTP/1.1 206状态码表示客户端通过发送范围请求头Range抓取到了资源的部分数据,一般用来解决大文件下载问题,一般CDN…

直接的强化学习与间接的强化学习

强化学习是一种机器学习方法,用于让智能体在与环境的交互中学习最优策略,以获得最大的奖励。根据强化学习的方式,可以分为直接强化学习和间接强化学习。直接强化学习注重直接从奖励信号中学习最优策略,而间接强化学习则通过学习环…

【吊打面试官系列-MySQL面试题】MySQL 中有哪几种锁?

大家好,我是锋哥。今天分享关于【MySQL 中有哪几种锁?】面试题,希望对大家有帮助; MySQL 中有哪几种锁? 1000道 互联网大厂Java工程师 精选面试题-Java资源分享网 1、表级锁:开销小,加锁快&…

2024.9.16 day 1 pytorch安装及环境配置

一、配置pytorch环境,安装pytorch 1.查看python版本 python --version 2.在anaconda命令中创建pytorch环境 conda create -n pytorch python3.12(python版本) 3.pytorch安装 pytorch首页 PyTorchhttps://pytorch.org/ os为windows推荐package选择…

在jenkins作业中如何增加git fetch的超时时间

在jenkins作业中如何增加git fetch的超时时间 可以通过以下几种方式来增加 Jenkins 中 git fetch 的超时时间: 1.在 Jenkins 的构建配置中设置超时时间: 在 Jenkins 的构建配置页面,找到 "Git" 部分,在 "Additional Behaviours" 中选择 "Advanced c…

Sui与3DOS合作推动3D打印网络的去中心化

制造业创新者3DOS宣布将其庞大的3D打印网络与Sui集成。这一集成使用户、3D打印机和制造商能够连接到全球可访问的去中心化网络。 解锁去中心化3D打印的全部潜力依赖于精确的实时协调。Sui作为通用协调层,将用户、3D打印机和制造商同步到一个高效、统一的网络中。通…

注册登录案列

案列需求: 在主测页面中输入用户数据,点击注册按钮完成用户注册 实现步骤: 1.创建数据库表,Mysql代码如下: CREATE TABLE tb_user( id int primary key auto_increment, username VARCHAR(32), password VARCHAR(3…

【题解】【枚举】—— [USACO1.5] 回文质数 Prime Palindromes

【题解】【枚举】—— [USACO1.5] 回文质数 Prime Palindromes [USACO1.5] 回文质数 Prime Palindromes题目描述输入格式输出格式输入输出样例输入 #1输出 #1 提示 思路1.素数筛法1.1.思路解析1.2.参考代码 解法1.打表1.1.思路解析1.2.AC代码 解法2.构造回文数2.1.思路解析2.2.…

Java集合进阶--双列集合

双列集合的特点: 1 双列集合一次需要存一对数据,分别为键和值 2 键不能重复,值能重复 3 键和值是一一对应的,每一个键只能找到自己对应的值 4 键值这个整体 我们称之为 “键值对” 或者 “键值对对象” ,在Java中叫做 …

react hooks--useState

概述 useState 可以使函数组件像类组件一样拥有 state,也就说明函数组件可以通过 useState 改变 UI 视图。那么 useState 到底应该如何使用,底层又是怎么运作的呢,首先一起看一下 useState 。 问题:Hook 是什么? 一个 Hook 就是…

【思博伦】史上最详细思博伦测试仪使用精讲(三)!图解超赞超详细!!!

目录 2.2.14 抓包过滤条件配置 2.2.14.1 配置抓Tx或Rx方向的包 2.2.14.2 添加自定义过滤条件 2.2.14.3 按照包类型配置Qualify Events 2.2.14.4 按照包类型配置Start Events ​​​​​​​2.2.14.5 按照包类型配置Stop Events ​​​​​​​2.2.15 端口计数器统计 ​​…

大数据处理技术:HBase的安装与基本操作

目录 1 实验名称 2 实验目的 3 实验内容 4 实验原理 5 实验过程或源代码 5.1 Hbase数据库的安装 5.2 创建表 5.3 添加数据、删除数据、删除表 5.4 使用Java操作HBase 6 实验结果 6.1 Hbase数据库的安装 6.2 创建表 6.3 添加数据、删除数据、删除表 6.4 使用Java操…

25嘉士伯笔试测评希音笔试测评秋招校招SHL笔试题型分享

25嘉士伯笔试测评用的SHL笔试测评题库,分为两部分: 综合能力部分有计算题 图形推理题 连线题 逻辑题 日历题等等,36min24道题,新手很难做完; 岗位匹配度测评分为8道综合能力性格测试题,给三个选项选出最符…

【系统架构师】-论文-2024-2009年系统架构师历年论文题目

2024年5月 大数据Lambda架构的应用与分析 云原生云上DevOps运维应用与分析 模型驱动软件开发方法与应用 论单元测试在软件回归测试中的应用和分析 2023年 论面向对象设计的应用与实现 论多数据源集成的应用与实现 论软件可靠性模型的设计与实现 论边缘计算技术的设计与实现 …

Java:抽象类和接口(1)

一 抽象类 1.什么是抽象类 在 Java SE 中,抽象类是一种用于为其他类提供通用行为的类。它允许你定义一组方法和字段,而具体的实现留给子类来完成。抽象类不能被实例化,必须通过继承它的子类来实现其抽象方法并进行实例化。 public abstrac…

MATLAB系列04:循环结构

MATLAB系列04:循环结构 4. 循环结构4.1 while循环4.2 for循环4.2.1 运算的细节4.2.2 break语句和continue语句4.2.3 嵌套循环 4.3 逻辑数组和向量化4.3.1 逻辑数组的重要性4.3.2 用 if/else 结构和逻辑数组创建等式 4.4 总结 4. 循环结构 循环(loop)是一种 MATLAB …

初识Linux · 进程(4)

目录 前言: 进程的状态 直接谈论进程的状态 僵尸进程和孤儿进程 纯理论部分 运行态: 阻塞态: 挂起态: 进程的优先级以及切换问题 切换: 优先级: 前言: 承接上文,进程1到…

CPU 和 GPU:为什么GPU更适合深度学习?

目录 什么是 CPU ? 什么是 GPU ? GPU vs CPU 差异性对比分析 GPU 是如何工作的 ? GPU 与 CPU 是如何协同工作的 ? GPU vs CPU 类型解析 GPU 应用于深度学习 什么是 CPU ? CPU(中央处理器)…

二叉树链式结构遍历(指针、递归)

当二叉树不使用数组实现,而是使用链式结构,用指针将节点相连时, 二叉树便会衍生出很多问题,如前序遍历、中序遍历、后序遍历、层序遍历。 下面我将用递归的方法完成二叉树的遍历。 但在这之前,我们还得构造链式结构…

深入解析 Apache Ranger

一. 概述 1.什么是 Apache Ranger? Apache Ranger 是一个为大数据平台提供集中化安全管理的开源框架,专门用于确保 Hadoop 生态系统中的数据安全。Ranger 通过提供细粒度的访问控制和监控,帮助组织实现对数据的全面安全管理,确保…