2024最新AI大模型产品汇总

news2024/9/23 9:30:08

文章目录

  • 1. 写在前面
  • 2. 效率工具
  • 3. 聊天机器人
  • 4. 应用开发工具
  • 5. Prompt工具与社区
  • 6. 通用基础大模型
  • 7. 训练框架
  • 8. 开源数据集
  • 9. 推理与部署平台及工具

【作者主页】:吴秋霖
【作者介绍】:Python领域优质创作者、阿里云博客专家、华为云享专家。长期致力于Python与爬虫领域研究与开发工作!
【作者推荐】:对JS逆向感兴趣的朋友可以关注《爬虫JS逆向实战》,对分布式爬虫平台感兴趣的朋友可以关注《分布式爬虫平台搭建与开发实战》
还有未来会持续更新的验证码突防、APP逆向、Python领域等一系列文章

1. 写在前面

  在数字化时代,人工智能(AI)正成为推动创新和变革的引擎。从高效的工具和聊天机器人到强大的训练框架和开源数据集,AI 大模型产品正在改变我们看待和使用技术的方式

本文作者将汇总AI大模型领域最前沿的效率工具、应用开发工具、Prompt 技术、训练框架、开源数据集、数据服务,以及推理与部署平台,建议大家收藏起来~总会有用的

在这里插入图片描述

2. 效率工具

devv.ai是一款面向开发者的下一代AI搜索引擎

在这里插入图片描述

CodeFuse是一款为国内开发者提供智能研发服务的产品,该产品是基于蚂蚁集团自研的基础大模型进行微调的代码大模型。具备代码补全、添加注释、解释代码、生成单测,以及代码优化功能,以帮助开发者更快、更轻松地编写代码

在这里插入图片描述

简单AI提供全面的AI社区服务,包括AI作图、文生图prompt社区、AI文案、AI头像、AI素材、AI设计等。 以“快人一步,轻松玩转AI” 为理念,致力于让每一个用户都能便捷地使用和理解人工智能

在这里插入图片描述

看看这些生成的图,惟妙惟肖的

在这里插入图片描述

AutoDraw是由Google推出的一个在线绘图工具,它利用机器学习和人工智能技术来帮助用户绘制图形。主要特点是识别用户所绘制的简单图形,并提供相关的预定义图形供用户选择,从而快速转换手绘图为更精确的图形。这个工具通过智能识别和建议功能,使得用户无需具备专业绘图技能,就能轻松创建出美观的图形

在我们绘制图形时,系统会实时分析用户的绘图意图,并在画布上显示相应的建议图标。用户可以从建议图标中选择最符合他们意图的图形,从而快速完成绘图过程,如下:
在这里插入图片描述

在这里插入图片描述

Fliki是一个文本转视频工具,通过使用AI语音将创意转化为引人注目的内容。该工具可能允许用户输入文本,然后使用人工智能生成声音并将其合成到视频中,从而帮助用户快速而轻松地创建视觉和听觉上的内容

在这里插入图片描述

Midjourney是第一个快速生成AI制图并开放予大众申请使用的平台!只需要输入关键字,就能够通过AI算法生成相对应的图片,还可以选择不同艺术家的风格,识别特定镜头或摄影术语,效果炸裂

在这里插入图片描述

Notion是一款多功能协作工具,它将笔记、项目管理、文档编辑、知识库等多种功能集成在一个应用程序中!通过AI的方式我们可以快速整理笔记、写文章、条列大纲、制作表格、检查文法等

在这里插入图片描述

Amazon CodeWhisperer是亚马逊推出的实时AI编程助手,是一项基于机器学习的服务,它可以分析开发者在集成开发环境(IDE)中的注释和代码,并根据其内容生成多种代码建议

在这里插入图片描述

笔灵AI是一款面向专业写作领域的AI写作工具,一键生成工作计划,营销方案等100种真实案例写作内容

在这里插入图片描述
妙鸭相机通过AI学习消费者上传的照片来构建人脸模型,然后把人脸模型套用其他模型合成照片(简单来说就是AI获取人的五官后,给五官P上新的发型、妆容、衣服、场景来合成一张新的照片)。所以只要上传完照片,就能产生无数风格的写真

在这里插入图片描述

3. 聊天机器人

ChatGPT当属第一!它是OpenAI训练的对话式大规模语言模型,是InstructGPT的兄弟模型,二者同属GPT-3.5系列的主力模型。 模型采用对话格式,可以跟进回答问题、承认错误、挑战不正确的前提并拒绝不正当的请求,且支持中文

在这里插入图片描述

Monica是一款一体化 AI 助手,配备最先进的 AI 模型(GPT-4、Claude、Gemini 等),帮助您聊天、搜索、写作、翻译等。它还提供图像、视频和 PDF 处理工具在这里插入图片描述

豆包是你的智能小助手,可以为你答疑解惑,提供灵感,辅助创作,也可以和你畅聊任何你感兴趣的话题

在这里插入图片描述

4. 应用开发工具

DevOpsGPT是一款开源人工智能驱动的软件开发自动化解决方案,做为AI驱动的智能软件开发平台,DevOpsGPT将LLM(大语言模型)和DevOps工具相结合,通过利用Chat-GPT等大型语言模型的能力,将自然语言需求转化为可工作的软件。这一创新功能极大地提高了开发效率、缩短了开发周期、降低了沟通成本,从而带来更高质量的软件交付

在这里插入图片描述

xTuring提供了对LLMs(如LLaMA、GPT-J、Galactica等)快速、高效、简单的微调服务。通过易用的界面,用户可以根据自己的数据和应用来微调LLMs,方便定制和控制。整个过程可以在个人电脑或私有云中完成,确保数据的隐私和安全性

在这里插入图片描述

FlowiseAI是一个开源的用户界面可视化工具,使用Node Typescript/Javascript编写,通过LangchainJS来构建定制的大型语言模型(LLM)流程。该工具以图形化方式简化了AI模型的创建和管理,使用户能够更方便地定制和使用人工智能技术

在这里插入图片描述

Dify是一个易用的LLMOps平台,基于不同的大型语言模型能力,让更多人可以简易地创建可持续运营的原生AI应用。Dify提供多种类型应用的可视化编排,应用可开箱即用,也能以“后端即服务”的API提供服务

在这里插入图片描述

LlamaIndex是一个简单、灵活的数据框架,用于将自定义数据源连接到大型语言模型

在这里插入图片描述

LangChain是一个基于语言模型开发应用程序的框架

在这里插入图片描述

5. Prompt工具与社区

FlowGPT是一个专注于分享ChatGPT聊天指令问答模板的在线社区网站。在这里,用户可以浏览大量由FlowGPT社区上传的ChatGPT提示词,以及查找当前最流行且有用的提示词

在这里插入图片描述

Prompt Engine一个帮助开发者为大型语言模型制作提示的库

在这里插入图片描述

6. 通用基础大模型

Gemini是Google开发的跨模态的、真正通用的AI模型,可以无缝地处理文本、视觉、音频、图像和视频等多种输入和输出

在这里插入图片描述

Yi是李开复博士创办的AI2.0公司零一万物开源发布的首款预训练大模型

在这里插入图片描述

MistralAI团队发布了Mistral 7B,这是迄今为止最强大的小型语言模型。Mistral 7B是一个拥有73亿参数的模型,其在所有基准测试中均超过了Llama 2 13B,在许多基准测试中超过了Llama 1 34B,接近CodeLlama 7B在代码任务的表现,同时还擅长英语任务。该模型采用了分组查询注意力(GQA)和滑动窗口注意力(SWA)以实现更快的推理和处理更长的序列。Mistral 7B已在Apache 2.0许可下发布,可以无限制使用,并且易于微调以适应任何任务

在这里插入图片描述

Alpaca斯坦福大学的项目旨在构建并分享一种遵循指令的LLaMA模型。项目的代码库包含:用于微调模型的52K数据,生成数据的代码,微调模型的代码,以及从发布的权重差异中恢复Alpaca-7B权重的代码

在这里插入图片描述

GPT-4是由 OpenAI 开发的多模态大型语言模型,是 GPT 基础模型系列的第四个版本。它于2023年3月14日首次发布,并通过付费聊天机器人产品 ChatGPT Plus 和 OpenAI 的 API 向公众提供服务。作为一个基于 Transformer 的模型,GPT-4 采用了一种范式,即使用公共数据和“从第三方供应商许可的数据”进行预训练,以预测下一个标记。在此步骤之后,模型通过人类和人工智能的强化学习反馈进行了微调,以实现与人类对齐和符合政策的目标

Llama2是Meta(Facebook的母公司)的AI团队开发的一系列预训练和微调的大型语言模型(LLMs),参数规模从70亿到700亿不等。这些模型被设计用于在人工智能领域进行各种任务,如自然语言理解、文本生成和机器翻译等

在这里插入图片描述

百川大模型百川大模型目前包括Baichuan-7B/13B,Baichuan2-7B/13B,四款开源可免费商用大模型及Baichuan-53B、Baichuan2-53B两款闭源大模型。其中Baichuan-7B/13B两款大模型在多个权威评测榜单均名列前茅,累积下载量突破六百万在这里插入图片描述

书生·浦语 InternLM是一个开源的轻量级训练框架,旨在支持大模型训练而无需大量的依赖。通过单一的代码库,它支持在拥有数千个GPU的大型集群上进行预训练,并在单个GPU上进行微调,同时实现了卓越的性能优化。在1024个GPU 上训练时,InternLM可以实现近90%的加速效率。 基于InternLM训练框架,我们已经发布了两个开源的预训练模型:InternLM-7B和 InternLM-20B

在这里插入图片描述

Qwen通义千问是阿里推出的超大规模语言模型

在这里插入图片描述

7. 训练框架

Ray是一种高性能的分布式执行框架,主要针对大规模的机器学习和强化学习应用。它通过在全局控制存储中抽象系统的控制状态,并保持所有其他组件无状态,实现了可扩展性和容错性。Ray利用共享内存的分布式对象存储有效处理大数据,并采用自下而上的分层调度架构实现低延迟和高吞吐量的调度。它使用基于动态任务图和参与者的轻量级API,以灵活的方式表达各种应用

在这里插入图片描述

MindSpore是一种适用于端边云场景的新型开源深度学习训练/推理框架。 MindSpore提供了友好的设计和高效的执行,旨在提升数据科学家和算法工程师的开发体验,并为Ascend AI处理器提供原生支持,以及软硬件协同优化

在这里插入图片描述

Colossal-AI为您提供了一系列并行组件。我们的目标是让您的分布式 AI 模型像构建普通的单 GPU 模型一样简单。我们提供的友好工具可以让您在几行代码内快速开始分布式训练和推理

OneFlow是一个旨在用户友好、可扩展和高效的深度学习框架。使用OneFlow,可以轻松地通过类似PyTorch的API编写模型,利用全局张量将模型扩展到n维并行执行,并通过图编译器加速/部署模型。OneFlow提供了简洁而强大的工具,使开发者能够更轻松地构建和训练深度学习模型,并且具备灵活性和可扩展性

在这里插入图片描述

Jittor是一个基于即时编译和元算子的高性能深度学习框架,整个框架在即时编译的同时,还集成了强大的Op编译器和调优器,为您的模型生成定制化的高性能代码。Jittor还包含了丰富的高性能模型库,涵盖范围包括:图像识别,检测,分割,生成,可微渲染,几何学习,强化学习等等
在这里插入图片描述

Megatron是NVIDIA应用深度学习研究团队开发的大型强大的Transformer模型。该项目致力于大规模训练Transformer语言模型的研究。我们开发了高效的模型并行(张量、序列和管道)以及使用混合精度的多节点预训练方法,适用于GPT、BERT和T5等基于Transformer的模型

在这里插入图片描述

飞桨是一个开源的深度学习框架,由百度推出。它包含了各种深度学习模型和工具,可以帮助开发者更快速、高效地构建和训练深度学习模型。Paddle 支持多种深度学习模型,包括卷积神经网络 (CNN)、循环神经网络 (RNN)、生成对抗网络 (GAN)、自动编码器 (AE) 等。它还提供了多种预训练模型,可以直接使用,满足各种不同应用场景的需求

在这里插入图片描述

JAX是Google开发的用于变换数值函数的Python机器学习框架。它结合了修改版本的Autograd(自动通过函数的微分获得其梯度函数),和TensorFlow的XLA(加速线性代数)。它被设计为尽可能的遵从NumPy的结构和工作流程,并协同工作于各种现存的框架如TensorFlow和PyTorch

在这里插入图片描述

ONNX是一种针对机器学习所设计的开放式的文件格式,用于存储训练好的模型。它使得不同的人工智能框架(如Pytorch、MXNet)可以采用相同格式存储模型数据并交互

在这里插入图片描述

TensorFlow是一个端到端开源机器学习平台。它拥有一个全面而灵活的生态系统,其中包含各种工具、库和社区资源,可助力研究人员推动先进机器学习技术的发展

在这里插入图片描述

PyTorch是一个开源的Python机器学习库,基于Torch,底层由C++实现,应用于人工智能领域,如计算机视觉和自然语言处理。它主要由Meta Platforms的人工智能研究团队开发

在这里插入图片描述

8. 开源数据集

RedPajama-Data-v2是一个开放的数据集,发布了RedPajama-V2版本,包含来自84个CommonCrawl数据集的30万亿个经过过滤和去重处理的标记(原始数据超过100万亿个),涵盖了5种语言:英语、法语、西班牙语、德语和意大利语

LLMDataHub致力于收集LLM高质量训练语料库的项目,提供了一系列专门用于聊天机器人训练的数据集

Hugging Face Datasets提供的开源数据集服务

9. 推理与部署平台及工具

OpenVINO是英特尔开发的一款功能强大的深度学习工具包,可实现跨多个硬件平台的优化神经网络推理。在本文中,我们讨论了 OpenVINO 的特性和优势,以及它如何与领先的计算机视觉平台 Viso Suite 集成,以构建和交付可扩展的应用程序

在这里插入图片描述

OpenLLM是一个用于在生产中操作大型语言模型 (LLM) 的开放平台,可以轻松地微调、服务、部署和监控任何LLM大模型

在这里插入图片描述

jina使用云原生技术构建多模式人工智能应用程序,Jina 为服务 ML 模型提供了流畅的 Python 体验,从本地部署过渡到 Docker-Compose、Kubernetes 或 Jina AI Cloud 等高级编排框架。Jina 使每个开发人员都可以使用先进的解决方案工程和云原生技术

在这里插入图片描述

  好了,到这里又到了跟大家说再见的时候了。创作不易,帮忙点个赞再走吧。你的支持是我创作的动力,希望能带给大家更多优质的文章

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1490399.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

springboot+bootstrap+jsp校园二手书交易平台mlg86

考虑到实际生活中在校园二手书交易系统方面的需要以及对该系统认真的分析,将系统权限按管理员和学生这两类涉及用户划分。 (a) 管理员;管理员使用本系统涉到的功能主要有个人中心、学生管理、图书类型管理、二手图书管理、通知公告管理、管理员管理、用户留言、系统…

istio pod不启动及访问报RBAC错误问题解决

istio pod不启动问题解决 在kubernetes集群中安装istio之后,在创建的depoyment中已经使用了注入注解sidecar.istio.io/inject: true’配置,但是istio pod不创建,代码示例如下 kind: Deployment apiVersion: apps/v1 metadata:name: name-an…

【Docker】Docker:解析容器化技术的利器与在Linux中的关键作用

🍎个人博客:个人主页 🏆个人专栏:Linux ⛳️ 功不唐捐,玉汝于成 目录 前言 正文 Docker 是什么? Docker 的作用 Docker 在 Linux 中的重要性 结语 我的其他博客 前言 随着软件开发的不断发展&…

012 Linux_线程控制

前言 本文将会向你介绍线程控制(创建(请见上文),终止,等待,分离) 线程控制 线程终止 pthread_t pthread_self(void); 获取线程自身的ID 如果需要只终止某个线程而不终止整个进程,可以有三种…

鸿蒙实战应用开发:【拨打电话】功能

概述 本示例通过输入电话,进行电话拨打,及电话相关信息的显示。 样例展示 涉及OpenHarmony技术特性 网络通信 基础信息 拨打电话 介绍 本示例使用call相关接口实现了拨打电话并显示电话相关信息的功能 效果预览 使用说明 1.输入电话号码后&#…

7、Linux-防火墙和配置静态ip

一、防火墙(防火墙服务名firewalld) 防火墙配置命令:firewall-cmd firewall-cmd --help:防火墙帮助firewall-cmd --state:查看防火墙状态firewall-cmd --zonepublic --list-ports:查看所有打开的端口firew…

【独立版】表情包小程序完整版源码前后端源码

搭建要求: 1.系统要求Nginx 1.18.0PHP-7.2mysql5.6,开启 ssl,php需要安装 sg11 扩展 2.设置伪静态 location / { index index.php index.html index.htm; if (!-e $request_filename) { rewrite ^/(.*)$ /index.php?s$1; } } location /a…

【三维重建】VastGaussian:用于大场景重建的大3D Gaussian(CVPR 2024)

题目:VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction 来源:清华大学;华为诺亚;中国科学院 链接:https://vastgaussian.github.io/ 总结:VastGaussian:基于3D GS的分块优化重…

栈帧、ELF

前言 大家好我是jiantaoyab,这是我所总结作为学习的笔记第四篇,在这里分享给大家,还有一些书籍《深入理解计算机系统》《计算机组成:结构化方法》《计算机体系结构:量化研究方法》《程序员的自我修养》,今天我们来了解程序栈 为什…

Linux下du命令和df命令的使用

du命令作用是估计文件系统的磁盘已使用量,常用于查看文件或目录所占磁盘容量。df命令是统计磁盘使用情况,可以用来查看磁盘已被使用多少空间和还剩余多少空间。du命令语法du [选项] [文件或目录名称]参数:-a:--all, 列…

Ethersacn的交易数据是什么样的(2)

分析 Raw Transanction RLP(Recursive Length Prefix)是一种以太坊中用于序列化数据的编码方式。它被用于将各种数据结构转换为二进制格式,以便在以太坊中传输和存储。RLP 是一种递归的编码方式,允许对复杂的数据结构进行编码。所…

5G工业智能网关保障煤矿安全生产

随着物联网技术发展与煤矿需求的持续激增,矿山矿井的分布范围广泛、户外环境恶劣等管理问题急需解决,而物联网网关工业级设计能够无惧恶劣环境干扰,轻松解决户外网络部署问题。 工业网关通过采集矿井内的各类传感器数据对矿井进行远程监控&a…

【图论】Dijkstra 算法求最短路 - 构建邻接矩阵(带权无向图)

文章目录 例题:到达目的地的方案数题目描述代码与解题思路构建带权无向图的邻接矩阵 例题:到达目的地的方案数 题目链接:1976. 到达目的地的方案数 题目描述 代码与解题思路 func countPaths(n int, roads [][]int) int {g : make([][]int…

使用API有效率地管理Dynadot域名,进行DNS域名解析

关于Dynadot Dynadot是通过ICANN认证的域名注册商,自2002年成立以来,服务于全球108个国家和地区的客户,为数以万计的客户提供简洁,优惠,安全的域名注册以及管理服务。 Dynadot平台操作教程索引(包括域名邮…

文件多线程读取下载+异步上传云存储

文章目录 1. 前言2. 多线程读取下载异步上传2-1. 多线程读取下载2-2. 异步上传异步更新cosUrl 3. 线程池单个任务提交4. 关于异步上传的文件oosUrl地址返回问题 1. 前言 实际开发中经常遇到,文件上传或者文件批量下载的任务。单线程下载大批量文件,排队处…

灰狼算法优化elman神经网络回归分析,GWO-ELMAN回归分析

目录 背影 ELMAN神经网络的原理 ELMAN神经网络的定义 受限玻尔兹曼机(RBM) 灰狼算法原理 灰狼算法优化elman神经网络回归分析 基本结构 主要参数 数据 MATALB代码 结果图 展望 完整代码下载:灰狼算法优化ELMAN回归分析,GWO-ELMAN回归分析资源-CSDN文库 https://download.c…

Electron 多显示器渲染

Electron打出的包,如果当前有俩个显示器,则可以配置当前显示倒哪个显示器上,或者可以配置不同的显示器,启动不同的项目,只在Windows和Linux下测试过,Mac没有真机,可以利用docker安装MacOS环境&a…

苹果电脑免费释放磁盘空间软件CleanMyMac X2024

CleanMyMac X通过以下方式帮助用户释放磁盘空间: 智能扫描和清理:CleanMyMac X拥有强大的智能扫描功能,可以深入系统底层,快速识别并清理各类无用文件和垃圾,如缓存、日志、临时文件等。这些文件通常会占用大量的磁盘…

『运维备忘录』之 RegEx 正则表达式实例汇总

运维人员不仅要熟悉操作系统、服务器、网络等知识,甚至对于开发相关的也要有所了解。很多运维工作者可能一时半会记不住那么多命令、代码、方法、原理或者用法等等。这里我将结合自身工作,持续给大家更新运维工作所需要接触到的知识点,希望大…

单片机入门:LED数码管

LED数码管 LED数码管:由多个发光二极管封装在一起组成的“8”字型的器件。如下图所示: 数码管引脚定义 一位数码管 内部由八个LED组成。器件有十个引脚。 对于数码管内的8个LED有共阴和共阳两种连接方法。 共阴:将8个LED的阴极都连接到一…