基于大模型的图像重命名工具ai-renamer

news2025/1/11 10:00:02

文章目录

    • 基础使用
    • 语言问题
    • 命名风格

基础使用

ai-renamer是一款自动为图片重命名的工具,由于需要调用基于本地大模型,在使用之前需要用Ollama或者LM Studio配置好至少一个大模型,比如Llava, Gemma, Llamad等。如果想要为视频重命名,还需要安装ffmpeg。

此外,ai-renamer基于node.js,其基本的使用指令为

npx ai-renamer .

然后,当前文件夹中的图片就会被重新命名了。将【.】换成一个路径,那么就修改对应路径中的图片名称。官方示例如下

在这里插入图片描述

通过【-p】或【–provider】可以指定调用LM Studio或Ollama;通过【-m】或【–model】可以指定具体调用的大模型,下例表示调用lm-studio中的llava模型。

npx ai-renamer . --provider=lm-studio --model==llava

语言问题

通过修改【-l】或者【–language】参数,可以改变图片重新命名的语言。

>npx ai-renamer . --language-Chinese

但是,具体在更改图片名称时,会受到所调用的大预言模型自身的限制,以llava为例,在处理图片任务时,并不能完全支持中文,所以就算把ai-renamer的语言设为中文,也无法输出中文名称的图片。

例如,在Ollama让llava描述一张图片,其给出的回答如下,既有中文又有英文,最后它将这张图片重命名为【婚纱女子-marriage-dress-lady.jpg】

好的,在这张图片中,你可以看到一位年轻女性。她穿着黑色的上衣和白色的短裙,擦抱自己的头部和颈部。女性正向镜头看着我们,并且左侧放下一只手。she has long black hair, and is wearing a sleeveless top with an open back. Her expression seems relaxed as she looks directly at the camera. She is standing in front of a light-colored curtain with some floral or paisley pattern visible behind her.

命名风格

默认重命名的文件,会用段横杠对单词进行连接,通过【-c】或【–case】可以更改重命名的风格,可选参数如下

case示例
camelCasetwoWords
capitalCaseTwo Words
constantCaseTWO_WORDS
dotCasetwo.words
kebabCasetwo-words
noCasetwo words
pascalCaseTwoWords
pascalSnakeCaseTwo_Words
pathCasetwo/words
sentenceCaseTwo words
snakeCasetwo_words
trainCaseTwo-Words

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2254874.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

element Cascader级联选择器 点文字即可选中,去掉radio按钮

需求 将示例的点击radio和点击文字功能结合在一起。可以选择任意一级的内容,直接点击文字即可选中,同时如果有下一级就展示,去掉radio标签。 实现方法 通过css将radio标签做成文字框一样大小并且透明覆盖在整个文字上方,点击文…

【已解决】黑马点评项目中启动Spring Boot服务失败,com.sun.tools.javac.tree.JCTree qualid

黑马点评项目中启动Spring Boot服务失败 报错提示 java: java.lang.NoSuchFieldError: Class com.sun.tools.javac.tree.JCTree$JCImport does not have member field com.sun.tools.javac.tree.JCTree qualid这是因为 lombok 版本不兼容造成的 找到 pom.xml 文件&#xff0…

C#,人工智能,深度学习,目标检测,OpenCV级联分类器数据集的制作与《层级分类器一键生成器》源代码

一、目标识别技术概述 1、摘要 目标检测是计算机视觉中最基本和最具挑战性的问题之一,它试图从自然图像中的大量预定义类别中定位目标实例。深度学习技术已成为直接从数据中学习特征表示的强大策略,并在通用目标检测领域取得了显著突破。鉴于这一快速发…

绿虫光伏设计系统:清洁能源的未来

煤炭、石油、天然气是我们现在依赖的重要能源,但这些能源难以再生,而且开采过程中会产生污染。太阳能发电作为清洁能源的一种重要形式,受到了越来越多的关注。绿虫光伏发电系统,不仅考虑到其发电效率,还可以考虑其经济…

2025澄迈漓岛音乐节品牌招商大会成功举行

——共谋音乐盛事,携手推动文化经济发展 12月6日,“2025澄迈漓岛音乐节品牌招商大会”(以下简称“招商大会”)在澄迈举行。本次大会由澄迈福山发展有限公司、福山咖啡文化风情镇旅游区联合主办,海南绿发投资有限公司承…

基于Java和Vue开发的漫画阅读软件漫画阅读小程序漫画APP

前景分析 受众广泛:漫画的受众群体广泛,不仅限于青少年,还涵盖了成年人等多个年龄层和社会阶层。漫画文化在全球范围内的影响力不断扩大,未来漫画软件创业可以考虑全球市场的拓展。 市场需求大:数字化阅读趋势下&…

Lua中实现HTTP请求的User-Agent自定义

User-Agent(用户代理)是HTTP请求头的一部分,用于描述发出请求的客户端的信息,包括浏览器类型、版本和操作系统等。自定义User-Agent对于开发者来说是一个重要的功能,它可以帮助服务器识别请求来源,也可以模…

dell电脑开不了机怎么回事?戴尔电脑无法开机解决方法

dell戴尔电脑开不了机,这是很多使用dell电脑用户常遇到的问题。这种故障情况是由多种原因引起,包括硬件故障、软件问题或电源问题等等。dell电脑开不了机怎么办呢?下面便为大家介绍一下相关解决修复方法,帮助用户解决戴尔电脑无法…

148. 排序链表(java) 标记一下

我的思路是插入排序,然而时间超出限制!!! 时间复杂度是 O(nlogn) 的排序算法包括归并排序、堆排序和快速排序(快速排序的最差时间复杂度是 O(n 2)),最适合链表的排序算法是归并排序。 题目描述…

C语言实验 二维数组

时间:2024.12.6 一、实验 7-1 矩阵运算 代码 #include<stdio.h> int main(){int a[20][20]={0};int n,i,j;int sum=0;scanf("%d",&n);for(i=0;i<n;i++){for(j=0;j<n;j++){scanf("%d",&a[i][j]);if((i!=n-1)&&(j!=n-1)&am…

物通博联,smart200配置

设备&#xff1a;物通博联smart200plc交换机 网线直连&#xff0c;并网&#xff0c;本地链接&#xff0c;电脑直连 配置电脑ip&#xff0c;以太网修改ip网段为2段&#xff0c;ping通192.168.2.1 浏览器访问192.18.2.1&#xff0c;输入账号密码进入后台配置页面 &#xff0c;…

租赁小程序的优势与应用场景解析

内容概要 租赁小程序&#xff0c;听起来是不是很酷&#xff1f;其实&#xff0c;它就是一个让你可以方便地租借各种高成本但用得不频繁的商品的平台。想象一下&#xff0c;当你需要租一件派对用的华丽小礼服&#xff0c;或是想体验一下超酷的运动器材&#xff0c;租赁小程序就…

最简单的线性回归神经网络

数据&#xff1a; # 线性回归 import torch import numpy as np import matplotlib.pyplot as plt# 随机种子&#xff0c;确保每次运行结果一致 torch.manual_seed(42)# 生成训练数据 X torch.randn(100, 3) # 100 个样本&#xff0c;每个样本 3 个特征 true_w torch.tenso…

第九篇:k8s 通过helm发布应用

什么是helm&#xff1f; Helm 是 Kubernetes 的包管理器。Helm 是查找、分享和使用软件构建 Kubernetes 的最优方式。 在红帽系的Linux中我们使用yum来管理RPM包&#xff0c;类似的&#xff0c;在K8s中我们可以使用helm来管理资源对象&#xff08;Deployment、Service、Ingress…

FastAPI解决跨域报错net::ERR_FAILED 200 (OK)

目录 一、跨域问题的本质 二、FastAPI中的CORS处理 1. 安装FastAPI和CORS中间件 2. 配置CORS中间件 3. 运行FastAPI应用 三、解决跨域报错的步骤 四、案例&#xff1a;解决Vue.js与FastAPI的跨域问题 1. Vue.js前端应用 2. FastAPI后端API 3. 配置CORS中间件 4. 运行…

ThinkPHP+Layui开发的ERP管理系统

ERP采购生产销售系统&#xff0c;一款基于ThinkPHPLayui开发的ERP管理系统&#xff0c;帮助中小企业实现ERP管理规范化&#xff0c;此系统能为你解决五大方面的经营问题&#xff1a;1.采购管理 2.销售管理 3.仓库管理 4.资金管理 5.生产管理&#xff0c;适用于&#xff1a;服装…

数字化转型中的架构整合:业务、数据、应用与技术架构的协同发展

一、引言 在当今快速发展的数字经济时代&#xff0c;企业面临着前所未有的挑战与机遇。数字化转型已成为企业提升竞争力和适应市场变化的关键策略。然而&#xff0c;成功的数字化转型不仅仅依赖于技术的引入&#xff0c;更需要对企业内部架构的深刻理解与整合。本文将探讨业务架…

C语言实例_26之根据输入计算星期几

1. 问题 请输入星期几的第一个字母来判断一下是星期几&#xff0c;如果第一个字母一样&#xff0c;则继续判断第二个字母。 2. 实现思路 思路一&#xff1a;嵌套if-else语句实现 首先接收用户输入的第一个字母&#xff0c;使用if-else语句进行判断。如果输入的是M&#xff0…

ceph安装P版本

文章目录 1、搭建的要求1、OSD约束2、ceph部署方式1、cephadm的部署原理红帽版本搭建(RHCS5.0部署) 2、cephadm安装P版本1、环境要求2、配置主机名&#xff0c;关闭防火墙&#xff0c;时间同步3、检查python环境和容器运行时环境4、部署引导节点(下载cephadm脚本)1、获取脚本2、…

git 使用配置

新拿到机器想配置git 获取代码权限&#xff0c;需要的配置方法 1. git 配置用户名和邮箱 git config --global user.name xxxgit config --global user.email xxemail.com 2. 生成ssh key ssh-keygen -t rsa -C "xxemail.com" 3. 获取ssh key cat ~/.ssh/id_rsa.…