因吹斯汀!只需上传照片,GPT-4V精准识别食物的卡路里和摄入热量

news2025/3/17 14:28:17

健身和减肥的朋友有福啦!

最近一篇文章探索了GPT-4V在膳食评估领域的强大能力,可以根据饮食图片精准判断食物的种类与重量,并给出营养成分的分析,包括碳水化合物、蛋白质、脂肪占比。

最最重要的是,它还能告诉我们这些食物的卡路里是多少,这对于我们减肥的朋友来说可是超级重要的!

你可以上传吃之前和吃之后的图片,GPT-4V可以轻松判断摄入了多少热量。

比如提供这两张图片:

图片

给模型一些任务提示:

识别提供的图像中的食物类型,包括食用前和食用后。使用周围的对象作为近似分量大小的参考。为每一类食物的摄入量提供合理的克数估计。请注意,这些食品来自加纳和肯尼亚。

输出结果:

为了估算份量,我将使用杯子和盘子作为参考,假设盘子是标准的餐盘大小,直径约为10-12英寸。以这些物体为尺度,我们可以做出以下估计: 食物1(炸鱼):初始份量约400克;消费份量约300克。食物2(淀粉类配菜,可能是banku或fufu):初始份量约300克;消费份量约250克。食物3(番茄酱):初始份量约150克;消费份量约75克。食物4(洋葱片):初始份量约50克;消费份量约20克。

看看营养成分呢:

计算一下300g炸鱼、250gbanku、75g番茄酱和20g洋葱片的营养成分,包括碳水化合物、蛋白质、脂肪和卡路里。请以下列格式列出结果:碳水化合物:[g],蛋白质:[g],脂肪:[g],卡路里:[千卡]。

输出:

300克炸鱼包括0克碳水化合物,78克蛋白质,33克脂肪,606千卡的热量。250g的banku含有120g碳水化合物,4.5g蛋白质,1g脂肪,527.5千卡热量。75g番茄酱,包含3g碳水化合物,0.75克蛋白质,0.225克脂肪,15千卡的热量。20g洋葱片含有1.8克碳水化合物、0.22克蛋白质、0.02克脂肪和8千卡热量。

它还能像个营养小贴士一样,告诉我们饮食中缺少了哪些营养,并给出合理的建议。这样我们就可以更好地调整自己的饮食。

这顿饭缺少什么营养,吃什么来补充呢?

图片

输出:

根据您提供的图片,这顿饭包括米饭和鸡肉,这可能提供了大量的碳水化合物、蛋白质和脂肪。然而,它似乎缺乏一些纤维和维生素:纤维:没有可见的蔬菜或水果,而这些是提供膳食纤维所必需的。为了增加纤维摄入量,可以考虑加一份混合蔬菜或新鲜沙拉。维生素和矿物质:新鲜水果和蔬菜也是维生素和矿物质的重要来源。乳制品或钙源:没有乳制品或其他富含钙的食物。可以从牛奶,奶酪,酸奶,或钙强化植物选择一份增加钙含量。

看着还挺像那么回事,有了GPT-4V督促,就不用担心一不小心吃多啦!

图片

但上面只是一些例子参考,GPT-4V在膳食评估方面的准确性到底如何呢?本文的作者还进行了多个数据维度的详细定量分析,让我们一起来了解一下吧!

论文标题:
Dietary Assessment with Multimodal ChatGPT: A Systematic Analysis

论文链接:
https://arxiv.org/pdf/2312.08592.pdf

实验数据

作者使用了居住在伦敦的肯尼亚和加纳裔成年人的饮食摄入数据。为每位参与者分配了eButton或AIM摄像机被动记录他们的饮食摄入量。使用标准化的Salter breknell体重秤记录食物初始重量和吃饱后剩余的食物重量。配备经验丰富的营养师作为人工评估基准,与GPT-4V的结果进行比较。

实验结果

食物检测能力

首先来看看GPT-4V能否准确识别食物的类别。

作者对比了是否包含食物来源信息的提示下的模型性能。从结果可以看出,指明食物来源可以显著提高语言模型的能力,准确识别特定文化的食物,**准确率达到了87.5%**,相比不说明食物来源提高了十几个点。

图片

当食物来源未指定时,GPT-4V经常错误将白色淀粉类食物误分类为米饭。当说明了食物来自肯尼亚或加纳时,模型能准确将食物识别为banku或ugali,这是传统的非洲食物。

食物分量估计

下图展示了三种方法包括GPT-4V、人眼估计和基准真值对食物分量的估计,图中观察到的趋势表明,GPT-4V的预测通常与基准真值非常接近。

图片

作者进一步使用绝对误差的度量来比较GPT-4V和人类估计。GPT-4V的估计的平均绝对误差为54.6g。相比之下,人类估计准确性稍微更高一些,平均绝对误差为43.6g。但也说明GPT-4V的表现与人类非常接近

图片

营养成分估计

在估算出食物分量之后,作者利用GPT-4V模型将食物的重量转化为特定的营养数据,重点关注关键的膳食成分:碳水化合物,蛋白质,脂肪和卡路里。获取的结果与真实值进行比较。

下表展示了10个不同膳食的分量和营养成分估计误差。可以看到,营养估计的准确性在很大程度上取决于分量估计的准确性。

图片

下图显示了GPT-4V预测32种食物的碳水化合物、蛋白质、脂肪和卡路里含量的预测结果,并与真实值进行对比,可以看出,GPT-4V预测的趋势在大部分食物上与真值一致

图片

处理低可见图像的能力

本文还突显了GPT-4V处理低可见度图像(如在黑暗环境中拍摄的图像)的能力。

图片

在光线暗的地方,如果没有足够的语境提示,GPT-4V可能倾向于会把食物当成米饭或面包这类常见的食物。但是,当我们给了它一些关于食物来源的信息时,它就能准确地识别出来,比如banku和ugali这种传统的非洲食物。

结论

本文分析了GPT-4V在膳食评估中的潜力。即使在没有使用特定食物数据集进行微调或适应的情况下,GPT-4V在食物检测方面准确率高达87.5%。另外GPT-4V可以利用周围的物体作为比例参考来推断食物项目的份量大小,进一步提高将食物重量转化为营养含量的准确性。

虽然GPT-4V很强大,但还不能完全解决复杂的空间关系和精确空间分析任务。比如,它对于估算食物的体积或分量不太准确,因为这需要三维感知能力,超出了它的能力范围。在本文的实验中发现它对重量不到30g的食物类别难以准确估计。

即便如此,它的表现也几乎达到了人类水平。期待未来版本的GPT-4V能更稳健,为我们提供更准确的膳食摄入评估。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1336420.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux操作系统——进程(四)进程切换与命令行参数

进程切换 概念引入 下面我们先了解几个概念: 竞争性: 系统进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间是具有竞争属性的。为了高效完成任务,更合理竞争相关资源,便具有了优先级 独立性: 多进程…

解决国内大模型痛点的最佳实践方案

1.前言 自AI热潮掀起以来,国内互联网大厂躬身入局,各类机构奋起追赶,创业型企业纷至沓来。业内戏称,一场大模型的“百模大战”已经扩展到“千模大战”。 根据近期中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告…

关于linux mv指令机制

最近在mv文件的时候,操作失误将生产服务器一个1TB的文件夹mv到了/opt/test目录,因为最后/opt/目录被沾满所以1TB的文件夹没有迁移过来,写入了30GB数据到了/opt/test目录,因为系统分区被沾满,所以把test目录给删除了。 …

交换机端口镜像技术原理与配置

在网络维护的过程中会遇到需要对报文进行获取和分析的情况,比如怀疑有攻击报文,此时需要在不影响报文转发的情况下,对报文进行获取和分析。镜像技术可以在不影响报文正常处理流程的情况下,将镜像端口的报文复制一份到观察端口&…

OpenAI大模型DecryptPrompt

what is prompt 综述1.Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing(五星好评)综述2. Paradigm Shift in Natural Language Processing(四星推荐)综述3. Pre-Trained Models: Past, Present and Future Prompt即…

LeetCode刷题--- 优美的排列

个人主页:元清加油_【C】,【C语言】,【数据结构与算法】-CSDN博客元清加油_【C】,【C语言】,【数据结构与算法】-CSDN博客 个人专栏 力扣递归算法题 http://t.csdnimg.cn/yUl2I 【C】 http://t.csdnimg.cn/6AbpV 数据结构与算法 ​​​​​​http://t.cs…

SQL手工注入漏洞测试(MySQL数据库)

一、实验平台 https://www.mozhe.cn/bug/detail/elRHc1BCd2VIckQxbjduMG9BVCtkZz09bW96aGUmozhe 二、实验目标 获取到网站的KEY,并提交完成靶场。 三、实验步骤 ①、启动靶机,进行访问查找可能存在注入的页面 ②、通过测试判断注入点的位置(id) (1)…

Unity VR Pico apk安装失败:INSTALL_FAILED_UPDATE_INCOMPATIBLE

我的报错: PICO4企业版。安装apk,报错“安装失败。(所属的Unity项目打包的apk,被我在同一台pico4安装了20次) 调试方法: PIco4发布使用UNITY开发的Vr应用,格式为apk,安装的时候发生…

Java多线程技术六——线程的状态(备份)

1 概述 线程在不同的运行时期存在不同的状态,状态信息在存在于State枚举类中,如下图。 每个状态的解释如下图 调用于线程有关的方法是造成线程状态改变的主要原因,因果关系如下图 从上图可知,在调用与线程有关的方法后&#xff0…

Scikit-Learn线性回归(一)

Scikit-Learn线性回归一 1、线性回归概述1.1、回归1.2、线性1.3、线性回归1.4、线性回归的优缺点1.5、线性回归与逻辑回归2、线性回归的原理2.1、线性回归的定义与原理2.2、线性回归的损失函数3、Scikit-Learn线性回归3.1、Scikit-Learn线性回归API3.2、Scikit-Learn线性回归初…

mac终端自定义登录欢迎语

shigen坚持更新文章的博客写手,擅长Java、python、vue、shell等编程语言和各种应用程序、脚本的开发。记录成长,分享认知,留住感动。 shigen看着单调的终端,突然有了一丝丝的念头,我要搞的炫酷一点。让我想到的一个场景…

VMvare虚拟机之文件夹共享与防火墙设置

共享文件夹 什么是共享文件夹 共享文件夹是一种在网络上共享文件和文件夹的方法。它允许多个用户通过网络连接到共享文件夹,并可以访问其中的文件和文件夹,进行文件的读取、修改、删除等操作。共享文件夹可以用于方便地共享文件和协作工作,…

STL:std::array 和 基本数组类型array 浅谈一二三

一、优缺点比较 在C中,std::array是标准库提供的数组容器,相比于基础数据类型的数组,它具有以下优点和缺点: 优点: 安全性:std::array提供了边界检查,可以避免数组越界访问的问题。 可以作为…

在Centos7中利用Shell脚本:实现MySQL的数据备份

目录 自动化备份MySQL 一.备份数据库脚本 1.创建备份目录 2.创建脚本文件 3.新建配置文件(连接数据库的配置文件) 4.给文件权限(mysql_backup.sh) ​编辑 5.执行命令 (mysql_backup.sh) ​编辑 二.数据库通过备份恢复 1.创建脚…

jsonhandle 插件下载

网盘地址: 链接:https://pan.baidu.com/s/1hj4GKuGNyDNP2JzsJTLFtg 提取码:87rw 1.打开谷歌浏览器,选择扩展程序,记得选择为开发者模式,然后把下载好的CRX文件拖进去就行了

TCP通信流程

// TCP 和 UDP -> 传输层的协议 UDP : 用户数据报协议,面向无连接,可以单播,多播,广播, 面向数据报,不可靠(接受方不会存储数据,也没有拥塞控制)。效率高&#xff…

二维码智慧门牌管理系统升级:高效授权精准控制

文章目录 前言一、精确权限控制二、角色权限受限与透明操作三、提升工作效率与安全性 前言 二维码智慧门牌管理系统在企业管理中扮演着愈发重要的角色。通过系统升级,管理员可以配置权限角色,为单个或多个用户赋权,实现精准控制,…

如何进行镜像管理

目录 镜像管理 创建自定义镜像 自定义镜像管理 自定义镜像管理方法 对于传统的物理服务器,就要基于现有服务器磁盘制作操作系统镜像,系统镜像可以简单理解成把操作系统中包含的一系列文件通过镜子映射出一模一样的文件并进行打包压缩,就变…

Flowable-升级为7.0.0.M2-第二节

目录 替换变化的类和配置把javax.servlet 替换为 jakarta.servlet修改redis的配置配置logging.level.org.springframework.boot.autoconfigureerror避免影响视听 替换变化的类和配置 把javax.servlet 替换为 jakarta.servlet import javax.servlet.ServletContext; import ja…

AI赋能金融创新:ChatGPT引领量化交易新时代

文章目录 一、引言二、ChatGPT与量化交易的融合三、实践应用:ChatGPT在量化交易中的成功案例四、挑战与前景五、结论《AI时代Python量化交易实战:ChatGPT让量化交易插上翅膀》📚→ [当当](http://product.dangdang.com/29658180.html) | [京东…