Google 基于 GNN 开发气味识别 AI,工作量相当于人类评价员连续工作 70 年

news2024/11/26 13:24:15

内容一览:气味总是萦绕我们身边。然而,我们却很难对气味准确描述。最近,Google Research 的子公司 Osom
基于图神经网络,开发了气味分析 AI。它可以根据化学分子的结构,对分子的气味进行预测。基于这一
AI,研究人员绘制出了主气味谱图,建立了化学结构与气味之间的映射,有望为感知觉研究提供新方法。

关键词:气味分析 GNN 气味谱图

作者 | 雪菜
编辑 | 三羊

本文首发于 HyperAI 超神经微信公众平台~

神经科学研究的一项基本问题,是将外部刺激的物理特性映射到感知觉中。

视觉中,颜色是波长的映射。听觉中,音调是频率的映射。但在嗅觉中,气味与物质之间的映射却很难建立。

目前,我们只能提取出一些基本的气味,绘制出气味轮 (fragrance wheel),再用这些基本气味组成更复杂的气味。

在这里插入图片描述

图 1:气味轮示意图

然而,这种粗略的分类很难用于科学研究。虽然已有气味传感器等技术用于气味的监测,但这些传感器仍只能识别特定气味。现有的气味鉴定很多时候仍需要气味评价员的参与,这一过程耗时长,且可重复性差。

近期,Google Research 的分支 Osom 公司基于图神经网络 (GNN) 开发了一种气味分析 AI。它可以根据化学分子的结构,对该分子的气味进行描述。 这一模型在 53% 的化学分子、55% 的气味描述词判断中优于人类。最终,研究人员利用这一模型绘制出了主气味谱图 POM (Principle Odor Map)。 这一成果已发表于《Science》。

在这里插入图片描述

相关研究已发表于《Science》

论文链接:

https://www.science.org/doi/full/10.1126/science.ade4401

实验过程

GNN 模型在多个架构中表现稳定

气味本质上是人们对于空气中化学分子的感应。因此,化学分子的结构会对气味产生影响。 在 GNN 中,化学分子的结构被分析整合,形成了一张代表整个分子的图表。

分子结构输入到模型中后,GNN 会优化不同化学结构在特定气味中的权重,最后通过预测层对分子的气味进行判断,输出对应的气味描述词。
在这里插入图片描述

图 2:GNN 模型示意图

结合 Good Scents 和 Leffingwell & Associates 数据库 (GS-LF 数据库),研究人员挑选出了 5,000 种分子作为模型的数据库。每种分子可以由多个气味描述,如奶酪味、果香味等。

在这里插入图片描述

图 3:GS-LF 数据库中的部分分子

随后,将 GS-LF 数据库按照 8 : 2 的比例划分为训练集和测试集,训练集被进一步划分为五个交叉验证的子集。

使用贝叶斯优化算法对数据进行交叉验证,并对 GNN 模型的超参数进行优化。优化完成后,GNN 模型在多个架构中表现稳定,交叉验证集中 AUROC 最高为 0.89。

GNN 模型在气味预测中优于人类

为验证模型对其他分子的分辨能力,研究人员对 GNN 模型和人类组进行了气味测试。
在这里插入图片描述

图 4:不同模型对于 2,3-二氢苯并呋喃-5-甲醛气味的判断

A:GNN 模型;

B:RF 模型;

C:人类组;

D:不同评价员对 2,3-二氢苯并呋喃-5-甲醛气味的评价。

对于 53% 的分子,GNN 模型的气味预测结果优于人类组的中位数。而目前最先进的算法,基于计数摩根指纹法 (cFP, count-based fingerprint) 的随机森林模型 (RF),仅在 41% 的分子气味预测中优于人类组。

在这里插入图片描述

图 5:不同模型的预测结果与人类组平均值的相关性

随后,研究人员将 GNN 模型的预测结果按气味描述词分类。除麝香外,GNN 模型对分子气味的预测结果均在人类组的误差分布中,且在 30 个气味描述词的预测结果中优于人类组中位数。

在这里插入图片描述

图 6:GNN 模型、RF 模型和人类组对不同分子的判断结果

GNN 模型的预测结果会受到分子的结构影响, 因此对于含硫基的大蒜味和含胺的鱼腥味,GNN 模型有着较高的预测准确率。而麝香至少包含五种不同的结构,大环、多环、硝基、甾体和直链,因此 GNN 模型的预测结果最差。

而人类组的表现则会受到熟悉度的影响。 他们对坚果、大蒜、干酪等常规的食物香味判断较为一致,而在麝香和干草味上分歧较大。

同时,描述词在训练集中的数量也会影响 GNN 模型对某一气味的预测。 出现次数够多时,GNN 模型可以对复杂的结构进行较准确的预测,如果香、花香和甜味。
在这里插入图片描述

图 7:训练数据对 GNN 模型预测结果与人类组平均值相关性的影响

然而,对于出现次数较少的味道,GNN 模型的正确率两极分化。对于鱼腥味、薄荷和樟脑的预测正确率较高,但对臭氧、醋酸味和发酵的味道判断较差。

GNN 模型绘制主气味谱图 GNN 模型的性能进行验证后,研究人员进一步将其用在了不同嗅觉任务中。

首先,他们测试了模型对结构相似的分子的判断能力。模型已知一种分子的气味后,需要对结构相似、气味不同和结构不同、气味相似分子的气味进行判断。对于这种反常的结构-气味关系,GNN 模型有 50% 的判断正确率,而 RF 模型仅有 19%。
在这里插入图片描述

图 8:一组结构或气味与已知分子接近的「三胞胎」

在获得了稳定的结构-气味关系之后,研究人员开始尝试绘制大规模的气味谱图。他们完成了约 500,000 种分子的主气味谱图 (POM)。 这些分子在科研领域尚不为人知,甚至绝大多数未被合成出来。

然而它们在谱图中的位置可以直接被 GNN 模型计算出来,因此可以绘制出很大规模的气味谱图。如果让一名训练过的人类评价员对这些分子的气味进行评估,大概需要连续工作 70 年。
在这里插入图片描述

图 9:主气味谱图

图中,每个分子气味的坐标由 GNN 模型确定,其颜色的 RGB 值对应其在预测气味矩阵中前三个维度的坐标。

普鲁斯特效应:嗅觉与记忆的联动

当我们闻到特定气味时,就会想起曾经的记忆,气味会使这一记忆更加形象、更富情感。 作家马塞尔·普鲁斯特在《追忆似水年华》中提到,叙述者闻到浸在茶水中的玛德莱娜蛋糕的味道时,「往事浮上心头」。因此,这一现象也被称为普鲁斯特效应。

嗅觉与记忆在神经系统中的联系较其他感知觉更为密切。它是唯一一个直接与情感脑区、记忆脑区直接相连的感觉系统。 嗅觉细胞被激活后,神经冲动会直接传递到梨状皮层。这一脑区包括负责恐惧和其他情感的杏仁核和负责记忆的海马旁回。

在这里插入图片描述

图 10:嗅觉环路的组成

Primary olfactory cortex:初级嗅皮层;

Amygadala:杏仁核;

Hippocampus:海马。

正是因为嗅觉与记忆、情感之间有着如此密切的联系,香水成了人们外出会面的必备品。也许对方再次见到你已经叫不出你的名字,但闻到这个味道,他一定会想起与你相见的那个情景。

借助 AI,人们对于分子结构与气味之间的联系有了更深入的了解。 也许有一天,我们真的能调配出自己最熟悉的味道。打开瓶盖,就能搭乘时光机器,让记忆回到过去。

参考链接:

[1] https://perfumersupplyhouse.com/2014/01/09/fragrance-creation-wheels-for-you/

[2] https://www.slideserve.com/cora-schroeder/functional-neuroanatomy

本文首发于 HyperAI 超神经微信公众平台~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1005186.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2023年法国CAC40指数研究报告

第一章 指数概况 1.1 指数基本情况 CAC 40指数,全名 Cotation Assiste en Continu (意为“连续辅助报价”),是法国巴黎股票交易所的标志性股票指数,与德国DAX指数及英国富时100指数并列为欧洲三大指数。自1987年12月31日成立以来&#xff0…

【Linux学习笔记】基础命令1

1. 什么是操作系统2. Linux基本指令2.1. ls指令2.2. pwd命令2.3. cd命令2.4. touch命令2.5. mkdir命令 1. 什么是操作系统 这里简单的讲述一下操作系统的概念,来看下图示: **操作系统是计算机系统中的一种软件,它负责管理计算机硬件资源和提…

CentOS 安装HTTP代理服务器 Tinyproxy

Tinyproxy是一个小型的基于GPL的HTTP/SSL代理程序,非常适合小型网络而且便于快速部署。这个代理程序最大的优点就是占用系统资源比较少。这里使用的系统为CentOS7.6,可以直接 yum 方式安装。 yum install tinyproxy -y 如果提示找不到安装包&#xff0…

中国各省市相关图标

中国各省市相关图标

buuctf crypto 【[GUET-CTF2019]BabyRSA】解题记录

1.打开文件 2.给出了pq以及(p1)*(q1),e,d,c,就可以得出结果了 import gmpy2 from Crypto.Util.number import long_to_bytes #pq用x表示 #(p1)(q1)用y表示 x 0x1232fecb92adead91613e7d9ae5e36fe6bb765317d6ed3…

Python爬虫基础(二):使用xpath与jsonpath解析爬取的数据

文章目录 系列文章索引一、使用xpath解析html文件1、浏览器安装xpath-healper(1)谷歌浏览器安装(需要科学上网)(2)验证(3)使用文件安装(不需科学上网) 2、安装…

2023年基因编辑行业研究报告

第一章 行业发展概况 1.1 定义 基因编辑(Gene Editing),又称基因组编辑(Genome Editing)或基因组工程(Genome Engineering),是一项精确的科学技术,可以对含有遗传信息的…

NotePad——xml格式化插件xml tools在线安装+离线安装

在使用NotePad时,在某些情形下,需要格式化Xml格式内容,可以使用Xml Tools插件。 一、在线安装 1. 打开Notepad 软件 2. 选择插件,选择“插件管理” 3. 搜索 XML Tools,找到该插件后,勾选该文件&#xff…

基于视觉重定位的室内AR导航APP的大创项目思路(3)手机相机内参数据获取和相机标定

文章目录 相机内参为什么要获取相机的内参数据:获取相机内存数据的方法棋盘格标定自动相机标定 前情提要: 是第一次做项目的小白,文章内的资料介绍如有错误,请多包含! 相机内参 相机内参是本身的物理数据&#xff0c…

wireshark通常无法抓取交换机所有端口报文

Wireshark 是一种网络分析工具,它通常在计算机的网络接口上进行数据包捕获和分析。然而,Wireshark 默认情况下无法直接捕获交换机所有端口的报文。 交换机是一种网络设备,它在局域网内转发数据包,根据目的MAC地址将数据包仅发送到…

Minecraft--基于云服务器搭建自己的服务器--简易搭建

阿丹: 上一个项目结束了。但是看着自己的服务器想着能不能做点啥子吧。想到了之前和兄弟们玩的麦块。好久没和兄弟们一起玩耍了。怀念之前一起连一个wifi玩我的世界的时候是真快乐。于是尝试自己动手搭建一个我的世界服务器,邀请兄弟们重温一下快乐。 提…

[libc-2.31 off_by_null] N0wayBack ezheap练习

以前保留了个WP,但是没复现过也没法用,用了两个晚上慢慢理复现一下。 先看这个题 while ( 1 ){menu();__isoc99_scanf("%d", &v3);switch ( v3 ){case 1:m1add(); //带readbreak;case 2:m2free();break;case 3:m3edit(); //溢出br…

Vscode配置已有工程及自动格式化

这里写目录标题 前言配置CMake配置clang&clang-tidy&clang-format.clangd.clang-tidy.clang-format 前言 最近一直在用vscode写代码,发现vscode一旦配置好了真的好用,不论是语法提示,还是跳转,或者是format,都…

回归与聚类算法系列⑤:逻辑回归

目录 1、介绍 2、原理 输入 激活函数 3、损失及其优化 损失函数 优化 4、API 5、案例:乳腺癌肿瘤预测 数据集 代码 🍃作者介绍:双非本科大三网络工程专业在读,阿里云专家博主,专注于Java领域学习&#xff0…

CUDA和cudnn详细安装过程【通用win】

1 软硬件资源 仅作参考,其他型号通用 win 11 32内存显卡 RTX 2080Ti ,驱动版本号:516.59python 3.8.10torch 1.8.0 框架cudatoolkit 11.1cudnn 8.0.4 2 查看适用cuda版本 2.1 查看本机的cuda算力 安装之前先进入官网查看自己的显卡能不能用…

关于OxyPlot.Wpf包没有Plot控件问题

一、OxyPlot.Wpf 控件信息 GitHub:https://github.com/oxyplot/oxyplot 官方文档地址:https://oxyplot.readthedocs.io/en/latest/index.html 在网上查了好久T^T 最后安装了2.0.0版本就出现了

Trinitycore学习之在Linux环境上搭建服务器并测试运行

1:准备环境,这里用ubuntu 22.04进行测试,安装环境后为了方便,换源。 注意:这里用的虚拟机,在虚拟机上生成地图信息,地图信息占用内存比较大,我暂时设置磁盘50G进行测试,…

Electron和vue3集成(推荐仅用于开发)

本篇我们仅实现Electron和vue3通过先运行起vue3项目,再将vue3的url地址交由Electron打开的方案,仅由Electron在vue3项目上套一层壳来达到脱离本机浏览器运行目的 1、参考快速上手 | Vue.js搭建起vue3初始项目 npm install -g vue npm install -g vue/c…

openpnp - 接入西门子二手飞达

文章目录 openpnp - 接入西门子二手飞达概述笔记编译生产用的飞达控制板工程建立飞达控制板GCode驱动create actuatorscreate actuators - GetIDcreate actuators - PrePickcreate actuators - PostPickcreate actuators - AdvIgnoreErrcreate actuators - GetCountcreate actu…

八股文学习二(spring boot + mybatis)

三. 架构 1. spring boot Spring Boot是一个依靠大量注解实现自动化配置的全新框架。约定优于配置;独立运行的 Spring 项目,内嵌servlet容器;Spring Boot 框架内部已经实现了与Spring以及其他常用第三方库的整合连接,并提供了默…