AI有鼻子了 还能远程传输气味 图像生成香水
图像+气味,意想不到的多模态 AI。
众所周知,图像、音乐能用 AI 生成,但出乎意料的是,气味也行。
这个发帖的 Alex Wiltschko 是 Osmo 的 CEO 和联合创始人。“将气味数字化”进而“生成气味”最初只是他在谷歌工作期间的一个研究项目。但在 2022 年,他在 Lux Capital 和谷歌风投的支持下,将其作为一家独立的初创公司推出。
“我一直热衷于了解气味。它是一种非常强大的情绪感官,但我们对它却知之甚少”Wiltschko 在接受 CNBC 采访时说。
在复刻出李子的香味后,Wiltschko 非常激动,“带着这个香味去了很多地方”。
至于这项研究的用途,Osmo 的官方说法是“改善人类的健康和幸福”,因为嗅觉数字化对帮助医疗人员检测、治疗疾病至关重要。比如,医生可以用气味来触发患者记忆或减轻焦虑。
此外,它还有可能在 VR 游戏、电影中发挥作用,增加 VR 设备的沉浸感。
或者,你还可以用这项技术来留住亲人的气味,但“按月付费”就有点讽刺了。
当然,这些都是长期愿景。在近期,Wiltschko 希望 Osmo 能制造出更安全、更可持续的香味分子,用于香水、洗发水、驱虫剂和洗衣粉等日常用品中的香料。
用数千个香气分子训练 AI 模型
Osmo 的官网上简单列出了他们的研发历史:
0. 在 Osmo 建立之前,Alex Wiltschko 在谷歌研究院领导着这个团队,他们使用先进的机器学习技术构建了 Osmo 气味映射图的基础。
1. 取得了一项重大突破,可使用图神经网络根据分子结构预测其气味。
2. 创造了以前从未闻过的新分子并以超越人类的准确度进行了预测。
3. 设计出了蚊子觉得难闻的气味分子(例如驱虫剂),并且在人体试验中比避蚊胺(DEET)更有效。
而要更具体地了解 Osmo 的研发历程,我们还要从 Wiltschko 的早期经历说起。
Wiltschko 2009 年在密歇根大学获得了神经科学学士学位,并在哈佛大学学习嗅觉神经科学,于 2016 年获得博士学位。
第二年,他成为谷歌研究院的一名研究科学家,在那里,他花了五年时间领导一个团队,利用机器学习帮助计算机根据分子结构预测不同分子的气味,并使用机器学习软件开发了 “主要气味映射图(principal odor map/POM)”。
这项研究发表在 2023 年 9 月的《科学》杂志上。据介绍,POM 坐标可以用于预测气味强度和感知相似性,即使这些感知特征并非模型训练的显式组成部分。这些结果已被用于构建多种嗅觉预测模型 —— 即使没有微调,其表现也优于以前的特征集。
为了构建这个气味地图,他的团队在一个包含 5000 个芳香分子的数据集上训练他们的 AI 模型,这些芳香分子涵盖了各种气味类别,如花香、果香或薄荷味。
Wiltschko 发现,由于分子结构复杂,计算机在分析分子时可能会比较棘手 —— 只要移动一个分子键,分子的气味就可能从玫瑰变成臭鸡蛋。
但得益于人工智能技术的进步,该模型能够捕捉到分子不同结构中的模式,并利用这些知识准确预测其他分子的气味。
值得一提的是,用来训练模型的数据集确实来之不易。
Wiltschko 说,大型语言模型可以通过“整个互联网”的数据进行训练,但当他们开始构建人工智能模型时,还没有类似的气味信息数字图书馆。
所以,他们花了大约一年的时间与香水行业的公司合作。起初,他们以为这些公司会有很棒的数据集,但事实并非如此。
这促使 Wiltschko 和他的团队创建了“一种新的数据”。
为此,他们收集了数千种分子以及调香大师对其气味的描述。然后,他们将这些数据输入图神经网络(GNN),该网络属于机器学习的范畴,使用强大的算法来检测和分析数据点之间的关系。
Wiltschko 说,他的团队可以使用 GNN 来帮助 AI 模型理解原子、连接它们的键以及分子结构如何决定其气味。
气味数字化大有用途
气味数字化可以开拓出前所未有的应用场景,最基础的就是气味的远程传输。Wiltschko 表示,Osmo 希望最终能够利用自己的技术,将一个地方的气味数字化,然后在另一个地方再造一个完全相同的副本,从而实现气味的远程传送。
事实上,该公司最新更新的博客表示,他们已经成功了。
具体来说,选择一种要传输的气味,并将其放入一台 GCMS(气相色谱 - 质谱)机。如果该气味的来源是液体,就直接注入;如果是固体样品(比如李子),就使用顶空分析,也就是将气味困在物体周围的空气中,并通过管子吸收。
GCMS 会识别原始数据(可以视为分子),并将其上传到云。在那里,它会成为主要气味映射图上的坐标 —— 这是一种新颖、先进的人工智能驱动工具,可以预测特定分子组合的气味。
然后,这个配方会被发送到一台配方机器人,它会基于该配方来混合不同的气味,从而复现样品的气味。
在另一项成果展示中,Osmo 表示他们使用 AI 发现了前所未“嗅”的配方,并且他们一口气向欧美市场发布了三种前有未有的香水气味分子。他们将之分别命名为 Glossine、Fractaline、Quasarine。他们还为这三种香水气味编写了美妙的描述。举个例子,对于 Glossine,他们写到:“一种充满活力的花香,让人联想到茉莉花,后调和中调散发出耀眼的亮泽。这种迷人的分子可为之前的任何香水增添耀眼的拉斯维加斯式光彩。”
此外,Osmo 也在研究多模态 AI,具体来说,他们研究的是基于图像生成对应的气味,当然图像又可以进一步基于文本而生成。下面演示了一个案例:
可以看到,用户只需输入文本提示词,AI 就会帮助你生成图像(用户也可直接上传图像),然后再进一步为你生成分子配方。 当然,如果你还想亲身闻到这些气味,还需要相应的设备。
事实上,他们已经在线发布了这款工具 Inspire,目前支持文本和图像输入,但他们也表示未来还会支持音乐、PDF、幻灯片和视频输入。感兴趣的读者可以注册尝试一下:https://inspire.osmo.ai/landing
这项技术背后彰显着无限的可能性。举个最明显的例子,也许未来我们还能观看带有气味的电影,实现视觉、听觉和嗅觉的全方位体验 —— 这或许能给那些风景如花的电影变得更加好看以及好闻。
最后,Wiltschko 表示 Osmo 还有一项长期目标,即利用这项技术帮助更早地识别疾病。也许未来,我们在体检时会有一个 AI 通过它的机器鼻子来判断我们的健康状况。