旗下微信矩阵:

红杉分享:一文读懂神经AI

在这篇文章中,你将会了解什么是神经AI,它将如何进化并开始影响我们的生活、如何支撑其他创新与技术的发展,以及我们还需要做些什么来推动它更好发展。
2022-09-14 08:46 · 微信公众号:红杉汇  作者:Patrick Mineault 编译:洪杉   
   

在科学家研究AI的时候,一般会试图模仿大脑的运作来制造智能机器。在这个过程中,他们发现可以借助AI的力量来反向研究大脑的结构。这一新兴的AI技术被称为“神经AI(neuroAI)”。

试想一下,十年后,我们能够通过下载的方式来让大脑调用不同的AI模型,从而直接完成物体识别或者像AI一样便捷地处理自然语言,就好像租用了一个更高效的大脑。实现这一切,只需要科学家们能够利用AI打造出更精细的硅基大脑模型。到那时,作为人类的我们,看东西、感知世界的方式将变得与众不同。

另外,神经AI还能够在工业、艺术创意、健康改善等领域大放异彩。比如,神经AI通过生成正确的图像和声音,将帮助刚做完准分子激光手术或人工耳蜗植入手术的人更快恢复视力或听力,甚至帮助医疗卫生领域实现新的突破。这些创新还将有益于其他新技术的发展,如增强现实(AR)与脑机接口(BCI)将会因此变得更加强大。

在这篇文章中,你将会了解什么是神经AI,它将如何进化并开始影响我们的生活、如何支撑其他创新与技术的发展,以及我们还需要做些什么来推动它更好发展。

每期监测和精编中文视野之外的全球高价值情报,为你提供先人一步洞察机会的新鲜资讯,为你提供升级思维方式的深度内容,是为[ 红杉汇内参 ]

什么是神经AI?

神经AI是一门新兴学科,旨在:1)通过研究人的大脑来促进AI技术发展;2)利用AI来更好地研究人的大脑。神经AI的核心工具之一是使用人工神经网络来创建特定大脑功能的计算机模型。这种方法始于2014年,当时麻省理工学院和哥伦比亚大学的研究人员发现,深度人工神经网络可以解释大脑的物体识别区域——颞下皮层(IT)的反应过程。于是他们引入了一个基本的实验方法:将人工神经网络与大脑进行比较。然后反复迭代测试各种大脑反应过程:形状识别、运动处理、语音处理、手臂控制、空间记忆等,并相应建立各个反应对应的大脑处理模型。

1. 训练硅基人工神经网络来解决如物体识别之类任务。由此产生的网络被称为任务向神经网络。重点是,它通常只需要图像、影片和声音来训练模型,而不需要大脑数据。

2. 使用如线性回归或表征相似性分析之类的统计分析法,来比较训练后的人工神经网络的中间激活值与真实的大脑数值。

3.选择表现*的模型作为当前大脑区域的*模型。

该方法中的真实大脑数据,可通过单个神经元获得,或以非侵入性技术如脑磁图(MEG)或功能性磁共振成像(fMRI)来收集大脑内部数据。

大脑部分区域的神经AI模型有两个关键特征。首先它是可计算的——给这个计算机模型提供刺激变量,它将能算出相应的大脑区域会如何反应。其次它也是可微分的——它是一个深度神经网,我们可以运用和研究视觉识别与自然语言处理模型相同的方式进行优化。也就是说,神经科学家可以借助所有推动深度学习革命的强大工具来更好做研究,包括PyTorch和TensorFlow等张量代数系统。

这意味着,我们将实现巨大的技术跨越——从不了解大脑的大部分运作机理,到能做出可下载的部分区域的模型。

神经AI的应用领域

艺术和广告

我们感知各种媒体,99%是通过眼睛和耳朵。眼睛和耳朵本身并不负责解释体验,它们只是传感器:是我们的大脑在处理和理解这些信息。面对不同的传媒内容,我们大脑会根据我们的所见所闻解析出不同的思考与情感,但是被解析出的结果,不一定是创作者想要传达的、被受众接受的。

所以,如果想要确定一个作品中预留的信息是否如预期那样被受众接收,就需要不断地测试。一些互联网公司中,比较流行的解决办法是使用“A/B测试”。比如,谷歌曾测试过50种不同深浅的蓝色用在显示搜索结果的超链接上,最终他们找到的*解使谷歌的收入比基线提高了2亿美元,约占当时谷歌收入的1%;Netflix会为用户调整影片缩略图以优化用户体验。

但是,如果我们能在不经过大流量测试,未获得任何测试数据之前就能预测人们对某一媒体的反应呢?那样,企业就能在未获得太多关注之前更好地优化其书面材料和网站。神经AI在预测人们对视觉材料的反应方面已经做得越来越好。例如,Adobe的研究人员就正在研究相关的视觉设计工具,帮助设计人员更好地预测和引导人们的注意力。例如,通过编辑照片,使其在视觉上更令人难忘或更具美感。

另外,人工神经网络甚至可以找到比现实图像更有效地传达信息的方法。OpenAI的CLIP工具便可以帮助你找到与想要传达的情感相一致的图像;再比如OpenAI和谷歌,可以根据文字提示生成逼真的图像。

目前在优化视听媒体、网站,尤其是广告方面存在巨大的市场需求,而我们其实早就已经开始将神经AI和算法艺术引入这一过程了。巨大的市场需求会催生良性的发展循环,随着越来越多的资源被投入到实际应用中,神经AI也将变得更好、更有用。作为副产品,因为获得了更好的大脑模型,广告以外的其他领域也将能一起受益。

可及性与算法设计

神经AI最令人兴奋的应用之一是提高产品的可及性。

大多数媒体其实是为“一般普通人”设计的,然而每个人处理视听信息的方式却各不相同。比如有色盲困扰的人群和一般人群的信息处理方式是不同的,因此大量的媒体并不适合他们。虽然如今有不少产品可以模拟色盲效果,但需要一个色觉正常的人先为产品做解释,然后才能去做相应的调整改变。直接做静态的颜色重映射无法满足他们需求,是因为有些材料在颜色重映射后语义会发生变化(例如,图表会变得难以读懂)。但有了神经AI之后,我们就可以在保持现有图形语义的情况下,自动生成适合色盲阅读的材料和网站。

另一个例子是,帮助有学习障碍的人,如阅读障碍人群。阅读障碍的一个深层原因是对拥挤十分敏感,因此难以识别具有相似基本特征的形状。而麻省理工学院正在研究一种阅读障碍者的视觉系统神经AI模型,可以帮助设计既美观又能让他们顺利阅读的字体。这些都是潜在的、亟待实现的生活质量的巨大改善。

健康

许多神经科学家在进入这一领域时,都希望自己的研究能对人类健康产生积极影响,特别是对患有神经系统疾病或精神健康问题的人。利用神经AI模型,有机会开启新的疗法——获得优良的大脑模型后,便可以精心设计正确的刺激,来传递相应的信息,就像钥匙和锁的匹配一样。从这个意义上说,神经AI的应用类似于算法药物设计,但我们在人体内释放的不是药物小分子,而是图像和声音。 

眼睛和耳朵的感受器方面的问题是最有可能先被解决的,因为这些感受器目前已经有了很好的建模。比如人工耳蜗植入手术可以在神经AI大脑模型的帮助下,优化植入物的刺激模式,放大语音来优化助听效果。

许多人在一生中都会经历感官系统的变化,比如近视。在变化之后,人会通过不断学习来让大脑重新适应这个世界,更好地理解新的知觉信息,这种现象称为知觉学习。神经AI能够放大这种知觉学习,让人们能更快更有效地恢复感知技能。类似的,还有通过神经AI技术帮助那些在中风后失去流畅移动四肢能力的人;优化健康人类的感官体验——比如辅助棒球运动员、弓箭手或病理学家的训练等。

最后,我们发现这些技术在情绪障碍的治疗方面也能大有所为。我们可以通过感官体验来治疗情绪障碍。比如我们知道,用电刺激控制大脑特定部位的活动可以缓解“顽固型抑郁症”(treatment-resistant depression),有了神经AI后,或许通过感官间接控制大脑的活动也可以获得类似的效果。

增强现实

一个将使神经AI应用变得更加强大的技术是AR眼镜。因为可以*融入到我们的日常生活中,AR技术具备着成为无处不在的计算平台的潜力。众多科技巨头、互联网巨头都在加快步伐研究更高阶的AR眼睛,所以在供应方面就已经有巨大的推动力在助推其发展。而这将使人们广泛使用上一种比今天的静态屏幕强大得多的显示设备。

如果参照VR设备的发展轨迹,它最终还会将眼球追踪功能集成进来。也就是说,我们可以远远超越目前可能的技术手段,以更可控的方式实现更广泛的视觉刺激。另外这些设备在健康领域也将具有非常深远的应用前景。

脑机接口(BCI)

有了出色的显示器(图像)和扬声器(声音),我们可以精确控制大脑的主要输入信号。而通过感官传递刺激的下一个更强大的阶段,是通过只读的脑机接口(BCI)验证大脑是否以预期的方式做出反应。如此一来,我们便可以评估刺激对大脑的影响,如果不符合预期,还可以在所谓的闭环控制中做相应的调整。 

我们并不需要在颅内植入芯片或者深层脑刺激器,因为这样简单的评估,在颅外以非侵入性的方式测量大脑活动已经足够了。我们也不需要通过BCI直接刺激大脑,眼镜和耳机就能控制大脑的大部分输入。目前,有许多非侵入性只读BCI已经商业化或正在筹备中,可用于闭环控制。一些例子包括:

•脑电图(EEG)。脑电图测量的是颅骨外的大脑电活动。由于头骨相当于一个容积导体,因此脑电图的时间分辨率很高,但空间分辨率很低。当我们获得了刺激的控制权,脑电图便能发挥更强大的作用——比如可以将刺激与脑电图信号关联起来,然后解码什么刺激能吸引注意力(诱发电位法)。

•功能性磁共振成像(fMRI)。fMRI测量的是与神经活动相关的血氧含量的微小变化,它是*能够以空间上精确的方式非侵入性地读取大脑深处活动的技术。对于闭环神经控制方面来说,有两种范式相对成熟。*种是基于fMRI的生物反馈;第二种是皮质图谱。这两种方法都表明,想要评估神经AI对大脑的刺激效果完全是有可能的。

•近红外脑功能成像(fNIRS)。fNIRS通过漫射光来测量发射器与接收器之间的脑血容量。传统的近红外成像的空间分辨率较低,但通过时间门控(TD-NIRS)和大规模超采样(漫反射光学断层成像),空间分辨率会有一定提升。在学术方面,WUSTL的Joe Culver小组已经实现了对视觉皮层的影片解码。而在商业方面,Kernel现在正在制造和销售TD-NIRS头盔,这是十分惊人的工程壮举。这是一个人们不断推动的领域,而且进展迅速。

•脑磁图(MEG)。脑磁图通过测量磁场的微小变化来定位大脑活动。MEG与EEG类似,它测量电磁场的变化,但它可以不受容积导体的影响,因此具有更好的空间分辨率。人们在光泵磁强计(optically pumped magnetometers,OPM)方面也正不断取得进展,将来我们将有可能在公开市场上购买单个OPM传感器。

除了这些比较知名的技术外,一些黑马技术,如数字全息技术(digital holography)、光声断层扫描技术(photo-acoustic tomography)和功能性超声技术(functional ultrasound),则可能会极大加速这一领域的范式转变。

虽然消费级的非侵入式BCI仍处于起步阶段,但围绕着AR用例的旺盛需求将不断推动市场将蛋糕做大。我们可能会看到低维BCI的迅速发展,上面提及的各种神经AI应用就很有可能成为真正的现实。

【本文由投资界合作伙伴微信公众号:红杉汇授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。