产业观点|伏云发教授:警惕脑机接口“三乱象”!定义被模糊、范畴被泛化、能力被夸大

栏目:行业新闻发布:2026-02-02浏览:5
内容来源:伏云发,程天骄,罗荣章,赵磊,李天文,苏磊,徐家萍.脑机接口(BCI) 的科学定义——必要组件、基本特征、能力边界与范畴界定[J/OL].生物医学 工程学杂志. https://link.cnki.net/urlid/51.1258.R.20260130.1705.036
脑机接口(BCI)是一种将用户及其大脑共同纳入环路的通信与控制系统,是具有变革意义的新型人机交互技术,也是人机交互领域的重要分支,展现出重要的科学研究价值和应用潜力 。BCI 的核心目标在于绕过或补充外周神经或肌肉输出通路,实现基于脑信号的直接信息交互,其本质是以中枢神经信号为信息载体的人机交互闭环系统 。
随着 BCI 技术的不断发展,研究者们在多个范式中进行并行探索,以应对不同的应用场景和需求 。一方面,传统的以脑信号解码为核心的 BCI 范式,如基于稳态视觉诱发电位(SSVEP)、运动想象(MI)、P300 的 BCI 在脑信号采集、算法稳健性和系统可用性方面持续改进,并在医疗与康复及辅助技术场景中逐步实现有限落地 。
另一方面,部分新兴或扩展型 BCI 范式近年来受到关注,但其能力边界亦需加以澄清 。言语 BCI 主要在受限条件下解码与言语产生相关的神经活动,以实现有限的词汇或短语级输出,尚不具备通用“意念言语生成”的技术基础 。脑-脊髓接口(BSI)将 BCI 与功能电刺激、康复神经调控等技术相结合,探索受损神经通路的功能重建。尽管在动物实验及个别临床研究中显示出一定的潜力,但这一技术仍可视为 BCI 驱动的高度特定的神经调控系统 。
手写想象脑机接口通过解码与书写相关的运动神经表征,实现字符级别的信息输出,其传输速率依赖于高度特定的任务要求和个体差异 。与此同时,情感/情绪脑机接口主要依赖脑信号与主观的情绪体验指标之间的统计关联进行推断 。然而,当前技术仍未能实现对个体内在情感状态的精确或可解释的识别 。同时,关于是否将情感 BCI 归类为 BCI 还存在争议,因为它在功能上通常不涉及交流或控制任务,而更多集中在情绪识别和反馈方面 。尽管新兴的 BCI 范式在原理和实验研究中展现了潜力,但它们仍处于探索阶段,许多技术的边界和功能尚不明确,特别是在情感/情绪 BCI 等领域 。
与此同时,BCI 与人工智能等前沿技术的融合日益加深 。机器学习,尤其是深度学习方法,已成为脑信号特征提取、模式识别和自适应建模的重要工具,在一定程度上提升了 BCI 系统的解码性能与跨个体跨场景泛化能力,如注意力机制与 Transformer 架构的引入正推动 BCI 模型向更复杂任务扩展 。此外,将大规模语言模型与 BCI 控制逻辑结合的初步探索已表明,结合智能交互框架可显著提升人机交互体验与语义层次控制能力 。然而,这种融合并未改变 BCI 的基本物理与生理约束条件:脑信号的低信噪比、非平稳性、个体差异性以及侵入性采集的安全与伦理问题,这些约束仍然是限制其能力边界的根本因素 。人工智能在 BCI 中的作用更多体现在辅助解码和系统优化,而非突破性地扩展人类认知或实现脱离生物基础的智能增强 。
虽然 BCI 取得了显著进展,但其概念与范畴依然模糊,且在学术界与产业界的界定存在偏差 。BCI 研究已有 50 余年,理应具备科学的定义和明确的范畴 。尽管 Wolpaw 等已给出了定义,并在专业 BCI 研究界形成共识,但随着近十余年神经技术与信息技术等的发展,以及资本力量的涌入,BCI 的概念边界在学术圈内外被不断扩展甚至扭曲 。
部分非专业从业者与研究者出于名利诉求炒作 BCI,导致其术语失范、认知偏差和误导性传播,甚至引发产业泡沫 。在当前及可预见的未来,BCI 仍面临着定义被模糊化、范畴被泛化、能力被夸大的问题 。因此,有必要给出 BCI 严谨的科学定义,并从系统构成与功能本质出发,明确其必要组件、基本特征与能力边界,并据此区分真正意义上的 BCI 技术与相邻技术 。这不仅有助于纠正学术界与公众对 BCI 的认知偏差,也将为其长期基础研究、规范产业转化以及可持续发展提供重要的理论依据 。
 
1. BCI 的科学定义
BCI 是否应该有科学的定义?目前有没有科学的定义?Wolpaw 等的经典定义指出:BCI 是一种记录中枢神经系统(CNS)活动并将其转换为人工输出的系统,可用于替代、恢复、增强、补充或改善中枢神经系统的自然输出,从而改变其与身体其他部位或外部世界的交互方式 。在此基础上,笔者团队进一步提出了更为清晰的 BCI 定义 。
综合上述工作,本文给出的 BCI 科学定义如下:BCI 是一类以用户及其大脑为核心,不依赖外周神经或肌肉活动,通过采集脑信号并在特定范式下进行神经编码,经实时意图解码后将其映射为通信信息或对外设的控制指令,并结合感觉反馈或神经反馈构成闭环的人机交互系统。
一个用户可接受、具有实用价值的 BCI 系统或产品应具备良好的安全性、稳定性、准确性和响应速度,以确保其可用性与可靠性,并带来良好的用户体验和满意度 。只有在使用户真正受益、确保利大于弊的前提下,BCI 产品才能具备实际应用价值 。
 
2. BCI 的必要组件
BCI 的必要组件有哪些?根据 Wolpaw 等对 BCI 的经典定义,以及笔者团队对 BCI 的清晰定义,BCI 的七个必要组件如下 :
用户及其大脑:用户不仅提供中枢神经信号,还影响系统设计,包括范式、传感器布局、反馈方式及训练流程 。
BCI 范式与神经编码模块:BCI 范式通过心理任务或外部刺激将用户意图“写入”脑信号中,神经编码模块将这些意图由脑信号特征编码,并通过解码算法识别用户的意图,为 BCI 的有效运行提供基础 。
脑信号采集模块:通过植入式或非植入式方式获取大脑电、磁等神经信号。该模块需提供高时空分辨率、高信噪比和良好抗伪迹性能,同时应注重安全性和舒适性等 。
在线实时意图解码模块:负责脑信号的预处理、特征提取和机器学习(包括深度学习)算法的应用,以确保系统在实时性和准确性上的表现。BCI 算法性能的金标准是在线系统中的实际表现与可用性 。
输出映射与外设控制模块:将解码后的用户意图转换为控制外设的信号,并结合共享控制等融合用户意图与机器策略的人机协作方法 。
通信与控制外设:包括物理设备(如外骨骼、轮椅等)和非物理外设(如光标、拼写器等),这些外设通常具有一定的自主性和智能性 。
感觉反馈结合神经反馈模块:通过视觉、听觉或触觉反馈等,形成闭环调节,帮助用户优化脑信号特征、提高分类精度和控制效果。神经反馈虽非必需,但强烈建议用于训练与加速学习,帮助用户主动调节自身脑信号并提升操控能力 。
 
3. BCI 的基本特征
BCI 的基本特征是什么?根据定义,BCI 具有七个基本特征。这些特征同样构成判定某一系统是否属于 BCI 的关键判据 :
独立于外周神经或肌肉:指 BCI 解码用户意图时不依赖外周活动,而直接以脑信号作为控制依据 。BCI 通过解读大脑活动获取意图,驱动外部设备,或者将解码结果用于触发刺激系统,作用于受损的脊髓、神经或肌肉以诱发运动并促进恢复 。
基于脑信号的交互:所依赖的脑信号既包括反映大脑活动的电磁信号,也包括体现脑组织代谢状况的血液动力学信号。它们能够表征中枢神经系统的活动状态,涵盖用户的感觉、知觉、表象、运动及认知等多方面,因此构成 BCI 系统的核心输入来源 。BCI 必须以脑信号作为主要且不可替代的决策与控制依据,使其在解码链路中处于主导地位 。无论是混合 BCI(Hybrid BCI)还是其他形式,脑信号始终必须作为主导的控制信号源 。
与外设的交流与控制能力:指 BCI 系统必须能够使用户通过脑信号与外部设备(外设)进行有效的交流或控制 。若系统仅对脑信号进行采集与分析,而未构建用户与外设之间的交互路径,则应归类为诊断性神经影像/神经功能监测装置,而非 BCI 。
用户主动意图驱动:表明真正的 BCI 应基于用户的主动意图,即通过大脑主动产生控制指令,实现对外设的自主交互,而非仅呈现被动反应或无意识状态 。被动状态监测(如疲劳、注意力或癫痫监测等)虽使用脑信号,但主要用于评估或诊断,不属于 BCI 。
实时解码用户意图:表明为了实现高效的交互,BCI 必须具备实时解码用户意图的能力,具体的实时性要求根据不同应用场景而有所差异 。例如,拼写器对延迟容忍度较高,而运动控制类应用则需更低的延迟以确保快速响应 。
闭环反馈调节:是 BCI 系统的核心机制,其中至少需向用户提供可感知的动作或结果反馈,以支持意图对齐与策略学习 。神经反馈虽非必需,但可显著提升控制性能与学习效率 。
用户处于交互核心:BCI 并非仅是对脑信号的被动采集与分析系统,而是一种以用户为交互与调节主体的闭环人机系统 。用户不仅通过其脑活动向系统提供控制意图,还通过行为调整、认知策略改变与学习过程持续参与系统运行与性能提升。因此,BCI 的通信与控制环路中所纳入的并非孤立的大脑信号源,而是具备主动适应能力的用户本体。基于这一特征,BCI 的系统设计、验证与评估必须坚持以用户为中心的原则 。
 
4. BCI 的能力边界
BCI 是否存在能力边界?若存在,又有哪些因素限制了 BCI 的能力,其边界究竟在哪里?答案是肯定的。BCI 性能存在客观边界 。例如,即使采用皮层植入电极获取高空间分辨率、高信噪比的 Spikes 信号,使非人灵长类或人类操控外设,也需一定训练以形成稳定可解码的神经模式,识别性能无法达到百分之百;头皮脑电(EEG)信号空间分辨率低、易受伪迹干扰,解码简单运动意图同样需长时间训练,且精度有限,难以区分复杂意图 。
BCI 能力受限的主要原因包括:①人类对中枢神经系统编码规律认知有限(可编码性);②现有脑信号采集技术水平受限;③脑信号解码能力有限(可解码性)。这些原因共同决定了 BCI 在准确性、可靠性和复杂意图解码上的边界 。
BCI 能力受限的具体因素如下 :
BCI 可用于替代、恢复、增强、补充或改善中枢神经系统的自然输出,涵盖五类功效。迄今为止,研究较多的三类经典 BCI 范式(运动想象、SSVEP 和 P300)在这些功效中的表现并不相同。运动想象 BCI 在功能恢复、增强和改善方面更具优势,而 P300/SSVEP-BCI 则在功能替代和补充方面表现更为突出 。
新兴范式如言语 BCI、脑脊髓接口、手写想象 BCI 以及情感/情绪 BCI 等仍处于探索性的基础研究阶段,与实际应用尚有较大距离,其能力仍受到诸多限制 。
综上所述,BCI 的能力存在边界,将其宣传为能够“读脑/读心”、“写脑”或“控脑”不仅不准确,甚至是错误的认知,也属于具有误导性的表述 。
 
5. BCI 的明确范畴
BCI 是否应当有明确的范畴?如果是,其明确的范畴又应如何界定?尽管笔者团队曾在中国人工智能产业发展联盟白皮书中提出了狭义 BCI 与广义 BCI 的概念,但随着 BCI 研究和产业化的加速推进,BCI 范畴被严重泛化的现象逐渐凸显 。
泛化 BCI 范畴的观点(错误观点) vs 科学认知 BCI 范畴(正确观点) :
错误: 凡是与大脑相关的技术都可以归为 BCI 技术。正确: 并非所有与大脑相关的技术都是 BCI 技术。
错误: 所有脑成像设备及相关研究都属于 BCI 技术。正确: 脑成像设备仅采集信号,不用于交互或控制,不构成 BCI。
确认删除?
VIP会员服务
限时9折优惠