本文作者为于恩、卢杰、王坤、杨晓宇、张广泉。所有作者均来自悉尼科技大学 (UTS) 的澳大利亚人工智能研究所 (AAII)。在智慧城市、社交媒体和工业物联网等开放、动态的现实环境中,数据通常以多个流的形式同时生成。然而,现实世界并不是一个完美的实验室,这些数据流通常是异构的,具有不同的分布和复杂的异步概念漂移。该模型如何不仅“专注”单个流的特征,而且“学习其他流的优点”并适应分布的变化,同时利用流之间的相关性?悉尼科技大学(UTS)的一个研究团队在专家学习框架 CAMEL(协作专家学习的协助组合)。 CAMEL 将混合专家模型 (MoE) 智能地引入流学习中。通过“私有专家”和“辅助专家”的协作机制以及自动化的专家生命周期管理,彻底解决了多流异构学习的关键问题。该研究在 AAAI 2026 上被接受为口头论文。 论文标题:Drift-Aware Collaborative Assistance Expert Blend for Heterogeneous Multi-Stream Learning 论文链接:https://arxiv.org/abs/2508.0159801 引言 在现实应用场景中,数据通常以连续且无限的数据流的形式生成,生成机制往往表现出显着的非平稳性,即概率。联合的。随着时间的推移,数据的分布会经历不可预测的概念漂移。这一属性从根本上违背了经典机器学习所基于的独立同方差 (I.I.D.) 的假设。然而,现有研究大多集中于单一或同质数据流的漂移建模,很难解决现实世界中普遍存在的多源异构数据流的情况。在智慧城市中,交通传感器、天气观测、公共交通记录和社交网络等信息流在时间尺度和演化模型上彼此独立,但隐藏着重要的动态相关性。如果在概念漂移过程中能够有效地提取和利用这些流之间的关系,则可以大大提高决策的准确性和鲁棒性。现有的两种方法常常陷入困境。也就是说,它假设所有流都是同构的并强制统一处理,从而导致模型不匹配。或者使用静态模型。当流发生变化时,重新训练可能会导致“灾难性遗忘”,而增量调整可能会因异步进化而导致“负转移”流之间。为了实现这一目标,作者正式定义了异构多流学习 (HML) 问题并提出了 CAM。马可·EL。它是一个混合的、动态的、支持协作的专家学习框架,通过模块化设计平衡专业化、协作和适应。图 1:CAMEL 总体框架。每个流的 MoE 模块都利用一群充满活力的私人专家和专门的联合专家来实现多方向关注的协作融合。该系统遵循循环器“测试、诊断、适应”,并通过自主专家调节器响应漂移信号动态管理专家生命周期。 02 方法论和架构设计 研究团队设计了一种支持漂移的模块化架构,以解决 HML 场景中的三个主要挑战:固有异构性、多流知识融合和异步概念漂移。挑战一:固有的异质性 CAMEL构成“独立系统”挑战二:多流知识融合 多流数据的核心价值在于流之间可能存在的相关性,但盲目合并所有流的信息会导致负迁移。挑战三:异步概念的漂移 针对数据分布的非平稳性,CAMEL 设计了独立的专家调优器实体,遵循“测试、诊断、适应”的闭环逻辑,实现专家粒度模型能力的在线扩展。漂移检测:使用基于平均最大差(MMD)的漂移检测器监控特征分布的变化。增量扩展(添加冻结):当检测到导致性能显着下降的漂移时,会实例化新的私人专家以学习新概念,并冻结旧的专家以防止灾难性遗忘。 03 理论分析和实验验证实验验证:验证有效。基于CAMEL的本质,研究团队构建了8个参考场景,包括12个合成流和4个真实数据集(涵盖天气、新闻、信用卡信息等)。表 1 中的结果表明,CAMEL 在几乎所有场景中都达到了最先进的精度平均值,并且显着优于单流基线(SRP、AMF、IWE)和多流技术(MCMO、OBAL、BFSRL)。 CAMEL 的优势在异构环境中尤其明显,在异构环境中,现有的多流方法由于依赖共享特征或标签空间而失败。相比之下,CAMEL 的流特定模块即使在输入异构的情况下也能实现稳健的性能。该框架通过协调支持机制有效地利用流之间的潜在相关性,超越了单流方法。表 1:所有基准中每种方法的分类准确度 (%)。红色代表最佳,蓝色代表次优。 04 结论 CAMEL提案代表了多流学习从“静态同构”到“动态异构”的重要一步。该框架使用民间专家来确保流内的专业化,协助专家挖掘流之间的相关性,并支持自动化专家许可。它通过生命周期管理实现漂移下的持续适应和效率控制,为异构、复杂和动态演变的多流场景提供可扩展的解决方案。
特别提示:以上内容(如有,包括图片、视频)来自自媒体平台“网易号”。 “这个平台由用户上传发布,仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。

推荐文章

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注