EN
www.4000871428.net

成色18k.8.35mb菠萝UofT、UBC、MIT和复旦发布:扩散模型驱动的异常检测与生成综述

扩散模型(Diffusion Models, DMs)近年来展现出巨大的潜力,在计算机视觉和自然语言处理等诸多任务中取得了显著进展,而异常检测(Anomaly Detection, AD)作为人工智能领域的关键研究任务,在工业制造、金融风控、医疗诊断等众多实际场景中发挥着重要作用。近期,来自多伦多大学、不列颠哥伦比亚大学、麻省理工学院、悉尼大学、卡迪夫大学和复旦大学等知名机构的研究者合作完成题为 “Anomaly Detection and Generation with Diffusion Models: A Survey” 的长文综述,首次聚焦于 DMs 在异常检测与生成领域的应用。该综述系统性地梳理了图像、视频、时间序列、表格和多模态异常检测任务的最新进展并从扩散模型视角提供了全面的分类体系,结合生成式 AI 的研究动向展望了未来趋势和发展机遇,有望引导该领域的研究者和从业者。 扩散模型通过正向扩散与反向去噪的马尔可夫过程实现数据分布建模。正向过程遵循随机微分方程,逐步将数据分布转化为高斯噪声;反向过程通过神经网络学习去噪映射,渐进式恢复原始数据。其生成机制在捕捉复杂数据分布的细微差异上具有显著优势。与传统的广泛用于无监督 AD 任务的 GANs、VAE 和 Transformer 等相比,DMs 在生成样本的质量和多样性方面表现出色,在 AD 领域展示出出色潜力。 基于 DMs 的异常检测通过建模数据分布的内在结构,将异常定义为与正常数据模式的显著偏离。根据异常评分机制不同,可分为三大核心范式,如图 3 所示。 基于重构评分的方法通过扩散模型反向去噪过程重构输入样本,以重构误差作为异常分数。正常样本因符合学习到的分布,重构误差小;异常样本偏离分布,重构误差显著增大。典型应用如工业质检中,利用 U-Net 架构的扩散模型通过像素级重构误差定位异常。 基于密度的评分方法利用扩散模型对数据概率密度的估计能力,将负对数似然作为异常分数。正常样本对应高概率密度,负对数似然值低;异常样本位于低概率区域,分数超过阈值即判定为异常。 基于分数的评分方法利用数据分布的梯度信息(分数函数)量化样本与数据流形的偏离程度。正常样本位于流形表面,梯度范数小;异常样本处于低概率区域,梯度范数显著增大。 三种方法从不同维度刻画异常:重构评分基于样本空间距离,密度评分基于概率分布似然,分数评分基于流形几何梯度。实际应用中,重构方法对图像局部异常更敏感,密度方法适合时序数据全局检测,分数方法在高维非结构化数据中表现更优。 在图像异常检测(Image Anomaly Detection, IAD)领域,DMs 面临两大核心挑战:“恒等快捷方式”(Identity Shortcut)问题与高昂的计算成本。前者指模型在重构时倾向于直接复制输入中的异常区域,从而掩盖了异常;后者则源于扩散过程固有的多步迭代推理,限制了其实时应用。为应对这些挑战,综述中探讨了一系列前沿方法。例如,通过掩码重构、潜空间特征编辑或对抗性训练来打破 “恒等快捷方式”,迫使模型学习正常数据的深层分布而非简单复制。同时,为解决计算效率问题,研究者们提出了模型蒸馏、高效 ODE 求解器、潜空间扩散(Latent Diffusion Models, LDMs)以及模型稀疏化等多种加速策略。这些方法通过减少采样步数或在更低维的空间中操作,显著降低了推理时间和资源消耗,为扩散模型在工业质检、医疗影像分析等高要求的 IAD 场景中的实际部署铺平了道路。 图 4:图像异常检测方法示意图。(a)展示了基础的基于重构的方法;(b)展示了为解决 “恒等快捷方式” 问题而设计的条件式或多阶段变体方法,旨在提升对异常的敏感度。 视频异常检测(Video Anomaly Detection, VAD)的核心在于处理时序维度和复杂的运动模式,这使其比静态图像检测更具挑战性。异常可能表现为反常的动作序列或与既定模式不符的动态变化。因此,有效的 VAD 框架必须能够对时空依赖性进行建模。综述指出,先进的扩散模型通过引入光流、运动矢量或集成时空 Transformer 架构,将运动信息显式地融入到生成过程中。这种设计使模型能够学习正常事件的时空演化规律,从而敏锐地捕捉到速度、方向或加速度上的异常变化。例如,模型通过对过去帧或运动表征进行条件化,预测未来的正常帧,并将预测结果与实际观测进行比较。这种基于运动和时序上下文的建模方式,极大地提升了模型在监控、自动驾驶等动态场景中检测复杂异常事件的准确性和鲁棒性。 图 5:视频异常检测框架示意图。该框架集成了时空特征提取与运动建模,通过光流或 Transformer 等技术将运动信息融入扩散模型,以有效识别空间外观和时间演变中的异常。 时间序列异常检测(Time Series Anomaly Detection, TSAD)面临的挑战源于数据的内在时序依赖性、不规则采样和潜在的长期关联。综述归纳了扩散模型在该领域的两大主流范式:基于重构(reconstruction-based)与基于插补(imputation-based)。基于重构的方法利用扩散模型强大的生成能力来复原输入的时间序列,那些无法被精确重构、导致较大误差的数据点或片段被视为异常。而基于插补的方法则巧妙地将异常检测任务转化为一个缺失值填补问题,模型尝试填补序列中的部分数据,异常点会因其与上下文的低 “协调性” 而导致插补质量显著下降,从而被识别出来。为了有效捕捉时间序列的复杂动态,这些模型通常会集成循环神经网络(RNNs)或注意力机制(Attention),以增强对长短期依赖关系的建模能力,使其在金融欺诈检测、设备故障预警等任务中表现出色。 图 6:时间序列异常检测(TSAD)框架示意图。该图展示了基于扩散模型的两种主流 TSAD 路径:(a)基于重构的路径通过比较原始序列与重构序列的差异来计算异常分数;(b)基于插补的路径则通过评估模型对缺失值的插补质量来判断异常。 表格数据因其混合数据类型(如数值型、分类型、序数型)和普遍存在的缺失值,对异常检测构成了独特的挑战。直接应用为图像设计的扩散模型往往效果不佳。为此,该领域的研究重点在于开发专门的预处理技术和模型架构。综述中提到,扩散模型驱动的表格异常检测(Tabular Anomaly Detection, TAD)方法通常首先通过专门的嵌入层将异构数据统一到连续的表征空间。随后,经过改造的 DMs(如结合 Transformer 架构或高斯混合模型)在这一空间中学习正常数据的联合分布。在推理阶段,通过计算样本的重构损失或生成概率来识别异常。针对缺失值问题,一些方法在训练中引入掩码机制,使模型学会在存在数据缺失的情况下进行稳健的推理。这些适应性设计使得扩散模型能够有效处理金融、医疗等领域的复杂表格数据,精确识别其中的欺诈、病变等异常模式。 图 7:表格异常检测框架示意图。该框架展示了处理包含混合数据类型(如数值型、分类型)的表格数据的典型流程。数据首先经过专门的预处理和嵌入模块,然后输入到适用于表格数据的扩散模型中,最终通过计算重构损失来识别异常。 多模态异常检测(Multimodal Anomaly Detection, MAD)通过融合来自不同数据源(如图像、文本、传感器数据)的互补信息,显著提升了检测系统的准确性和鲁棒性。其核心挑战在于如何有效对齐和融合异构的模态信息。综述总结了三种主流的融合策略:早期融合在输入层即合并特征;晚期融合在决策层结合各模态的独立输出;而动态融合则能根据输入数据的上下文自适应地调整各模态的权重。协同扩散(Collaborative Diffusion)等先进框架通过构建共享的嵌入空间和动态融合模块,有效解决了模态对齐和信息不均衡的问题,在工业检测、智能监控等场景中展现了巨大潜力。 异常生成(Anomaly Generation, AG)的主要动机是解决现实世界中异常样本稀缺的根本性难题。扩散模型凭借其卓越的生成能力,可以创造出逼真且多样的合成异常。该技术以正常数据为 “种子”,通过引入文本描述、掩码或在潜空间进行特定操作等条件化引导,精确地控制生成异常的类型、位置和严重程度。这些生成的异常数据不仅可以用于扩充训练集以增强检测模型的泛化能力,还能作为 “陪练” 来系统性地评估和提升模型的鲁棒性,并为自监督学习范式提供了宝贵的训练信号。 尽管 DMs 在异常检测与生成领域取得了一定的进展,但仍面临诸多挑战。其一,计算效率。DMs 的训练和推理过程通常需要较高的计算资源和时间成本,这限制了其在实际场景中的应用,无法满足工业等应用场景下快速响应需求。其二,模型对复杂场景的适应性。在物理世界中,多模态异构数据往往具有复杂的分布和噪声,如何使 DMs 在这些复杂情况下仍能准确地检测任意可能异常,仍需进一步探索。 展望未来,该领域展现出出色应用前景和研究潜力。第一,优化 DMs 的架构和算法,提高其计算效率,使其能够在资源受限的环境中运行。开发轻量级的扩散模型,或者采用模型压缩、加速推理等技术,有望解决计算效率问题。第二,增强 DMs 对复杂场景的理解和适应能力也是关键。通过引入多模态信息、改进数据增强技术等方式,使模型能够更好地处理复杂多变的数据。第三,探索 DMs 与基础模型以及强化学习等前沿技术的结合,将为面向现实应用的异常检测与生成模型带来新的突破。 技术框架的系统性构建:首次将基于 DMs 的异常检测方法划分为基于重构、基于密度、基于分数三大评分范式,并针对图像、视频、时间序列等不同数据模态,阐述模型架构分类和最新进展。 学术研究的前瞻性展望:客观剖析当前技术瓶颈,包括扩散过程的多步计算开销、小样本场景的泛化能力不足、理论解释的缺失等;展望主要研究趋势,如与大语言模型融合实现上下文感知检测、基于元学习的快速领域适应、以及面向实时场景的高效架构设计。

成色18k.8.35mb菠萝
成色18k.8.35mb菠萝【环球时报驻埃及、伊朗特派特约记者 黄培昭 禹铭 环球时报特约记者 线一凡 文远】当地时间13日凌晨,以色列突然对伊朗发动代号为“狮子的力量”的大规模袭击。以色列总理内塔尼亚胡称这是“一次有针对性的军事行动,旨在击退伊朗对以色列生存的威胁”,行动将“持续数天,直至消除这一威胁”。据伊朗国家媒体报道,包括伊朗武装部队总参谋长巴盖里和伊斯兰革命卫队总司令萨拉米在内的多名高级军事指挥官在袭击中身亡。伊朗最高领袖哈梅内伊13日发表声明称,等待以色列的必将是“严厉的惩罚”。虽然美国迅速与此次袭击划清界限,声称并未参与其中,但美国总统特朗普对美媒表示,袭击“非常成功”,并警告称伊朗必须在一切化为乌有之前与美国就核问题达成协议。外媒普遍担心,此次袭击将加剧中东紧张局势,甚至可能引发中东全面战争。中国外交部发言人林剑13日表示,中方呼吁有关各方多做有利于促进地区和平稳定的事,避免紧张事态进一步升级。中方愿为推动局势缓和发挥建设性作用。据报道,库珀希望在接受镜头前采访的时候能够得到报酬,对此记者说道:“看起来埃斯-贝利在过去一年里得到了一些糟糕的建议,这让他得罪了不少人。”成色18k.8.35mb菠萝xjxjxj18.gov.cn【追觅回应对赌失败:遭遇黑公关,牵扯多家公司及其高管】6月13日下午消息,追觅法务部发布声明,自2024年6月以来,网络平台出现超万条制造虚假舆论、恶意造谣抹黑信息,涉及“断指计划”、“三倍薪资挖人”、“窃取商业机密后开除”、“对赌失败”等,大量失实、诋毁内容被肆意传播,对公司品牌声誉及正常生产经营等造成严重影响。追觅科技经多方提供线索及相关证据发现,相关内容存在有组织网络水军、“黑公关”、“黑媒体”特征,并与多家公司及其高管有关,线下还发生多起涉及雇佣第三方人员偷拍商业机密、打击报复追觅员工等违法行为。针对这些行为,追觅科技宣布公开征集“黑公关”、“黑媒体”行为的线索和证据,对核实有效的提供者奖励1万至100万元。(新浪财经)前排先祝小S生日快乐吧——这也是大S去世之后,小S过的第一个生日,小S比大S小两岁,再过几年时间,她就比永远停留在48岁的姐姐要大了呢。
20251207 💣 成色18k.8.35mb菠萝成员A: 并且还需要PD解耦,对吧?这对于强化学习来说超级重要,因为你只需要在一个提示词上进行一次预填充,然后你的所有解码器工作进程就可以启动并帮助你。是的。17cao.gov.cn当天凌晨,以色列国防军对包括伊朗核设施在内的多处目标发动打击。以色列总理内塔尼亚胡称,此次行动的目标是打击伊朗的核设施及其军事能力。此次行动将持续数日。
成色18k.8.35mb菠萝
📸 戴起生记者 王林太 摄
20251207 💌 成色18k.8.35mb菠萝拉塞尔用中性胎拿下赛季首杆,和同样使用中性胎的维斯塔潘头排发车。皮亚斯特里第三。安东内利用中性胎拿到第四,汉密尔顿第五。阿隆索也用中性胎,他排在第六。第七开始是诺里斯、勒克莱尔、哈贾尔和阿尔本。51cao.gov.cn英语听力难,阅读理解也不简单,篇幅长、词汇量大,还有不少四六级词汇,科技类话题更是让人头疼。语法填空更是挖了不少坑,想拿分太难了。
成色18k.8.35mb菠萝
📸 刘辉均记者 李战华 摄
✔ 虽然网络上也能交到真的朋友,但是还是要线下去认识更多真实的人,现在app再怎么发达,再怎么规避一些风险,你还是不知道网络的那一边是什么人,总有漏洞让这些骗子去钻空子。88888.gov.cn
扫一扫在手机打开当前页