新闻中心

比肩Transformer的Mamba在时间序列上有效吗?

2024-04-02
浏览次数:
返回列表

Mamba 是最近最火的模型之一,更是被业内认为可以有取代 Transformer 的潜力。今天介绍的这篇文章,探索了 Mamba 模型在时间序列预测任务上是否有效。本文首先给大家介绍 Mamba 的基础原理,再结合这篇文章探索在时间序列预测场景下 Mamba 是否有效。 Mamba 模型是一种基于深度学习的模型,它采用了自回归架构,可以在时间序列数据中捕捉到长期依赖关系。与传统的模型相比,Mamba 模型在时间序列预测任务上表现出色。 通过实验和对比分析,本文发现 Mamba 模型在时间序列预测任务上有很好的效果。它可以准确地预测未来的时间序列值,并且在长期依赖关系的捕捉上表现更好。 总结

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

比肩transformer的mamba在时间序列上有效吗?

论文标题:Is Mamba Effective for Time Series Forecasting?

下载地址:https://www.php.cn/link/f06d497659096949ed7c01894ba38694

1、Mamba基础原理

Mamba是一种基于State Space Model的结构,但与RNN非常相似。Mamba相比Transformer,在训练阶段和inference阶段都有随序列长度线性增长的时间复杂度,运算效率取决于Transformer这种结构。

Mamba的核心可以分为以下4个部分:

State Space Model(SSM)是一种用来刻画一个状态对当前状态的影响,以及当前状态对输出的影响的数学模型。在State Space Model中,假设上一个状态和当前时刻的输入会影响下一个状态,并且当前状态对输出的影响。SSM可以表示为如下形式,矩阵A、B、C、D为超参数。 矩阵A表示上一状态对当前状态的影响; 矩阵B表示当前时刻的输入会影响下一个状态; 矩阵C表示当前状态对输出的影响; 矩阵D表示当输入对输出的直接影响。 通过观测当前输出以及当前时刻的输入,可以推断出下一个状态的值。根据当前观测结果以及当时状态的决定的。SSM可以用于动态系统建模、状态估计和控制应用等领域。

比肩Transformer的Mamba在时间序列上有效吗?图片

卷积表达:用卷积来表示SSM,实现训练阶段的并发计算,通过将SSM中的计算输出的公式按照时间展开,通过设计相应的卷积核到一定的形式,可以利用卷积来表达每个时刻的输出为前三个时刻输出的函数:

比肩Transformer的Mamba在时间序列上有效吗?图片

Hippo Matrix:对于参数A,引入Hippo Matrix实现对历史信息的衰减融合;

比肩Transformer的Mamba在时间序列上有效吗?图片

Selective模块:对于参数B和参数C个性化的矩阵实现对历史信息的个性化选择,将每个时刻的参数矩阵转换成关于输入的函数,实现每个时刻个性化的参数。

易标AI 易标AI

告别低效手工,迎接AI标书新时代!3分钟智能生成,行业唯一具备查重功能,自动避雷废标项

易标AI 135 查看详情 易标AI

比肩Transformer的Mamba在时间序列上有效吗?图片

关于Mamba更详细的模型解析,以及后续的Mamba相关工作,也更新到了知识星球中,感兴趣的同学可以在星球中进一步深入学习。

2、Mamba时间序列模型

下面介绍一下这篇文章中提出的Mamba时间序列预测框架,整体基于Mamba,对时间序列数据进行适配。整体分为Embedding、S/D-Mamba layer、Norm-FFN-Norm Layer三个部分。

Embedding:类似iTransformer的处理方法,对每个变量单独进行映射,生成每个变量的embedding,再将每个变量的embedding输入到后续的Mamba中。因此本文也可以看成是对iTransformer的模型结构的一个改造,改成了Mamba结构;

S/D-Mamba layer:Embedding的输入维度为[batch_size, variable_number, dim],将其输入到Mamba中,文中探索了S和D两种Mamba层,分别表示每层用一个mamba还是两个mamba,两个mamba会将两个的输出相加得到每层的输出结果;

Norm-FFN-Norm Layer:在输出层,使用normalization层和FFN层对Mamba的输出表征进行归一化和映射,结合残差网络,提升模型收敛性和稳定性。

比肩Transformer的Mamba在时间序列上有效吗?图片

3、实验效果

下图是文中的核心实验结果,对比了Mamba和iTransformer、PatchTST等业内主流时间序列模型的效果。文中还对不同的预测窗口、泛化性等进行了实验对比。实验表明,Mamba不仅在计算资源上有优势,在模型效果上也可以比肩Transformer相关的模型,并且在长周期的建模上也很有前景。

比肩Transformer的Mamba在时间序列上有效吗?图片

以上就是比肩Transformer的Mamba在时间序列上有效吗?的详细内容,更多请关注其它相关文章!


# mamba  # follow  # 是一种  # 这篇文章  # 多模  # 上有  # 上也  # 一文  # 如何处理  # rnn  # 怎么做快递网站推广  # 全椒优化型网站  # 魔贝课凡seo 12  # 伴音网站建设路  # 轻食推广营销方案策划书  # 视频网站建设预算  # 威海外贸网站海外推广  # 网站单词优化公司有哪些  # seo排名淘宝  # 移动网站建设外包  # 读懂  # 第二期  # 达人 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 为什么都用typescript  linux如何切换到命令行模式  j*a数组逆序怎么写  win7旗舰版wifi怎么打开  如何通过命令系统还原  固态硬盘如何打开软件  固态硬盘 如何分区  夸克用的什么服务器  typescript为什么现在才火  春运抢票失败怎么抢  typescript如何遍历map  计数器上power是什么意思  如何拍屏幕不出条纹详细方法  如何清理固态硬盘  酷狗音乐pc版的每日推荐在哪 酷狗音乐PC版每日推荐查找指南  汽车中控导航机power线是什么意思  16苹果有哪些机型  交管12123协议头不完整是啥意思  8800日元等于多少人民币  苹果16更新了哪些功能  如何使硬盘升级固态硬盘  恋爱软件免费聊天不收费的有哪些  在遥控器中power是什么意思  如何自己加装固态硬盘  360f4怎么取消百变壁纸  燃气热水器上的power是什么意思  光猫power和pon常亮是什么意思  win10如何打开dos命令窗口大小  python如何命令行换行  j*a map数组怎么取值  dos命令如何复制目录结构  爱玛电动车power模式是什么意思  春运哪天抢票最好  ip dhcp是什么意思  怎么批量烧写单片机  春运抢票如何抢连坐的票  单身聊天app有哪些软件 2025最靠谱的单身交友软件推荐  typescript如何开发  为什么有的夸克带电  单片机是怎么复位的  vi命令如何退出编辑模式  ai怎么找链接文件位置教程  苹果16有哪些bug  市盈率300是什么意思  什么是unix时间戳  忐忑不安是什么意思  使用typescript对团队有什么要求  soup是什么意思  固态硬盘如何迁移系统  选哪个折叠屏手机好 

搜索