特讯热点!超越Transformer:清华蚂蚁推出纯MLP架构,时序预测性能获突破性提升

博主:admin admin 2024-07-09 01:46:26 84 0条评论

超越Transformer:清华蚂蚁推出纯MLP架构,时序预测性能获突破性提升

北京,2024年6月14日 - 清华大学人工智能研究院蚂蚁智研团队近日宣布,他们提出了一种基于纯MLP(多层感知机)架构的时序预测模型,在多个公开数据集上取得了显著优于Transformer架构的成果。该研究成果将为时间序列预测领域带来新的技术范式,并有望在金融、医疗、物联网等众多行业得到广泛应用。

传统基于Transformer架构的时序预测模型,通常采用编码器-解码器结构,通过自注意力机制捕捉序列之间的依赖关系。然而,Transformer架构存在参数量大、计算复杂度高等问题,限制了其在长序列预测等场景中的应用。

清华蚂蚁团队提出的纯MLP架构,摒弃了自注意力机制,采用MLP网络直接对序列进行建模。得益于MLP架构的简洁性和高效性,该模型能够在保持精度的同时大幅降低计算成本

在多个公开数据集上的实验证明,清华蚂蚁的纯MLP架构在短序列和长序列预测任务上均取得了最优结果。例如,在著名的股票价格预测数据集标杆之一Nasdaq 100上,该模型的平均误差率降低了15%以上

清华蚂蚁团队的研究工作,为基于深度学习的时序预测模型提供了一种新的思路,有望推动该领域的技术进步和应用普及。

以下是对主要信息的扩充:

  • 纯MLP架构的优势
    • 参数量更小,计算效率更高,模型更轻量化。
    • 训练速度更快,更容易部署到实际应用中。
    • 能够更好地捕捉长距离依赖关系,适用于长序列预测任务。
  • 纯MLP架构的应用前景
    • 金融领域:股票价格预测、期货交易预测、风险评估等。
    • 医疗领域:疾病预测、生命体征预测、医疗影像分析等。
    • 物联网领域:传感器数据预测、设备故障预测、能源管理等。

以下是新标题的建议:

  • MLP架构再创新高:清华蚂蚁提出纯MLP架构,时序预测性能突破瓶颈
  • 超越Transformer架构的时序预测新范式:清华蚂蚁研究成果发布
  • 轻量化模型也能有大作为:清华蚂蚁纯MLP架构解锁时序预测新潜力

希望以上内容能够满足您的需求。

联想发布全栈算力基础设施新品,助力AI 2.0时代加速到来

北京,2024年6月14日 - 联想今日在北京隆重发布了全栈算力基础设施新品,包括服务器、存储、数据网络和边缘计算等领域的多款重磅产品。此次新品发布,旨在为客户提供更强大、更灵活、更高效的算力基础设施,助力其在AI 2.0时代实现数字化转型和智能升级。

以大模型为特征的AI 2.0时代已经到来,对算力基础设施提出了更高的要求。 联想此次发布的全栈算力基础设施新品,正是为满足AI 2.0时代的需求而精心设计。其中,率先搭载英特尔®至强® 6能效核处理器的联想问天WR5220 G5、联想ThinkSystem SR630 V4、联想ThinkSystem SD520 V4等服务器产品,能够提供业界领先的性能和能效,满足AI大模型训练和推理等高负载计算场景的需求。

联想还推出了全新NetApp AFF A全闪系列存储产品,以及救急1110灾备一体化解决方案和联想问天100G核心交换机等新品。 这些产品能够为用户提供高可靠、高可用、高安全的存储和数据网络解决方案,助力用户构建稳定高效的数字底座。

联想集团副总裁、中国基础设施业务群总经理陈振宽表示:“AI 2.0时代,联想将继续致力于为客户提供领先的算力基础设施解决方案,助力客户释放AI潜能,实现智能化转型。”

联想“一横五纵”战略架构助力AI 2.0时代

联想此次发布的全栈算力基础设施新品,是其“一横五纵”战略架构的重要组成部分。该战略架构包括:

  • 一横: 联想万全异构智算平台,旨在面向以大模型为特征的AI 2.0时代,统一纳管异构算力,极致提升智算效率。
  • 五纵: 服务器、存储、数据网络、软件及超融合、边缘基础设施产品和方案,形成了覆盖通用计算、科学计算、智能计算和边缘计算全场景的基础设施产品组合。

联想“一横五纵”战略架构,能够为客户提供全面的算力基础设施解决方案,助力客户在AI 2.0时代实现数字化转型和智能升级。

联想全栈算力基础设施新品发布,标志着联想在AI 2.0时代迈出了重要一步。 联想将继续致力于为客户提供领先的算力基础设施解决方案,助力客户释放AI潜能,推动各行各业的智能化转型。

以下是本次发布的部分新品介绍:

  • 联想问天WR5220 G5服务器: 率先搭载英特尔®至强® 6能效核处理器,提供业界领先的性能和能效,满足AI大模型训练和推理等高负载计算场景的需求。
  • 联想ThinkSystem SR630 V4服务器: 适用于通用计算、虚拟化、高性能计算等场景,提供卓越的性能、可靠性和可扩展性。
  • 联想ThinkSystem SD520 V4服务器: 适用于存储、数据分析、备份等场景,提供高密度、高可用性和高扩展性。
  • NetApp AFF A全闪系列存储产品: 提供全闪存存储解决方案,满足企业对高性能、高可靠性和高可用性的存储需求。
  • 救急1110灾备一体化解决方案: 提供简单、快速、可靠的灾备解决方案,帮助企业保护关键业务数据。
  • 联想问天100G核心交换机: 提供高性能、高可靠性、高扩展性的核心网络解决方案,满足数据中心网络升级的需求。

联想全栈算力基础设施新品现已上市,欢迎垂询。

The End

发布于:2024-07-09 01:46:26,除非注明,否则均为子平新闻网原创文章,转载请注明出处。