ReleaseBaidu (ERNIE)Baidu (ERNIE)published Jun 29, 2025seen 5d

PaddlePaddle/Paddle v3.1.0

PaddlePaddle/Paddle

Open original ↗

Captured source

source ↗
published Jun 29, 2025seen 5dcaptured 13hhttp 200method plain

PaddlePaddle 3.1.0 Release Note

Repository: PaddlePaddle/Paddle

Tag: v3.1.0

Published: 2025-06-29T10:16:00Z

Prerelease: no

Release notes:

重要更新

飞桨框架 3.1 版本,针对核心功能自动并行进一步优化打磨,提升易用性和性能表现;同时提供FP8低精度训练支持,提升大模型训练速度提升10-20%;完善硬件扩展机制,降低类 cuda 类硬件适配成本,用户仅需注册kernel;同时对于框架基础能力进行增强,提升框架稳定性。重点更新功能如下:

  • 自动并行架构: 自动并行架构进一步打磨,以提高自动并行核心机制易用性和动态图性能。完善了自动并行核心机制,包括新增了多个算子的切分推导规则,支持分布式张量的同一维度被多个mesh维度切分,支持动态图并行策略(PP,CP,SEP,TP-CONV)等。同时,对动态图自动并行系统地做了性能优化,在 Llama2 Qwen Baichuan 等系列模型上性能基本持平手动并行的性能。
  • 低精度训练: 基于blockwise 的fp8 gemm算子,支持低精度训练,训练精度媲美BF16,大模型训练速度提速 10-20%。
  • 异构多芯适配: 提供类 cuda 算子复用机制,仅需注册即可使用对应 kernel。
  • 框架稳定性增强: 系统修复算子在0-Size 和大维度情况计算结果错误。

1. 用户体验升级

API功能增强、Bug修复与改进,旨在提升用户体验和API的易用性。新增了paddle.randn_like API,修复了多个API的功能缺陷,并增强了对复数类型和0-Size Tensor的支持。文档和代码也进行了相应的更新和优化,以提升整体的准确性和专业性。

新特性

  • 新增paddle.randn_like API。#72492

Bug 修复

  • 修复tensordot API 输入输出类型不一致问题。#72139
  • 修复atleast API输出是Tensor列表时的问题。#73102
  • 修复nonzer API问题。#72003
  • 修复dualpipev中的内存泄漏问题。#72070
  • 修复softmax计算溢出问题。#71935
  • 修复take_along_axis中在broadcast=False时的形状检查问题。#72436
  • 修复maximumminimum对Nan输入的不正确问题。#71933
  • 修复visit_type 问题。#72782
  • 修复gather_scatter_functor中的int32越界问题。#72905
  • 修复Bernoulli的inplace实现。#73271
  • 修复moe_permutemoe_unpermute问题。#73365
  • 修复ast.parse对pyi文件语法检查问题。#71872
  • 修复复数除法问题。#73331
  • 修复与TensorRT集成相关的问题。#72302, #72278

功能增强

文档

  • 修正了文档中的错误,提高了文档的可用性和用户体验。#72549, #73036

开发者相关

Excerpt shown — open the source for the full document.

Notability

notability 5.0/10

Routine version release of established framework