PaddlePaddle/Paddle v3.1.0
PaddlePaddle/Paddle
Captured source
source ↗published Jun 29, 2025seen 5dcaptured 13hhttp 200method plain
PaddlePaddle 3.1.0 Release Note
Repository: PaddlePaddle/Paddle
Tag: v3.1.0
Published: 2025-06-29T10:16:00Z
Prerelease: no
Release notes:
重要更新
飞桨框架 3.1 版本,针对核心功能自动并行进一步优化打磨,提升易用性和性能表现;同时提供FP8低精度训练支持,提升大模型训练速度提升10-20%;完善硬件扩展机制,降低类 cuda 类硬件适配成本,用户仅需注册kernel;同时对于框架基础能力进行增强,提升框架稳定性。重点更新功能如下:
- 自动并行架构: 自动并行架构进一步打磨,以提高自动并行核心机制易用性和动态图性能。完善了自动并行核心机制,包括新增了多个算子的切分推导规则,支持分布式张量的同一维度被多个mesh维度切分,支持动态图并行策略(PP,CP,SEP,TP-CONV)等。同时,对动态图自动并行系统地做了性能优化,在 Llama2 Qwen Baichuan 等系列模型上性能基本持平手动并行的性能。
- 低精度训练: 基于blockwise 的fp8 gemm算子,支持低精度训练,训练精度媲美BF16,大模型训练速度提速 10-20%。
- 异构多芯适配: 提供类 cuda 算子复用机制,仅需注册即可使用对应 kernel。
- 框架稳定性增强: 系统修复算子在0-Size 和大维度情况计算结果错误。
1. 用户体验升级
API功能增强、Bug修复与改进,旨在提升用户体验和API的易用性。新增了paddle.randn_like API,修复了多个API的功能缺陷,并增强了对复数类型和0-Size Tensor的支持。文档和代码也进行了相应的更新和优化,以提升整体的准确性和专业性。
新特性
- 新增
paddle.randn_likeAPI。#72492
Bug 修复
- 修复
tensordotAPI 输入输出类型不一致问题。#72139 - 修复
atleastAPI输出是Tensor列表时的问题。#73102 - 修复
nonzerAPI问题。#72003 - 修复
dualpipev中的内存泄漏问题。#72070 - 修复
softmax计算溢出问题。#71935 - 修复
take_along_axis中在broadcast=False时的形状检查问题。#72436 - 修复
maximum、minimum对Nan输入的不正确问题。#71933 - 修复
visit_type问题。#72782 - 修复
gather_scatter_functor中的int32越界问题。#72905 - 修复
Bernoulli的inplace实现。#73271 - 修复
moe_permute、moe_unpermute问题。#73365 - 修复
ast.parse对pyi文件语法检查问题。#71872 - 修复复数除法问题。#73331
- 修复与TensorRT集成相关的问题。#72302, #72278
功能增强
- 增强API的功能,提升API易用性,改善用户体验。包括但不限于扩展API支持的数据类型,API参数检查,纠正API参数默认值,完善API返回值等。#71997, #72911, #72985, #73240, #72927, #73451, #73416, #73420, #73347, #73050, #73246, #73123, #73336, #73062, #72201, #72190
- 增强API对复数类型的支持。#72279, #72308, #72518, #72391, #72239, #72286, #72169, #72577, #72619
- 增强API对0-Size Tensor的支持。#72570, #72692, #72138, #72410, #72565, #72262
- 修改对API代码中的拼写错误,以提高整体的准确性和专业性。#71780, #71786, #72093, #72113, #72241, #72237, #72590, #72591, #72769, #72858, #73045, #72195, #72627, #72657, #73162, #73402, #72208, #72659, #72658, #72660, #72661, #72656
- 通信优化减少显存峰值。#72035
文档
开发者相关
Excerpt shown — open the source for the full document.
Notability
notability 5.0/10Routine version release of established framework