ReleaseBaidu (ERNIE)Baidu (ERNIE)published Oct 12, 2020seen 5d

PaddlePaddle/PaddleRec v1.8.5

PaddlePaddle/PaddleRec

Open original ↗

Captured source

GH

GitHub/github.com/PaddlePaddle/PaddleRec

PaddlePaddle/PaddleRec v1.8.5

published Oct 12, 2020seen 5dcaptured 9hhttp 200method plain

PaddleRec v1.8.5

Repository: PaddlePaddle/PaddleRec

Tag: v1.8.5

Published: 2020-10-12T09:01:14Z

Prerelease: no

Release notes:

PaddleRec v1.8.5 Release Note

重要更新

此版本适配飞桨版本为v1.8.5
框架升级，支持更加灵活的reader及模型适配，支持更加灵活的训练模式定义及数据读取定义
新增9个模型，并对多个已支持模型进行了优化
取消内置paddlerec.models.rank.等模型的内置配置方法，统一由用户根据yaml的路径进行配置
支持Kubernetes、PaddleCloud一键提交飞桨分布式训练
支持CPU/GPU下进行飞桨分布式训练，支持GPU下collective模式训练，支持GPU下parameter server模式训练及CPU下parameter server模式训练

功能新增及修复

新增collective模式支持GPU多卡训练、parameter server模式支持GPU-PS训练、单机多卡训练等
新增分布式训练任务提交功能，支持在MPI/Kubernetes/PaddleCloud上一键启动训练
新增多个指标的计算和分布式计算功能，包括AUC、Recall_k（召回topk的准确率）、PN（正逆序）、Precison_Recall等
新增BatchReader功能，可由用户在Reader中自行组batch
新增预训练Trainer及流式训练Trainer，可支持用户对预训练及流式训练的需求
新增本地文件列表shuffle的功能，在训练前进行数据文件粒度的shuffle支持
新增batch级别模型保存
数据读取优化，加入SlotReader，用户只需要按照要求生成好数据并配置好数据格式即可使用飞桨高效训练
修复LOG打印，规范log级别及log输出格式
修复Windows下安装出错的bug
修复数据读取读取隐藏文件的bug
修复collective多卡数据不均匀划分导致训练异常的bug
修复learning rate不支持科学计数法的bug

模型新增及修复

新增模型DIEN、BST、AutoInt、FGCNN、Fibinet、FLEN、RALM、Match-pyramid、TDM 等模型
新增预训练模型TextCNN
为Fibinet、FLEN、youtubednn、gnn、word2vec等模型加入Readme，数据处理，运行结果展示等功能，修复模型效果问题
修复Rank目录下DNN、LR、FM、DeepFM等多个模型的Readme
修复Recall目录下多个Readme中模型配置及路径问题
TDM加入完整训练流程，包括训练、建树、聚类及在线预测

教程更新

新增单机训练、分布式训练、流式训练及英文教程、预训练模型教程