优化性能 快速迭代 之江天枢人工智能开源平台新版本上线

微信图片_20201105135228.gif

在2020年8月开源上线之江天枢人工智能开源平台后,之江实验室的研发团队丝毫没有松劲儿。经过三个月的持续攻关,计算性能更优、模型算法更丰富的最新版本“天枢平台”在今天又和开发者们见面了。这次开源发布的新版本在原有的优势基础上,对深度学习框架、数据管理模块和训练管理模块等最核心模块和子系统进行了性能优化,并且新增了多个计算机视觉领域的算法和算子,在开发易用性、分布式训练性能、模型编译速度等方面得到了进一步的提升。

微信图片_20201105135302.jpg

对天枢平台自研的深度学习框架进行升级优化是本次版本更新的重点任务之一。据了解,本次更新主要是对大规模深度学习加速计算进行了升级,通过框架编译速度优化、CUDA性能调优和自动混合精度性能优化等技术点的攻关和整合,提升了端到端的训练速度,且全面提升了框架的完备性和稳定性。据天枢团队介绍,本次更新中还新增了深度学习框架性能评测工具DLPerf,经过对5种深度学习框架的评测,天枢自研框架多次刷新模型训练的最快记录。

微信图片_20201105135308.jpg


“在数据管理模块方面,这次新增了分布式的数据自动/半自动标注功能,将原本集中进行数据标注升级为分布式的数据标注方式,帮助开发者缓解对超大规模数据集进行数据标注时的计算压力。此外,我们还实现了零延时的状态变更响应能力、优化了超大数据集的操作流程、兼容了跨平台的数据标注格式等,有效提升了一站式开发平台的数据管理与处理效率。”天枢平台总架构师鲍虎军介绍。

为了提升模型训练的兼容性和对开发者的友好程度,新版本对训练管理模块进行了多项优化。如支持模型断点续训、重训练,支持 TensorFlow、Pytorch、OneFlow等主流深度学习框架的多机多卡模式分布式训练等。“这些功能可以帮助开发者将基于其他平台开发的模型和算法无缝迁移到天枢平台上,然后充分利用天枢的性能优势进行更高效和便捷的模型训练和优化。”天枢平台架构师单海军表示。

微信图片_20201105135314.gif   微信图片_20201105135318.gif   微信图片_20201105135322.gif

部分新增算法效果演示

根据研发计划,之江天枢人工智能开源平台充分考虑浙江省安防产业发展的现实需求,将充实计算机视觉算法和模型作为本次版本更新的重点任务之一。此次更新后,天枢的模型库中新增和优化了行为识别算法、人脸分割算法、超分辨率算法、新型图像分类算法以及跨镜识别算法等多种针对智能视觉领域的算法模型,且相关性能指标基本达到了业界的领先水平。“经过测试,我们的自研算法对视频中目标的行为识别平均准确率能稳定在70%以上,与公开资料中业界的最好成绩相持平。”天枢研发团队的高级算法工程师傅家庆说。

微信图片_20201105135327.png

微信图片_20201105142032.png


之江天枢人工智能开源平台由之江实验室联合北京一流科技、浙江大学、中国信通院等业内顶尖力量共同打造,以追求极致性能和至快至简为特点,在超大规模模型训练、模型炼知等技术上形成了独特的优势。天枢平台还并面向六大产业领域,汇聚六十余家行业生态伙伴,构建了AI核心生态圈,致力推动新一轮人工智能实现跨越式发展。

微信图片_20201105135332.png

微信图片_20201105144901.png

微信图片_20201105145017.png

天枢官方网站:

http://tianshu.org.cn/ 

代码托管平台“聚码坊(Codelab):

http://codelab.org.cn/

撰稿 | 周立超


编辑 | 陈航
学术指导 | 单海军


微信图片_20201105145149.jpg