天枢优势

一站式开发

一站式开发

为用户提供一站式 AI 模型开发功能,通过智能数据处理、模型开发和模型训练,打通深度学习全链路。

灵活易用

灵活易用

除了一站式 AI 模型开发,亦提供可视化和动静结合编码方式,调试灵活,小白亦可快速上手。

性能优越

性能优越

集成自主研发的分布式训练平台,提供高性能的分布式计算体验,节省训练成本和训练时间。

安装

快速部署平台

硬件支持

最低配置部署方案

单机部署

32 Core CPU/ 32 G 内存/300G 存储/训练型 GPU (可选,没有则不能跑GPU训练)

• 辅助服务:redis/mysql/nacos/nfs/minio/harbor/前后端/可视化服务

• 数据集服务(提供自动标注、目标跟踪、增强等)

• 单master节点 kubernetes 服务:

- 当创建单机版的 k8s 时,Master不参与工作负载,需要执行命令,将 master 标记为可调度
kubectl taint nodes --all node-role.kubernetes.io/master-

推荐配置部署方案

多机部署

• 搭建kubernetes集群:

– 1个 master 节点:16 core CPU/ 64G 内存/ 100G 存储
– 3个 node 节点: 16 core CPU/ 128G 内存/ 8*训练型GPU/200G 存储
– 训练型GPU推荐:Tesla V100 或 P100

• 数据集服务(提供自动标注、目标跟踪、增强等):

– 1台计算节点:4 core CPU/ 16G 内存/ 1*推理型 GPU/ 100G存储
– 推理型GPU推荐:Tesla T4 或 P4

• 辅助服务:

– nfs/minio存储服务/Harbor:4 core CPU/ 16G 内存/ 2T 存储
– 前后端服务:8 core CPU/ 32G 内存/ 100G 存储

部署步骤: 详细参考平台部署手册

快速安装天枢深度学习框架

• Python≥3.5

• CUDA驱动要求详情见OneFlow源码仓库:README

• 使用以下命令安装OneFlow最新的支持CUDA的稳定版本:

用户手册

概览

一站式模型开发平台

模型炼知平台

FAQ

之江天枢人工智能开源平台

Q: 平台对使用者有没有特别要求?

A:只要拥有人工智能深度学习基础知识,就可轻松上手。平台提供的一站式 AI 模型开发功能,简化了构建模型的流程及复杂度,帮助 AI 初学者及企业内算法工程师快速上手。另外,面对专业级用户,多框架组件支持用户上传自定义算法,支持在线开发,赋予用户更高的灵活性。

Q:平台的一站式 AI 模型开发功能有哪些?

A:一站式AI模型开发功能包括:数据管理、模型开发、训练管理、模型管理、训练可视化等。

Q:平台还会有哪些新功能?

A:之江实验室会持续推进之江天枢人工智能开源平台的研发,包括:开发自动机器学习平台、构建去中心化分布式训练原型、研发高效的云端推理框架、模型编译优化等。

天枢深度学习框架

Q:天枢深度学习框架支持哪些模型的训练?

A:天枢深度学习框架针对典型场景均有模型训练支持。

Q:天枢深度学习框架有哪些现成的网络或模型可用?

A:目前已开发的模型涵盖常见的图像分类网络(alexnet, vgg16, resnet, inception),目标检测模型 (faster rcnn, mask rcnn, yolov3, ssd) ,人脸识别模型 (insight face,facenet), 生成对抗网络 GAN,自然语言处理领域的 bert,推荐系统领域的 wide & deep 等。

Q:天枢深度学习框架核心优势是什么?

A:新一代深度学习框架围绕性能提升和异构分布式扩展,秉持静态编译和流式并行的核心理念和架构,突破了一系列的关键核心技术,是专门针对深度学习的异构分布式流式系统,完美地解决了大数据、大模型、大计算所带来的异构集群分布式扩展挑战,技术水平世界领先。框架天生支持数据并行、模型并行和混合并行,无需定制化开发,已在头部互联网企业及安防企业落地应用。

Q:在之江天枢人工智能开源平台中能使用其他训练框架吗?

A:之江人工智能开源平台兼容 TensorFlow、Pytorch 等主流训练框架,用户可通过镜像导入框架。

天枢平台功能演示

新闻动态

查看更多

生态伙伴