申请试用

手机号
姓名
验证码
我们收到您的消息后,会立刻与您取得联系。

深度学习大规模GPU训练系统

深度学习大规模训练系统由紫平方自主开发,支持多机器多GPU分布式深度学习模型训练,支持千亿级参数的模型,上亿类别的大规模分类。行业领先的内存优化和通信优化技术,上百块GPU联合训练,极大提升了公司训练和迭代模型的速度

技术概要

基于强劲的 GPU 计算资源,在配置 CUDA 8.0 和 cuDNN5 的基础上,搭载 Caffe、 TensorFlow、PyTorch 和 Keras 等多个主流深度学习框架,同时集成 Jupyter notebook 开发环境及 numpy、scipy、pandas、matplotlib、nltk、scikit-learn 等众多数据科学工具包。用户可在深度学习平台上使用 GPU 或 CPU进行单机或分布式深度学习模型训练与推断,并可享受云计算弹性特性,按需进行横向、纵向扩展。

Deep Learning on QingCloud 深度学习平台

技术特性

全流程管理

集数据处理、模型训练、预测、部署功能于一体,并提供公共数据集和业界模型,快速释放数据价值

深度学习

支持 Tensorflow、Caffe、Torch 三大主流深度学习框架,并支持一机多卡、多机多卡模式的 GPU 分布式计算

性能强大

搭载万兆网卡的大量 CPU/GPU 实体机以及针对分布式机器学习的加速算法,为 TB 级数据的模型训练提供坚实基础

算法全面

命令行操作模式符合高阶客户使用习惯,灵活敏捷;可视化操作模式通过拖拉拽的方式拼接算法组件实现业务逻辑,界面友好易使用