Amd不但生产cpu,还生产gpu(显卡)。nvidia的显卡被众多深度学习框架采用,amd的确实不多,单不代表不能。今日,我司就在我们的机组上成功的搭建了amd的tensorflow,keras 深度学习环境,而且是物理环境,不是docker环境。
在nvidia的显卡,nvidia-smi可以查看显卡的运行状态,amd的显卡对应的指令是rocm-smi。rocm是amd主导的gpu加速工具包,nvidia的是cuda,cudnn等,相对于nvidia在gpu 加速计算深耕多年,amd的gpu加速计算之路并不顺畅,起初amd押注opencl,opencl的阵容可谓豪华,intel,amd,nvidia,苹果,微软……,然而结果是cuda这个nvidia的私生子火起来了,amd最后也自己开干,搞了rocm一套 工具包。
nvidia的cuda和显卡驱动是独立的,但cuda安装包附带驱动。在ubuntu系统下不管是单独安装驱动,还是随cuda一起安装驱动,nvidia的显卡驱动都可能壮烈牺牲,甚至重做系统,然后接着牺牲。 而amd这边系统兼容性就好多了。
安装需要等待很久,因为要从amd的仓库下载许多文件,而amd并没有在国内设置镜像,也没有像nvidia一样的离线安装包。几经波折,终于成功,然后换电脑,并再次复现安装。至此我们的云平台 可以说初步攻克了amd显卡的深度学习环境配置大关。下一步,我们还要再战pytorch等。
R系列显卡,rx470,rx480,rx550,rx570,rx580,rx590都支持rocm。但是rx560不支持。
我们在16.04,18.04的系统上做了简单的测试,跑了简单的mnist cnn测试,结果符合预期。intel的显卡,价格昂贵,amd的价格更亲民一些。至此我们的云平台价格可以更亲民了。 想要试用amd 显卡深度学习的朋友可以到我们的淘宝店下单
amd显卡在线租用:amd gpu rocm caffe 深度学习 显卡 出租ubuntu tensorflow keras
安装amd深度学习环境:amd显卡gpu加速 深度学习 tensorflow keras安装 ubuntu系统rocm
关于我们
洋外洋科技: 洋外洋科技
分享快乐