WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单
前言
GTX1080TI比GTX1080最大的提升是什么?
1、INT8/FP32的算法提升
anandtech放出了一张参数对比图表,其实仔细看是有点问题的,我就从这点问题说起。
FP64:计算双精度浮点运算。
FP32:计算单精度浮点运算。
FP16:计算半精度浮点运算。
INT8:8-bit的整数运算(一个字节),新增的增强8位整数支持是可以在一个周期内, 对打包在32-bit里的4个8位整数(记做:A0A1A2A3), 完成操作:Y = A0 * B0 + A1 * B1 + A2 * B2 + A3 * B3 + X其中Y和X均为32-bit整数, A和B均为8-bit整数.
理论上INT8能以400%的性能(相比于float)完成8-bit整数的点乘和累加操作. 对最近流行的神经网络推导很有用途.
那来看看GTX1080TI GP102的各种运算的比值
FP64:FP32=1:32
双精度运算能力是单精度运算能力的1/32
FP16:FP32=1:64
半精度运算能力是单精度运算能力的1/64
INT8:FP32=4:1
INT8运算能力是单精度运算能力的4倍
GTX 1080 Ti获得了与Titan X相同的4:1 INT8性能比,这对于深度学习的神经网络推理性能至关重要。因此,GTX 1080 Ti实际上具有比Titan X更高的计算性能,除非需要Titan X提供的最后1GB显存,否则GTX 1080 Ti会更加划算,所以除了Titan Xp,GTX1080TI是无敌的存在了。
而1080的INT8是不是如图中NA描述的一点都没有呢?实际上不是的。
GP104 GTX1080
FP64:FP32=1:32
双精度运算能力是单精度运算能力的1/32
FP16:FP32=1:64
半精度运算能力是单精度运算能力的1/64
INT8:FP32=2:1
INT8运算能力是单精度运算能力的2倍
所以除了架构上的CUDA单元区别,对于INT8/FP32的性能增幅,GTX1080TI是GTX1080的两倍。这也是GTX1080TI对比GTX1080最大的提升了,其实游戏这些而言提升真的远不如INT8/FP32的翻倍提升来的明显。
2、CUDA的单元提升
GTX1080TI构架
GTX1080构架
GTX 1080 Ti提供了超过11.3 TFLOPS的FP32性能,着色/纹理性能比当前的GTX 1080提前28%,而ROP吞吐量优势为26%,内存带宽则大大增加了51.2%。
小结论:所以如果你只是要玩玩游戏的话,其实1080已经足够你玩了,1080TI对比1080的提升游戏不是重点,除非你要玩深度学习,否则你没啥必要从1080换到1080TI的。说道深度学习不得不说到由Python提供支持的领先的开放数据科学平台Anaconda已经支持WIN10 X64了,这解决了过去只能在LINUX下运行的尴尬,也给了大众一个进入深度学习的捷径。
那么我也拿一张索泰的PGF GTX1080TI来晒个单顺便演示下如何在WIN10 X64下进行深度学习平台的搭建。
第一章、开箱
四面观
三年质保
型号为ZOTEC GTX1080TI-11GD5X PGF
拆箱就是附件盒
卡皇本体和显卡支架
正面
白色的LED灯管,三风扇设计
背面使用了带有透明镂空的金属镶嵌塑料的背板设计
POWER BOOST芯片
ZOTEC的MICROUSB调试接口
侧面看厚度是足足的三槽设计,虽然是双槽挡板
ZOTEC的LOGO灯
双8PIN外接供电
3DP 1HDMI 1DVI的IO组合
前侧能看到四热管
这张卡其实是无比庞大的,单看卡真看不出,我拿出GTX1080公版一对比,就能看出,PGF这卡比1080公版可是粗壮太多了。
第二章、简测
测试平台:
CPU:INTEL XEON E5 2696 V3
内存:三星M391A2K43BB1-CRCQ DDR4 2400 ECC 16GBX2
SSD:三星SM961 1TB
显卡:索泰PGF GTX1080TI 11GB DDR5X
散热:金钱豹4U+安耐美白蝠UCCL9
电源:酷冷V850/白色定制硅胶线
WIFI:INTEL 7260 AC
光效
关机状态
轻载状态:蓝灯
满载状态:红灯
GPUZ参数
3DMARK
FIRE STRIKE ULTRA 7009
TIME SPY 9578
TIME SPY压力测试98.9
FIRE STRIKE ULTRA压力测试97.3
VRMARK BLUE ROOM 3135
VRMARK ORANGE ROOM 3135
温度测试
3DMARK FIRE STRIKE ULTRA测试最高温度64度
3DMARK FIRE STRIKE ULTRA压力测试最高温度65度
甜甜圈拷机了快一个小时,也就63度附近。
但是这不是最搞笑的,搞笑的是在裸奔平台上,除了甜甜圈和3DMARK稳定性测试之外,其他测试显卡满载,风扇竟然是不转的,害我以为风扇坏了。。。。。。这散热貌似做的也太变态了一些,温度确实控制得很低。
FIRESTORM
索泰的APP我就装了看了一下,不是超频党也不是游戏党,所以我主动掠过。
第三章、WIN10 X64平台下的深度学习入门搭建
WIN10 X64下搭建深度学习的平台而言,Anaconda For Windows会相对配置简单得多,可作为首选的入门搭建平台推荐,其实Anaconda官网也给了WIN10下的安装说明,但是版本出得太勤快了,版本插件多了兼容小问题也多起来了,别看就那么短短的几行代码,具体执行起来撞头破血流的不在少数,所以我亲测了一个WIN10 X64下的一条龙安装流程仅供参考。
1、安装Anaconda 4.3.1For Windows
Anaconda是由Python提供支持的领先的开放数据科学平台。 Anaconda的开源版本是Python和R的高性能分发版本,包括超过100个用于数据科学的最流行的Python,R和Scala软件包。
ANACONDA:https://www.continuum.io/downloads
Anaconda 4.3.1For Windows
Python 3.6 version 64BIT INSTALLER :https://repo.continuum.io/archive/Anaconda3-4.3.1-Windows-x86_64.exe
2、安装Python并且创建环境
Python是纯粹的自由软件,语法简洁清晰,特色之一是强制用空白符(white space)作为语句缩进。具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中[3] 有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。需要注意的是在您使用扩展类库时可能需要考虑平台问题,某些可能不提供跨平台的实现。
使用管理员权限打开Anaconda Prompt
输入
conda create -n tensorflow python=3.5
更新输入
y
此时安装进行更新。
3、激活环境
activate tensorflow
4、环境检验
输入
conda info --envs
如图星号对应你的安装目录为成功
5、安装tensorflow
TensorFlow™是使用数据流图进行数值计算的开源软件库。灵活架构允许使用单个API将计算部署到桌面,服务器或移动设备中的一个或多个CPU或GPU。TensorFlow最初是由Google机器智能研究机构的Google Brain团队研究人员和工程师开发的,用于进行机器学习和深层神经网络研究,但该系统普遍足以适用于各种其他领域。
填坑:首先要填坑是因为一个小bug,如果不解决的话,安装tensorflow时出现 “Cannot remove entries from nonexistent file c:programDataanaconda3libsite-packageseasy-install.pth”,因为setuptools版本27.2.0太低,tensorflow要求29.0.1,所以匹配上不兼容,使用以下命令忽略安装的 setuptools版本可以解决。
pip install --upgrade --ignore-installed setuptools
针对GPU安装,输入
pip install --upgrade https://storage.googleapis.com/tensorflow/windows/gpu/tensorflow_gpu-0.12.0-cp35-cp35m-win_amd64.whl
针对CPU安装,输入
pip install --upgrade https://storage.googleapis.com/tensorflow/windows/cpu/tensorflow-0.12.0-cp35-cp35m-win_amd64.whl
6、GPU tensorflow依赖库
前置任务:安装vc_redist.x64.exe
CUDA的正常运行需要VC++环境的支持。
https://download.microsoft.com/download/9/3/F/93FCF1E7-E6A4-478B-96E7-D4B285925B00/vc_redist.x64.exe
GPU tensorflow依赖库有两个,
第一个:CUDA 8.0
https://developer.nvidia.com/compute/cuda/8.0/Prod2/local_installers/cuda_8.0.61_win10-exe
下载后安装。
第二个:cudnn5.1
解压后呈现如上三个文件夹
把这三个文件夹复制到CUDA8.0的安装目录文件夹内,如上图所示。
7、TensorFlow 运行样本测试
简单的矩阵乘法测试
import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
c = tf.matmul(a, b)
#Creates a session with log_device_placement set to True.
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
#Runs the op.
print (sess.run(c))
命令显示GTX1080TI已经被调用。
最终显示白体数字显示该计算成功。
8、点开Anaconda Navigator安装spyder
Spyder是Python作者为它开发的一个简单的集成开发环境。和其他的Python开发环境相比,它最大的优点就是模仿MATLAB的“工作空间”的功能,可以很方便地观察和修改数组的值。
然后就可以愉快的进行样本测量以及程序编程了。
总结
如果你是游戏玩家,拥有一张GTX1070或者GTX1080,那么我觉得你没啥必要去换成1080TI,真话。如果算游戏效能的话,这个升级的CP值不算太高。
如果你有意从事深度学习方面的开发和神经网络训练的课程学习,那么INT8的性能就是你需要看重的一个方面,TITAN XP、TITAN X PASCAL、GTX1080TI的INT8/FP32都是GTX1080以及以下级别显卡的双倍,不差钱的话,CP值最高的GTX1080TI值得选择。
开门查电表
校验提示文案
moonstruck
校验提示文案
节衣缩食买东西
校验提示文案
胳膊酸腿酸
校验提示文案
铭哥威武
校验提示文案
Kevinye
校验提示文案
寒冰之玄
校验提示文案
年轻的大天才
校验提示文案
值友6613270205
校验提示文案
可乐加烟法力无边
校验提示文案
暴走沙丁鱼
校验提示文案
adawong
校验提示文案
OCASANE
校验提示文案
jueze
校验提示文案
逝去岁月
校验提示文案
有卵用
校验提示文案
普罗米修平房顶漏雨
校验提示文案
edisonchan
校验提示文案
fevenor
校验提示文案
loujing
校验提示文案
普罗米修平房顶漏雨
校验提示文案
cool_jz
校验提示文案
ckmrd
校验提示文案
慕柏
校验提示文案
ikownive
校验提示文案
值友1997575333
校验提示文案
Jacoc_zhao
校验提示文案
金击圆弧
校验提示文案
ZEN是十二
校验提示文案
randomaaaa
校验提示文案
xmdt
校验提示文案
[已注销]
校验提示文案
刷房子的喵喵
校验提示文案
郑哥哥
校验提示文案
阿莱克斯塔萨
校验提示文案
098765a4321b
校验提示文案
OCASANE
校验提示文案
纯纯小猛兽
校验提示文案
我为何忍不住剁手
校验提示文案
凡璞归真
校验提示文案