WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

2017-05-22 23:30:33 353点赞 824收藏 127评论

前言

GTX1080TI比GTX1080最大的提升是什么?

1、INT8/FP32的算法提升

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

anandtech放出了一张参数对比图表,其实仔细看是有点问题的,我就从这点问题说起。

FP64:计算双精度浮点运算。

FP32:计算单精度浮点运算。

FP16:计算半精度浮点运算。

INT8:8-bit的整数运算(一个字节),新增的增强8位整数支持是可以在一个周期内, 对打包在32-bit里的4个8位整数(记做:A0A1A2A3), 完成操作:Y = A0 * B0 + A1 * B1 + A2 * B2 + A3 * B3 + X其中Y和X均为32-bit整数, A和B均为8-bit整数.
理论上INT8能以400%的性能(相比于float)完成8-bit整数的点乘和累加操作. 对最近流行的神经网络推导很有用途.

那来看看GTX1080TI GP102的各种运算的比值

FP64:FP32=1:32

双精度运算能力是单精度运算能力的1/32

FP16:FP32=1:64

半精度运算能力是单精度运算能力的1/64

INT8:FP32=4:1

INT8运算能力是单精度运算能力的4倍

GTX 1080 Ti获得了与Titan X相同的4:1 INT8性能比,这对于深度学习的神经网络推理性能至关重要。因此,GTX 1080 Ti实际上具有比Titan X更高的计算性能,除非需要Titan X提供的最后1GB显存,否则GTX 1080 Ti会更加划算,所以除了Titan Xp,GTX1080TI是无敌的存在了。

而1080的INT8是不是如图中NA描述的一点都没有呢?实际上不是的。

GP104 GTX1080

FP64:FP32=1:32

双精度运算能力是单精度运算能力的1/32

FP16:FP32=1:64

半精度运算能力是单精度运算能力的1/64

INT8:FP32=2:1

INT8运算能力是单精度运算能力的2倍

所以除了架构上的CUDA单元区别,对于INT8/FP32的性能增幅,GTX1080TI是GTX1080的两倍。这也是GTX1080TI对比GTX1080最大的提升了,其实游戏这些而言提升真的远不如INT8/FP32的翻倍提升来的明显。

2、CUDA的单元提升

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

GTX1080TI构架

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

GTX1080构架

GTX 1080 Ti提供了超过11.3 TFLOPS的FP32性能,着色/纹理性能比当前的GTX 1080提前28%,而ROP吞吐量优势为26%,内存带宽则大大增加了51.2%。

小结论:所以如果你只是要玩玩游戏的话,其实1080已经足够你玩了,1080TI对比1080的提升游戏不是重点,除非你要玩深度学习,否则你没啥必要从1080换到1080TI的。说道深度学习不得不说到由Python提供支持的领先的开放数据科学平台Anaconda已经支持WIN10 X64了,这解决了过去只能在LINUX下运行的尴尬,也给了大众一个进入深度学习的捷径。

那么我也拿一张索泰的PGF GTX1080TI来晒个单顺便演示下如何在WIN10 X64下进行深度学习平台的搭建。

第一章、开箱

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

索泰(ZOTAC)GTX1080Ti-11GD5X PGF 1569-1683/11010MHz 11GB/352bit GDDR5X PCI-E显卡5899元ZOTAC索泰旗下的PGF OC(玩家力量至尊 OC)显卡是他们目前的最高端产品,主打正反两面的1600色LED酷炫灯光和夸张的供电设计。GTX1080Ti-11GD5X PGF OC供电区域有16+2相供电,基本属于同类产品中供电数最夸张的之一,整卡功耗320W。为了容纳超多的MosFET和电感显京东直达链接查看百科


WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

四面观

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

三年质保

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

型号为ZOTEC GTX1080TI-11GD5X PGF

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

拆箱就是附件盒

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

卡皇本体和显卡支架

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

正面

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

白色的LED灯管,三风扇设计

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

背面使用了带有透明镂空的金属镶嵌塑料的背板设计

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

POWER BOOST芯片

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

ZOTEC的MICROUSB调试接口

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

侧面看厚度是足足的三槽设计,虽然是双槽挡板

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

ZOTEC的LOGO灯

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

双8PIN外接供电

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

3DP 1HDMI 1DVI的IO组合

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

前侧能看到四热管

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

这张卡其实是无比庞大的,单看卡真看不出,我拿出GTX1080公版一对比,就能看出,PGF这卡比1080公版可是粗壮太多了。

第二章、简测

测试平台:

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

CPU:INTEL XEON E5 2696 V3

主板华擎X99E-ITX/AC已刷鸡血BIOS

内存:三星M391A2K43BB1-CRCQ DDR4 2400 ECC 16GBX2

SSD:三星SM961 1TB

显卡:索泰PGF GTX1080TI 11GB DDR5X

散热:金钱豹4U+安耐美白蝠UCCL9

电源:酷冷V850/白色定制硅胶线

WIFI:INTEL 7260 AC

光效

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

关机状态

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

轻载状态:蓝灯

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

满载状态:红灯

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

GPUZ参数

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

3DMARK

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

FIRE STRIKE ULTRA 7009

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

TIME SPY 9578

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

TIME SPY压力测试98.9

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

FIRE STRIKE ULTRA压力测试97.3

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

VRMARK BLUE ROOM 3135

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

VRMARK ORANGE ROOM 3135

温度测试

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

3DMARK FIRE STRIKE ULTRA测试最高温度64度

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

3DMARK FIRE STRIKE ULTRA压力测试最高温度65度

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

甜甜圈拷机了快一个小时,也就63度附近。

但是这不是最搞笑的,搞笑的是在裸奔平台上,除了甜甜圈和3DMARK稳定性测试之外,其他测试显卡满载,风扇竟然是不转的,害我以为风扇坏了。。。。。。这散热貌似做的也太变态了一些,温度确实控制得很低。

FIRESTORM

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

索泰的APP我就装了看了一下,不是超频党也不是游戏党,所以我主动掠过。

第三章、WIN10 X64平台下的深度学习入门搭建

WIN10 X64下搭建深度学习的平台而言,Anaconda For Windows会相对配置简单得多,可作为首选的入门搭建平台推荐,其实Anaconda官网也给了WIN10下的安装说明,但是版本出得太勤快了,版本插件多了兼容小问题也多起来了,别看就那么短短的几行代码,具体执行起来撞头破血流的不在少数,所以我亲测了一个WIN10 X64下的一条龙安装流程仅供参考。

1、安装Anaconda 4.3.1For Windows

Anaconda是由Python提供支持的领先的开放数据科学平台。 Anaconda的开源版本是Python和R的高性能分发版本,包括超过100个用于数据科学的最流行的Python,R和Scala软件包。

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

ANACONDA:https://www.continuum.io/downloads

Anaconda 4.3.1For Windows

Python 3.6 version 64BIT INSTALLER :https://repo.continuum.io/archive/Anaconda3-4.3.1-Windows-x86_64.exe

2、安装Python并且创建环境

Python是纯粹的自由软件,语法简洁清晰,特色之一是强制用空白符(white space)作为语句缩进。具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中[3] 有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。需要注意的是在您使用扩展类库时可能需要考虑平台问题,某些可能不提供跨平台的实现。

使用管理员权限打开Anaconda Prompt

输入

conda create -n tensorflow python=3.5

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

更新输入

y

此时安装进行更新。

3、激活环境

activate tensorflow

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

4、环境检验

输入

conda info --envs

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

如图星号对应你的安装目录为成功

5、安装tensorflow

TensorFlow™是使用数据流图进行数值计算的开源软件库。灵活架构允许使用单个API将计算部署到桌面,服务器或移动设备中的一个或多个CPU或GPU。TensorFlow最初是由Google机器智能研究机构的Google Brain团队研究人员和工程师开发的,用于进行机器学习和深层神经网络研究,但该系统普遍足以适用于各种其他领域。

填坑:首先要填坑是因为一个小bug,如果不解决的话,安装tensorflow时出现 “Cannot remove entries from nonexistent file c:programDataanaconda3libsite-packageseasy-install.pth”,因为setuptools版本27.2.0太低,tensorflow要求29.0.1,所以匹配上不兼容,使用以下命令忽略安装的 setuptools版本可以解决。

pip install --upgrade --ignore-installed setuptools

针对GPU安装,输入

pip install --upgrade https://storage.googleapis.com/tensorflow/windows/gpu/tensorflow_gpu-0.12.0-cp35-cp35m-win_amd64.whl

针对CPU安装,输入

pip install --upgrade https://storage.googleapis.com/tensorflow/windows/cpu/tensorflow-0.12.0-cp35-cp35m-win_amd64.whl

6、GPU tensorflow依赖库

前置任务:安装vc_redist.x64.exe

CUDA的正常运行需要VC++环境的支持。

https://download.microsoft.com/download/9/3/F/93FCF1E7-E6A4-478B-96E7-D4B285925B00/vc_redist.x64.exe

GPU tensorflow依赖库有两个,

第一个:CUDA 8.0

https://developer.nvidia.com/compute/cuda/8.0/Prod2/local_installers/cuda_8.0.61_win10-exe

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

下载后安装。

第二个:cudnn5.1

http://developer2.download.nvidia.com/compute/machine-learning/cudnn/secure/v5.1/prod_20161129/8.0/cudnn-8.0-windows10-x64-v5.1.zip

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

解压后呈现如上三个文件夹

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

把这三个文件夹复制到CUDA8.0的安装目录文件夹内,如上图所示。

7、TensorFlow 运行样本测试

简单的矩阵乘法测试

import tensorflow as tf

hello = tf.constant('Hello, TensorFlow!')

sess = tf.Session()

a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')

b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')

c = tf.matmul(a, b)

#Creates a session with log_device_placement set to True.

sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))

#Runs the op.

print (sess.run(c))

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

命令显示GTX1080TI已经被调用。

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

最终显示白体数字显示该计算成功。

8、点开Anaconda Navigator安装spyder

Spyder是Python作者为它开发的一个简单的集成开发环境。和其他的Python开发环境相比,它最大的优点就是模仿MATLAB的“工作空间”的功能,可以很方便地观察和修改数组的值。

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

WIN10 X64下GTX1080TI 深度学习平台搭建简单教程及晒单

然后就可以愉快的进行样本测量以及程序编程了。

总结

如果你是游戏玩家,拥有一张GTX1070或者GTX1080,那么我觉得你没啥必要去换成1080TI,真话。如果算游戏效能的话,这个升级的CP值不算太高。

如果你有意从事深度学习方面的开发和神经网络训练的课程学习,那么INT8的性能就是你需要看重的一个方面,TITAN XP、TITAN X PASCAL、GTX1080TI的INT8/FP32都是GTX1080以及以下级别显卡的双倍,不差钱的话,CP值最高的GTX1080TI值得选择。



展开 收起

ZOTAC 索泰 GeForce RTX 4080 SUPER OC 月白 显卡 16GB

ZOTAC 索泰 GeForce RTX 4080 SUPER OC 月白 显卡 16GB

8007元起

ZOTAC 索泰 GeForce RTX 4070Ti -12G AMP AIRO 蜘蛛侠显卡

ZOTAC 索泰 GeForce RTX 4070Ti -12G AMP AIRO 蜘蛛侠显卡

6099元起

ZOTAC 索泰 GeForce RTX 4070 Ti - 12GB

ZOTAC 索泰 GeForce RTX 4070 Ti - 12GB

暂无报价

ZOTAC 索泰 GeForce RTX 4070 Ti SUPER TRINITY OC 月白 显卡 16GB

ZOTAC 索泰 GeForce RTX 4070 Ti SUPER TRINITY OC 月白 显卡 16GB

暂无报价

ZOTAC 索泰 GeForce RTX 3060Ti 8GD6 霹雳版 HA 显卡 8GB 黑色

ZOTAC 索泰 GeForce RTX 3060Ti 8GD6 霹雳版 HA 显卡 8GB 黑色

2794元起

索泰(ZOTAC)GeForce RTX 4080 SUPER - 16GB显卡TRINITY OC 月白/PGF游戏显卡DLSS3 RTX 4080 SUPER 16G PGF OC

索泰(ZOTAC)GeForce RTX 4080 SUPER - 16GB显卡TRINITY OC 月白/PGF游戏显卡DLSS3 RTX 4080 SUPER 16G PGF OC

9699元起

ZOTAC 索泰 RTX 4060 8G X-GAMING OC欧泊白 显卡

ZOTAC 索泰 RTX 4060 8G X-GAMING OC欧泊白 显卡

3189元起

索泰(ZOTAC)GeForce RTX 4090D - 24GB PGF独立显卡台式电脑游戏 RTX 4090 D TRINITY 月白 24G

索泰(ZOTAC)GeForce RTX 4090D - 24GB PGF独立显卡台式电脑游戏 RTX 4090 D TRINITY 月白 24G

13399元起

ZOTAC 索泰 GeForce RTX 4060Ti 8GB|16GB绘图AI RTX4060Ti-8GB XG

ZOTAC 索泰 GeForce RTX 4060Ti 8GB|16GB绘图AI RTX4060Ti-8GB XG

暂无报价

索泰(ZOTAC)RTX 4080SUPER-16GB TRINITY OC 月白 4K光追电竞独立显卡台式显卡游戏显卡全新显卡 RTX 4080 SUPER PGF OC

索泰(ZOTAC)RTX 4080SUPER-16GB TRINITY OC 月白 4K光追电竞独立显卡台式显卡游戏显卡全新显卡 RTX 4080 SUPER PGF OC

8488元起

ZOTAC 索泰 GeForce RTX4070 12G X-GM OC 欧泊白 显卡

ZOTAC 索泰 GeForce RTX4070 12G X-GM OC 欧泊白 显卡

5199元起

ZOTAC 索泰 RTX 4070 SUPER X-GAMING OC 欧泊白 显卡

ZOTAC 索泰 RTX 4070 SUPER X-GAMING OC 欧泊白 显卡

5199元起

ZOTAC 索泰 显卡 RTX2060Super 8GD6 毁灭者 HA

ZOTAC 索泰 显卡 RTX2060Super 8GD6 毁灭者 HA

1578元起

ZOTAC 索泰 RTX3060 AMP 月白 12G GOC

ZOTAC 索泰 RTX3060 AMP 月白 12G GOC

暂无报价

【超频游戏利器/支持DLSS 3】索泰RTX4070 Super12G游戏独立显卡

【超频游戏利器/支持DLSS 3】索泰RTX4070 Super12G游戏独立显卡

5049元起

ZOTAC 索泰 GeForce RTX 4060 天启 OC 显卡 8GB

ZOTAC 索泰 GeForce RTX 4060 天启 OC 显卡 8GB

暂无报价
127评论

  • 精彩
  • 最新
提示信息

取消
确认
评论举报

相关好价推荐
查看更多好价

相关文章推荐

更多精彩文章
更多精彩文章
最新文章 热门文章
824
扫一下,分享更方便,购买更轻松