网易首页 > 网易数码 > 正文

前方高能——感受Nvidia Jetson TX1的洪荒之力

0
分享至

(原标题:前方高能——感受Nvidia Jetson TX1的洪荒之力)

从机器学习说起

从2015年起国内外就掀起了机器学习、深度学习的热潮。以google、facebook、BAT等互联网巨头广泛研究应用机器学习以及深度学习技术并在业务方面显现出了良好的效果,尤其是在语音识别和图像识别等领域,而AlphaGo战胜李世石又将大家对机器学习、深度学习的关注推向了新的高峰。现在,在人脸识别、手写识别、语音识别、语意理解、机器翻译、无人驾驶骑车,无人机和智能机器人等代表未来技术的各个领域都有机器学习、深度学习的身影。

"机器学习是研究让计算机无需显式编程即可具有学习能力的学科"(ArthurSamuel,1959)。机器学习以统计学,概率论,组合学和优化理论等为基础,开发并利用算法来识别数据中的模式,由此来指引决策。以机器学习的分支神经网络为例,训练人工神经网络可以看作寻找并确定最优网络参数(例如内部网络权重与倾向),以减小初始数据集上的误差的函数优化问题。但使用数据来拟合模型是一个时间代价高昂的计算过程,它需要使用不同的参数组合反复地调用目标函数,计算训练数据中的每个样本,其算法的时间复杂度约为O(N^2)或者更高(N表示数据的规模),如此一来反复计算目标函数占据了大量执行时间,在这种情况下,可以利用并行计算来缩减运行时间,而并行计算正是GPU的优势,通过将目标函数的计算等过程映射到能执行上百个并行线程的GPU上,往往可以在不需要配置维护大规模服务器机群或多机环境的情况下带来数倍甚至数十倍的性能提升。

根据前文的介绍,JetsonTX1凭借其Teraflops级的浮点计算能力和强大的软件堆栈以及超低得能耗和娇小的身躯足以负载特定场合下的中小规模的机器学习的应用和开发,本文将运用神经网络实现一个经典的异或逻辑来一探JetsonTX1在机器学习领域的洪荒之力。

异或逻辑的神经网络实现

神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。神经网络中最基本的成分是神经元模型(NeuralModel)(又称Logisticunit)。对于人类而言,我们的视觉听觉是由大脑的神经中枢产生。而神经中枢是由大量的神经元相互连接而成。一个神经元通过树突接受其他神经元传来的化学物质(信息),从而改变该神经元的电位,当电位到达某一阙值(threshold)时,该神经元被激活,即"兴奋"起来,从而通过轴突向其他神经元发送化学物质,如图1所示。



  图1生物神经系统中的神经元模型

人工神经元模型便是模拟上述的神经元接受信息并传递信息的过程。如图2所示,人工神经元接收来自n个其他人工神经元传递过来的输入信号,这些输入信号通过带权重的连接进行传递,人工神经元将接收到的总输入值与人工神经元的阙值进行比较,再通过激活函数(activationfunction)处理以产生神经元的输出。


  图2人工神经网络中的神经元模型

由于我们需要实现的异或逻辑并不是线性可分的问题,所以为了实现异或逻辑,我们需要使用神经元搭建含有隐藏层的神经网络,其由三部分组成,分别是输入层(inputlayer),隐藏层(hidelayer)和输出层(outputlayer),如图3所示。



图3一个含有隐藏层的神经网络示意

如上图所示,除了需要大量彼此连接的节点(即神经元),神经网络还需要具备以下特性:

1.激活函数,每个神经元根据激活函数,通过计算处理来自其它相邻神经元的加权输入值。

2.连接权重,它定义神经元之间的信息传递的强度,算法会依靠大量的数据来训练,不断自我调整连接权重。

3.成本函数,用来定量评估计算出来的输出结果于真实值的偏离程度。

4.学习的算法,这是根据成本函数的结果,自学,纠错,最快地找到神经元之间最优化的加权值。

在学习算法方面,目前,有许多流行的库、工具和算法可以用来计算针对多变量函数的最优拟合,同时互联网上也有很多免费许可的数值工具和代码供我们使用,本文将选择使用Nelder-Mead方法,NM方法是一种常见的直接搜索型非线性优化方法,我们可以在互联网上找到JohnBurkhardt创建的一个免费的C语言实现,在这里,我们只需要进行一些细微的调整,就可以用在本次的代码中。

编写完代码后,我们可以选择直接在HOST电脑中编译生成可执行文件,如下图所示。


  图4在HOST电脑上直接编译生成可执行文件

或可以将源码文件直接同步到JetsonTX1,然后在其命令行中通过命令编译生成可执行文件,如下图所示。


  图5在JetsonTX1上直接编译生成可执行文件

这里需要注意的是,用户开发的一些项目可能会用到第三方的库或者工具,如Lapack和Levmar等,如果选择在HOST电脑上完成编译,只需要在HOST电脑上安装配置所需的库和工具,如果用户需要在JetsonTX1上直接编译生成项目,那么同时也需要在JetsonTX1上安装配置对应的库和工具。

程序执行结果和性能

项目成功生成之后,使用"./"在JetsonTX1命令行中运行,得到如下结果:


  图6JetsonTX1异或逻辑单精度运行结果



图7JetsonTX1异或逻辑双精度运行结果


  图8GeForceGT650M异或逻辑单精度运行结果


  图9GeForceGT650M异或逻辑双精度运行结果


  图10Corei7-3630QM异或逻辑双精度运行结果

JetsonTX1运行异或逻辑单精度共用时174.12秒,处理完成0.48GB数据;双精度共用时636.05秒,处理完成0.96GB数据,而与此同时,笔者在笔记本电脑上使用GeForceGT650M运行异或逻辑处理相同数据量单精度共用时201.02秒,双精度共用时435.69秒,而在Corei7-3630QMCPU上运行类似双精度代码共用时5204.50秒,由此也可以看出JetsonTX1与笔记本电脑相比带来的性能的提升尤其是GPU与CPU相比带来的性能提升;同时在这里引用其他人在单路至强E5630上运行类似算法时的平均目标函数运行时间数据:单精度0.45秒,双精度0.54秒;而对应的JetsonTX1的数据则为0.03秒和0.18秒,与单路至强E5630相比,分别由15倍和3倍的加速。仅使用一个嵌入式开发板就能达到这样的性能水平还是十分令人惊讶。


  图11异或逻辑总运行时间对比(单位:秒)


  图12平均目标函数运行时间对比(单位:秒)

本次开发的一些体验

"JetsonTX1的性能令人惊讶

在本次的项目示例中,峰值功耗仅10W的JetsonTX1在性能上完胜了笔者搭载corei7处理器的笔记本电脑,并在类比的数据中,领先于单路E5630,令笔者更深刻的体会到了其1Teraflops计算能力带来的时间效率提升。作为一块嵌入式开发板,确实令人映像深刻。

"NVIDIACUDA提供的示例代码对实际项目的开发帮助很大

由于本次项目中使用了OpenMP中的部分函数,所以在编译时需要配置专门的参数,如-fopenmp等,而NVIDIACUDA示例代码cudaOpenMP中的Makefile示例给笔者提供了极大的帮助,参考其修改本次项目中的Makefile以完成项目的成功编译生成。

相关推荐
热点推荐
刚从美国回来!周鸿祎:卖掉陪伴自己9年迈巴赫600,转投国产智能新能源,友商们谁愿意提供!网友:小米SU7

刚从美国回来!周鸿祎:卖掉陪伴自己9年迈巴赫600,转投国产智能新能源,友商们谁愿意提供!网友:小米SU7

和讯网
2024-04-18 13:34:26
燃气换表导致收费“爆表”?知名编剧发文:人在海南2个月,成都家中产生500多方用气量

燃气换表导致收费“爆表”?知名编剧发文:人在海南2个月,成都家中产生500多方用气量

鲁中晨报
2024-04-18 11:32:05
嘲笑欧洲人用不起天然气的回旋镖飞回来了

嘲笑欧洲人用不起天然气的回旋镖飞回来了

历史总在押韵
2024-04-18 23:30:29
醉汉调戏女孩打家长后续:行拘改刑拘,打人者身份被曝,太显赫了

醉汉调戏女孩打家长后续:行拘改刑拘,打人者身份被曝,太显赫了

飘飘视角
2024-04-19 10:26:47
张本美和4-1战胜孙颖莎好姐妹,轰出11:3、11:2,兄妹齐头并进

张本美和4-1战胜孙颖莎好姐妹,轰出11:3、11:2,兄妹齐头并进

湘楚风云
2024-04-19 12:57:52
舒淇晒照庆祝结婚纪念日,冯德伦布置现场隆重如婚礼,林心如出席

舒淇晒照庆祝结婚纪念日,冯德伦布置现场隆重如婚礼,林心如出席

娱絮
2024-04-19 07:36:42
中方连劝4次,耶伦全都拒不接受,不到24小时,一架专机直飞美国

中方连劝4次,耶伦全都拒不接受,不到24小时,一架专机直飞美国

奇思妙想草叶君
2024-04-18 17:50:29
赖清德欲借郑文灿向大陆示好?丨湾区望海峡

赖清德欲借郑文灿向大陆示好?丨湾区望海峡

直新闻
2024-04-18 22:59:16
刚刚,伊朗回应!全球市场巨震

刚刚,伊朗回应!全球市场巨震

中国基金报
2024-04-19 12:51:48
网传衡阳县一次性缴纳9万元,60岁后可领778元退休金!你会交吗?

网传衡阳县一次性缴纳9万元,60岁后可领778元退休金!你会交吗?

火山诗话
2024-04-19 09:24:22
突发:以色列还击伊朗!

突发:以色列还击伊朗!

近距离
2024-04-19 11:10:15
这瓜……过去这么久,依然很恶心!

这瓜……过去这么久,依然很恶心!

听风听你
2024-04-17 11:28:33
彻底当不成总统了?一觉醒来,美大选或提前结束?特朗普对华表态

彻底当不成总统了?一觉醒来,美大选或提前结束?特朗普对华表态

诉说人世间
2024-04-18 09:31:18
广东省中山市原市委副书记、市长危伟汉被查

广东省中山市原市委副书记、市长危伟汉被查

新京报
2024-04-19 08:35:20
回顾:那个因拍“假老虎”,被判刑2年的陕西农民,后来怎样了?

回顾:那个因拍“假老虎”,被判刑2年的陕西农民,后来怎样了?

可乐88
2024-04-18 08:31:32
一路走好!著名医学教授何金彩去世,享年62岁,死因是肠癌

一路走好!著名医学教授何金彩去世,享年62岁,死因是肠癌

180°视角
2024-04-19 10:33:20
2年净亏超120亿元,2000亿地产巨头面临退市危机!地方政府紧急发声支持,老板是江苏富豪,靠5000元起家

2年净亏超120亿元,2000亿地产巨头面临退市危机!地方政府紧急发声支持,老板是江苏富豪,靠5000元起家

每日经济新闻
2024-04-19 00:47:13
以色列发动“灭门”行动,伊朗态度大变,惊呆了

以色列发动“灭门”行动,伊朗态度大变,惊呆了

世界探索者发现
2024-04-16 22:32:07
震惊!原来1999年,燃气公司就发明了偷气的技术,结果东窗事发!

震惊!原来1999年,燃气公司就发明了偷气的技术,结果东窗事发!

杂谈哥闲谈
2024-04-18 23:41:51
上海一公园餐厅两荤两素盒饭卖123元?涉事餐厅主管企业:是自选盘装菜而非盒饭,墙上明码标价

上海一公园餐厅两荤两素盒饭卖123元?涉事餐厅主管企业:是自选盘装菜而非盒饭,墙上明码标价

极目新闻
2024-04-18 19:48:59
2024-04-19 14:26:44

头条要闻

以色列时隔5天袭击伊朗 伊朗已击落数架无人机

头条要闻

以色列时隔5天袭击伊朗 伊朗已击落数架无人机

体育要闻

安息吧勇士王朝,2013-2023

娱乐要闻

北影节开幕之夜,内娱女星千娇百媚

财经要闻

围猎三丰智能的神秘基金设骗局转移资产

科技要闻

Pura 70卖爆,华为要夺回苹果拿走的一切

汽车要闻

风神L7预售 东风汽车北京车展阵容公布

态度原创

艺术
亲子
旅游
时尚
军事航空

艺术要闻

最全展览单元剧透!北京最受瞩目艺术现场100青年艺术季终极解读

亲子要闻

三儿子家庭到底要怎么教育看看爸爸怎么说

旅游要闻

西宁“下南关”:高原老街的烟火气

到了夏季,一定要试试“清爽感”穿搭!优雅又减龄,越看越美

军事要闻

以军打击伊朗7处目标 伊拉克等地上空出现大量战机

无障碍浏览 进入关怀版
×