处理 SSI 文件时出错
无标题文档
  导航:首页 -> 显卡 -> 新闻 -> 详细内容
无标题文档
别让自己太落伍 CUDA视频软件全攻略
作者:NVIDIA    出自:NVIDIA    2009-7-18   编辑:胖胖熊
无标题文档
在很长一段时间内,视频编码软件Badaboom几乎就成为了Badaboom的代名词,因为这是玩家能够最直接体验到CUDA架构带来翻天覆地变化的软件,后来的Photo Shop CS4虽然也支持GPU加速,不过并不是只支持CUDA,AMD-ATI的显卡同样也可以支持, 那么如今又有多少软件支持NVIDIA的CUDA架构了呢?

Motion DSP vReveal GPU加速视频增强

Cyberlink PowerDirector 7 GPU加速视频后处理

Elemental’s Badaboom GPU加速视频转换器

Pegasys TMPGEnc 4 GPU加速视频后处理

ArcSoft TotalMedia Theatre GPU加速高清倍增

Folding@home GPU加速蛋白质折叠

SETI@home GPU加速寻找外星智能

  其中Badaboom和Folding@home在之前的测试中我们已经有过介绍,SETI@home GPU加速寻找外星智能这个对我们来说有点不太靠谱,今天我们将着重为大家介绍这几款最新的CUDA视频加速软件……


什么是CUDA

  关于这个问题,我们曾在《谁主沉浮 OpenCL与CUDA架构深入解析!》一文中给予了详细介绍,这里我们简单的再回忆一下。CUDA最主要的包含两个方面:一个是ISA指令集架构;第二硬件计算引擎;实际上是硬件和指令集。 也就是说我们可以把CUDA看做是与X86或者cell类似的架构,但是是基于是GPU,而不是传统的CPU。

  这个其实很好理解,把它和传统的和CPU的架构比较下相信就更容易理解,传统X86是包含一套指令集和执行X86各种各样的CPU,对于CUDA也是一样,CUDA有一套指令集ISA,还有执行指令集各种各样的硬件引擎。CUDA到目前为止包含了一个C语言的编译器,当然CUDA架构还可以支持其他的API,包括OpenCL或者DirectX,同时CUDA还会有其他的语言,包括Fortran、Java、Python等各种各样的语言,可以说CUDA架构是原生的,专门为计算接口而建造的这样的一个架构,这种硬件架构包括指令集都是非常适合于这种并行计算,为异构计算而设计的一整套的架构。

  CUDA编程的道理和CPU的编程很类似,比如有了X86的指令集,又有X86各种各样的CPU,那么我们只需要对这个指令集编程即可。X86架构上有各种各样的开发工具,当然也有C语言,Fortran语言,Python语言,Java或者以前的Pascal语言,不论你使用什么语言进行开发,最后还是在X86的架构上执行。CUDA也是一样,有了CUDA的指令集,有了支持CUDA的硬件,我们就可以采用不同的途径来进行开发,比如可以采用OpenCL或者DirectX这样的API,也可以用C语言或者Fortran或者Java开发,最终都可以在CUDA架构上运行。


视频时代到来

  这是一个视频爆炸的年代,在近几年中,国内视频网站攀升之快超出了人们的想象,根据数据显示,国内几大视频网站曾经一度威胁到门户网站排行,而如今作为一个门户类网站,如果没有专门的视频频道,很显然你已经落伍了。在美国,Google旗下的视频网站YouTube仅排名在Google和雅虎两大搜索引擎之下,视频的普及可见一斑。

  如果你经常关注手机、相机这些消费类电子产品的话,那你一定会注意到一个现象,相机和手机在提升像数同时也在宣传自己的摄像能力,即使单反相机这种专业拍摄相片的设备上,也开始注重视频的拍摄功能,从佳能EOS 5D Marks II和尼康D90开始,单反相机的摄影功能就成了新机器的标配,低端佳能EOS 500D和尼康D5000也加入了视频功能,就连最不思进取的宾得也在新品K7中加入了720P摄像功能,从手机到单反,从摄像头到DV/DC,可以视频输入设备目前已经无处不在。

  有了这些视频源,我们就能玩转视频,在优酷、土豆、YonTube、iPhone、高清播放机等网站和终端上播放视频了吗?答案是否定的,因为这些视频源的格式并不统一,我们不能直接上传到这些网站,也无法再终端设备上直接播放,即使终端设备,所能支持的格式也不一样,所以各种针对不同视频的转码软件出现了,这些软件有的可以将模糊的视频变清晰,有的可以将DVD的画质提升到高频品质,有的可以将一个格式转换成另几种不同的格式,这些软件就是我们今天的主角!


CUDA第一弹—BadaBoom

  BadaBoom伴随GT200一起发布,在很长一段时间内一直都是CUDA的代名词,BadaBoom使用RapiHD编码器通过强大的GPU并行运算能力要显著的优于基于CPU的编码器,此编码器已经被著名的的Adobe公司使用在了最新的Adobe CS组件中。另外,RapiHD使用GPU的并行能力可以显著降低电脑成本。通过有效合理的利用了CPU与GPU,RapiHD使最大限度地利用用户的计算机系统。目前RapiHD仅运行于Windows平台,未来将支持Apple的MacOS系统。

  Badaboom的输入格式支持数码摄像机等格式,支持AVCHD和HDV,DVD光盘读取VIDEO_TS文件夹内容或不受保护的DVD光盘,支持ATSC标准电视的录音,上述这些都是用了MPEG2或是H.264编码格式。随着时间的推移,Badaboom将支持更多的编解码器。Badaboom的输出文件支持H.264编解码器,加上立体声音频比特率和满足大多数用户的需求。

  Badaboom支持的MPEG2、AVCHD、H.264、HDV、RAW的视频类型输入,格式上支持也非常丰富,包括M2V(mpg2文件的一种后缀)、M2TS、M2T、MPG、VOB、MPEG、AVI、TS、MTS等等,最大视频输入为1080P,音频输入支持MP2、PCM、Dolby Digital等。输出格式为MP4(H.264),最大支持1080P输出,音频输出格式为AAC-LC。


BadaBoom解析

  Badaboom 1.1版输入及输出格式有了很大改善,不再仅能支持MPEG2以及H.264两大编码且只支持H.264 baseline profile和双声道一种输出格式,1.1版本加入对DivX,Xvid,MpegPEG-1,VC-1,AAC Audio,AVI,MKV格式的输入,输出方面除了原有的格式外,增加了对Youtude、Blackberry Bold、Microsoft Zune的支持,增加H.264 Main Profile格式的输出功能,输出格式终于可以达到1080P了!

  在CPU使用率上,Badaboom对CPU的依赖非常低,因为转码的过程一般都会很长,而如果这时CPU的使用率很高的话,这段时间内我们只能是枯燥的等待,而且过高的CPU使用率也违背了通用计算的本意,过高的CPU也会造成GPU的的任务减轻,GPU通用计算的威力无法发挥出来。

  注:BadaBoom最新版本已经升级为1.2!

画质对比


BadaBoom


AVC

  在《PlushLife》中两款软件转出的视频画质差异是如此的明显,BadaBoom转出的视频色彩艳丽,纤毫毕现,比如毛绒绒玩具身上的毛发,而ATI AVC则丧失了很多细节!


让廉价DV媲美专业—vReveal

  玩DV的朋友可能都有这样的感受,晚上拍出来的视频效果非常的不好,一般都会有严重欠爆的现象,即使是在白天,手持拍摄也难免出现画面抖动的现象,因为谁也不敢保证自己在拍摄时手不晃动,这些视频拍出来之后很难满足我们的需求,而那些以手机拍摄出来的视频效果就更加让人难以接受了。而MotionDSP公司的vReveal就是针对这一现象研发的视频软件,其目的就是让我们的视频变的清晰锐利。

  vReveal使用了《犯罪现场调查》级别的超分辨率技术(super-resolution),加入对NVIDIA CUDA技术的支持,可籍此提速最多五倍。超分辨率技术可提高视频分辨率,并去掉颗粒、色块等视频瑕疵,还能有效增强晃动视频的稳定性。该技术的算法原理并不难理解,就是通过分析连续多个视频帧来重建单一帧画面的细节,直至完整对整个视频的修复和增强。通过上面的介绍大家也应该可以想象,vReveal的运算量会非常大,即使Intel最新的Core I7也不足以支撑即时编码,所以加速了CUDA支持后,凭借GPU强大的运算能力才能保证视频转换快速稳定的进行。

vReveal具备以下特征

一.具备“一键修复”特性,可快速、轻松地增强视频质量
二.采用超分辨率视频增强技术,此项技术源自执法和情报机构所使用的软件,这一犯罪现场调查(CSI)风格的软件由MotionDSP开发
三.凭借支持CUDA的NVIDIA图形处理器,增强视频质量的速度最多可提高五倍
四.从增强的视频中捕捉到具备照片冲印质量的静态图片
五.对歪斜视频进行旋转
六.对每个影像进行剪裁,留住最精彩的时刻
七.对您PC中的所有视频进行自动查找,并通过单一图库进行管理
八.将增强的视频放到“YouTube”,轻松与人分享

  下面我们一起来看一下vReveal这款软件具体的操作方法……


vReveal操作解析

  vReveal操作器材非常的简单,只要把支持的视频格式放到软件中,在根据Enhanc里面的6大选项设置好需要加入的处理效果,注意右边可以直接预览效果,如果想要对比之前的效果,那么只需要点击起始点下面那个按钮即可,最后一步是保存(Share选项),可以保存为本地视频文件或者直接上传到YonTube。

  我们在Tool选项中可以控制CUDA的开启与关闭,下面是GTS250对比Q9550的视频转换效果:


CUDA打开,GTS250可以实时13FPS


CUDA关闭,Q9550只有8FPS

  实测CUDA技术对vReveal的加速是非常明显的,GTS250的成绩可以比Q9550高了近65%。


vReveal转换视频赏析

  说了这么多,相信大家都比较关心vReveal转换出的视频到底是什么效果,下面我们通过视频来看一下。

  由于我们是将其上传到优酷的视频网站上,而优酷会自动压缩视频的质量,所以在这里看起来效果并不是很好,但是也能充分感受vReveal转换后的视频无论在清晰度、亮度、还是防抖方面,对比原文件都有长足的改善。


让标清变高清—TotalMedia Theatre

  接下来介绍的TotalMedia Theatre这款软件也是一款视频增强软件,与vReveal不同的是它针对的不是DV自行录制的小视频,而是针对DVD影片,可以将DVD影片通过倍线技术将画质最高提升到1080P。

  玩高清的玩家对于TotalMedia Theatre并不陌生,在在PowerDVD踏步不前、WinDVD日益没落的今天,TotalMedia Theatre无疑是目前播放高清电影的最好选择。TotalMedia Theatre使用了许多炫酷的功能和选项提高影片效果,这是普通DVD播放器无法比拟的。时尚而简约的界面非常适合初学者;强大又齐全的功能又能满足视频发烧友的需求。除了可以播放正版和自制DVD影片,TotalMedia Theatre还可以播放蓝光光盘光盘、AVCHD、CD、VCD以及各种多媒体文件,包括了QuickTime、RealPlayer、DVD-Ms、WMV HD和H.264 HD视频。

  ArcSoft TotalMedia Theatre完全支持使用蓝光和HD DVD中的下一代音频格式:LPCM, AC-3, DD+和MLP。当然,它也支持Dolby Surround, Digital 5.1 (AC-3)和虚拟扬声器。当您在播放喜欢的音乐时,可以使用10波段均衡器,从预设均衡器中选择,也可以根据您喜好自定义均衡器。

  ArcSoft TotalMedia Theatre使用SimHD插件来进行标清到高清的倍线编码输出,支持NVIDIA的CUDA技术,使SimHD执行密集的后制处理算法也能保持实时播放,这是以前使用CPU进行运算是不能想象的。


TotalMedia Theatre操作解析

  TotalMedia Theatre的操作也不复杂,只要放入DVD光盘后,开始后点击播放键即可,这时我们可在设置中找到视频选项,SimHD插件就在其中,见下图:

   点击“启用ArcSoft SimHD”即可将DVD画质转换成更高的分辨率,我们可以选择开始和关闭CUDA技术,开启后可以把保证即使在1080P也能流畅运行,而如果关闭的话顶级4核GPU也会不堪重负,无法流畅播放。模式选项提供了3个选项,正常模式为转换高清后正常播放画面,拆分模式会将画面分成左右两部分,左边为DVD画质,右边为高清画质;对比模式也是将画面分成两部分,不过于拆分不同的是左右两边播放的画面是相同的画面,而不是将一个画面拆分成两部分。下面的清晰度和分辨率这里就不做解释了,相信大家都能明白。


CUDA打开


CUDA关闭

  模拟1080P打开CUDA后,GeForce GTS 250可以保证25FPS的正常的速度流畅播放,CPU使用率只有12%,关闭CUDA后,使用四核的Q9550也只有9帧,根本无法保证流畅播放,并且CPU使用率也达到了82%。


DVD转换大师—TMPGEnc 4.0

  TMPGEnc也是最先支持CUDA加速的软件之一,TMPGEnc是日本人堀浩行开发的一套老牌的高画质视频编码转换工具软件,最新的TMPGEnc4.0通过NVIDIA的CUDA技术,可以提高4倍的编码速度。

  TMPGEnc 4.0 XPress支持多种视频格式转换和编码,包括MPEG、AVI、WMV、DivX、FLV和DVD视频等。TMPGEnc 4.0是目前公认的转换DVD画质最好的软件,但是视频转码的巨大运算量是让业界非常头疼问题,对于用户来说,最切身的体会就是漫长枯燥的等待时间,而且在这段时间内,我们无法对电脑进行任何操作,等于是浪费了双倍的时间,而借助GPU强大的并行运算能力,则刚好可以解决这一问题,这也是GPU会强势入侵视频领域的重要原因。

  实际上CUDA对于TMPGEnc 4.0 XPress只进行原视频解码和特效滤镜的运算,最终编码运算仍是有CPU来完成,但即使这样我们也能在转换速度上感受翻天覆地的变化,下面我们一起来看一下。


TMPGEnc 4.0解析

  TMPGEnc 4.0的操作并不复杂,但是如果想要开启加载CUDA的却非常复杂,并不是只要在选项中打开CUDA 2.0加速即可,鉴于整个过程太过繁琐,我们这里就不一一介绍了,我们会提供一个PPT供大家下载,里面会有详细的介绍。其中最主要的两步是打开CUDA2.0加速,然后加载滤镜,如果成功最后转码时会有CUDA使用率的提示。


打开CUDA2.0


添加滤镜

  下面我们通过实际截图看一下TMPGEnc 4.0在使用和关闭CUDA的转码时间:


GTX260使用CUDA


Q9550 关闭CUDA

  同样一段视频,采用CUDA后转换时间只有23秒,而使用CPU对这段视频进行同样操作的话,时间却接近4分钟,时间相差了9倍,比NVIDIA官方宣称的速度还要快。


自己做导演PowerDirector 7

  以上介绍的几款软件都是针对转码和视频质量优化的软件,接下来为大家介绍的这款软件就与众不同了,它可以让我们自行剪辑视频,自己做导演,这就是讯连科技的威力导演7.0(PowerDirector 7.0)。

  威力导演是一套制作CD、DVD电影作品的完全解决方案,可让使用者进行截取、编辑、菜单制作、及刻录电影作品于DVD、VCD、SVCD及 MiniDVD光盘,轻松截取影像及编辑影片,同时还拥有独特的光盘制作精灵,让你快速简易地执行影片制作及刻录。同属顶级影片剪辑威力导演 PowerDirector 标准版软件,具备专业级好莱坞影片特效功能,独家之智慧型高速不失真影片输出技术SVRT,可快速编辑处理影片,新增之DV-AVI格式支持,让初学者立刻上手成为专业级的影片导演!

  威力导演是影片制作软件的新里程碑,制作专业的影片/影音光盘,任何人皆可成为创意十足的影音玩家!独特脚本区/时间轴双介面,兼具简易使用与专业精确的优点;首创DV 扫瞄功能,能够快速扫瞄整卷DV影片,截取指定片段,配合最新SVRT 2技术,全面提升影音输出处理速度!除此之外,威力导演还提供了百余种文字、转场特效及前所未见的影片特效,能让您制作出最具特色的影片及DVD光盘!

  PowerDirector 7.0针对GPU进行了优化,同时支持NVIDIA的CUDA和AMD-ATI的Stream技术,并且有些滤镜针对CUDA进行了优化,AMD-ATI则无此优待,下面我们来具体看一下。


PowerDirector 7.0设置解析

  打开PowerDirector 7.0后我们把需要编辑的视频添加视频到软件中,如果无需进行剪辑和滤镜编辑,只需要直接点制作就可以转换为DVD相应格式,如果需要进行剪辑和滤镜编辑,则需要将视频导入剪辑栏,然后加入对应的滤镜和优化。


滤镜,支持CUDA的右下角有NVIDIA LOGO


剪辑栏


最后还会有一个启用GPU视频编码的选项

  根据NVIDIA表示,使用CUDA技术后,在进行视频转换时可以显著降低CPU的使用率:


关闭CUDA CPU使用100%


打开CUDA后CPU使用率显著降低


测试平台介绍及测试

硬 件 测 试 平 台
处理器
Intel Core 2 Duo QX9550(45nm、1333MHz FSB、主频2.8G、L2为12M)
SLI平台
ASUS Maximus Fomula Special Edition(Intel X38+ICH9R,支持PCI-E X8+X8)
散热器
Tt 大台风Big Typhoon VX CL-P0310
显示器

Dell 3007WFP LCD

内存
金士顿Kinston PC-2 6400 DDR2 800MHz 1GB x2
(内存时序:5-5-5-16)
硬盘
WD Raptor 150G SATA HardDisk Driver
电源
TT ToughPower 650W
系 统 平 台 及 驱 动 信 息
操作系统
Microsoft Windows Vista Ultimate
显示驱动
186.16WHQL
催化剂9.6正式版
主板驱动
Intel Chipset Software Installation Utility驱动8.3.0.1013
DirectX版本
DirectX 10.0 API

参测显卡包括:

参测显卡
NVIDIA
AMD-ATI
GTX260
HD4870
GTS250
HD4850
9600GT
HD4830


测试篇:Badaboom

  我们采用BadaBoom最新的1.2版本进行测试,对比的软件是AMD-ATI驱动自带的AVC转码,关于这两款软件的优劣我们在以前的文章中有过详细介绍,这里不再赘述。总体说来,采用CUDA的BadaBoom在保证画质完胜的情况下,在速度上也不输于AVC,参测的3款N卡只有较低端的GeForce 9600 GT败在了参测A卡之下,而3款A卡成绩变化不大,看来有消息指出AVC实际上是打着GPU加速名义,实际上是使用CPU进行转码的软件并不无道理!


测试篇:vReveal

  vReveal测试中我们使用一段自行录制的视频进行转码测试,其中加入了vReveal所提供的全部6种滤镜,由于AMD-ATI的显卡并不支持GPU加速,实际上他们的成绩是Q9550 CPU的运算成绩。高端的GeForce GTX 260成绩已经接近A卡平台的两倍。


测试篇:TMPGEnc 4.0

  这里的A卡平台成绩实际上仍是Q9550处理器的成绩,因为A卡目前并不支持TMPGEnc 4.0的加速,我们这里的测试成绩是来自于专门为NVIDIA CUDA进行优化的滤镜,因此N卡成绩会比较夸张,达到了A卡平台的8~10倍。


测试篇:TotalMedia Theatre3

  TotalMedia Theatre3测试的是将DVD转换为1080P高清时的实时帧数,即使最低端的GeForce 9600 GT也可以保证25帧的最高播放速度,而AMD-ATI平台则只有可怜的个位数,无法正常观看。


测试篇:PowerDirector 7.0

  PowerDirector 7.0虽然官方说明也支持AMD-ATI的Stream技术,但是我们在实际测试中并不能打开,而且也没有关门针对Stream的滤镜,因此A卡平台实际上所花费的时间仍旧是来至Q9550处理器。此项测试我们选择的是一段H.264编码的影片进行高斯模糊处理,最后N卡平台毫无疑问的胜出,最高可领先A卡平台3倍以上。


写在最后

  实际上还有一款Super LoiLoScope “Mars”软件也同样支持CUDA,这是一款GPU转码加速软件,不过由于个人原因最后我也没有能搞明白这款软件,虽然最后Loilo Inc.公司给我发来了正版序列号,但是实际测试中GPU加速效果并不明显,因此这款软件没有出现在本文中,在此仅代表小熊在线显卡频道对Loilo Inc.公司的大力支持表示感谢。

  视频已经成为了除游戏外NVIDIA与AMD-ATI、GPU与CPU之间的第二战场,通过今天的5款软件实测,NVIDIA的CUDA在视频领域的贡献是有目共睹的,无论是视频转码的BadaBoom、TMPGEnc,还是视频优化的vReveal、TotalMedia Theatre以及视频编辑的PowerDirector 7.0,CUDA已经无处不在,深入视频的每一个领域,不在是当初BadaBoom孤军奋战的局面。

  最后到显卡的选择上,这里我们去探讨游戏方面N卡强还是A卡强,只就视频能力而论,AMD-ATI还有很长的路要追赶NVIDIA,如果你想享受最顶级最清晰的视频效果,如果你想在转换和女朋友一起旅游的DV录像时,还能和女朋友一起聊天,如果你不想因为自己并不优秀的视频摄制效果而被女朋友敲脑袋,如果你不想因为自己制作的视频太过于普通而没人顶你,那么答案只有一个,选择一块支持CUDA加速的显卡……


无标题文档

本文共有 条评论,点击查看读者的评论!

[发表评论]  姓名:   查看大家的评论

广告
 报价查询
 
处理 SSI 文件时出错