新闻  |   论坛  |   博客  |   在线研讨会
NVIDIA的H.264高清晰视频硬件解决方案
luker | 2016-02-02 16:21:20    阅读:1803   发布文章

1 硬件加速支持,并且需要加上微软的WMV9视频DXVA加速补丁(这个补丁在2005年正式推出)。

  说了这前面的一通视频硬件加速,和您有什么关系呢?其实在90年代中VCD概念尚未被大多数人获知的时候,市场上已经有Sigma Design公司推出的VCD加速卡。当时的显示卡顶多就是集成了一个二维图形用户界面加速器再加上一个帧缓存控制器,缺乏视频加速功能,因此在电脑上观赏视频节目普遍依赖于CPU。

  然而在90年代中期的x86 CPU时钟频率最高也就是133MHz左右,缺乏多媒体指令集扩展,即使是应付今天看来画面细小的VCD(基于MPEG-1编码),依然是力不从心,这也就是当时市场上出现的VCD加速卡原因。

  到了DVD推出的时候,由于CPU指令集的扩展和频率提升,再加上不少显示卡已经具备硬件Overlay、运动补偿、色彩转换等功能,在电脑上播放分辨率比VCD高一倍的DVD已经不再需要外加独立的DVD加速卡了(当然市场上也有这样的产品销售,但是基本上是乏人问津而且就算购买也只是看重其视频输出能力,后来这样的功能也都被集成到显示卡上了)。

  到了2004年,由于日本、韩国、美国等发达国家的高清晰广播开始普及,一些电影发行商业推出了高清晰视频的DVD影碟,人们一下子发现,原来津津乐道了5、6年的标准分辨率(即720*576)DVD影片在高清晰影片面前显得多么的粗糙。



网络传输带宽需求。

  DVD碟的下一代——蓝光碟(Blue-Ray Disc)能提供至少23GB的空间,而未来两年的硬盘也应该会是300GB为主流,因此如果采用恒码率MPEG2的话,存储媒介方面其实问题不大。

  但是网络带宽方面则显然不是这么一回事,目前的ADSL下载带宽上限为8~12Mbps,但是实际应用中也不过是2Mbps,而且能达到2Mbps是不常见的。下一代的宽带技术应该是ADSL2 ,下行带宽上限是24Mbps,不过从目前的ADSL实际应用看,24Mbps恐怕没有多少用户能享受到,能有1/3就很不错了。所以对于HD视频来说,必须采用比恒码率MPEG2更高效的压缩编码技术才能在未来的网络应用中让用户真真正正地享受到流畅的欣赏体验。

  然而可怕的事情来了,业界(下一代DVD的两个阵营以及DVB-S2)对于高清晰视频的压缩标准采取了有点模棱两可的态度,DVD标准制定组织DVD Forum居然接纳了VC-1(WMVx的纯算法版)、H.264、MPEG2三种压缩标准,这对于上游厂商或者说标准制定者来说,有点皆大欢喜的味道,但是对于芯片厂商来说则是比较痛苦的:他们必须以最小的代价把三种标准的解决方案集成到同一枚芯片中,因为众多的节目内容商采用的编码方式肯定不会都只有一个。

  不过这不光是三个标准的技术实现问题,而且还包括三个技术的权利金以及台底下的角力(例如VC-1编解码器开发程度),纵然芯片厂商有能力把三个技术马上集成到同一枚芯片中,但是标准、授权制度制订的拖沓,往往会导致产品迟迟无法出台。

  H.264和VC-1在技术上比较接近,但是VC-1的前途由于是来自微软推荐的,而微软过去在DOS->Windows以及其他一些事情上曾经表现出来的蛮横/封闭性做法曾引起过大家的强烈不满,因此在业界对推动H.264显得更加积极。

  和ATI在2005年第二季度就公开演示H.264解决方案不同的是,NVIDIA在H.264上的宣传要似乎低调的多,业界对于NVIDIA这样保守的做法也感到比较纳闷,甚至有人对NVIDIA能否提供H.264硬件解码加速表示怀疑。

  ATI这边则在2005年12月18日发布了催化剂5.13驱动,这个驱动提供了H.264的DXVA(DirectX视频加速)支持,配合Cyberlink于稍后(12月23日)发布的CyberLink ATI专属 H.264编码套件,可以在RADEON X1000系列上提供硬件H.264视频加速播放。

  比较奇怪的是,ATI的H.264解码加速方案根据产品级别而划分成:1080需要X1800/X1900系列,X1600最高只能支持720p、X1300最高只能支持480/576。这是一个有些矛盾的划分方式,因为拥有X1800系统的用户,CPU等级也应该不弱,甚至可能是双内核的,这类用户即使使用软件解码方案播放大多数的1080 H.264视频也应该是能胜任的。

  最需要H.264硬件解码的本应该是购买X1300、X1600价位的用户群,这些用户群大都是低、中端系统,搭配的处理器主要是单内核、3GHz P4或者跟慢等级的单内核处理器,如果能实现1080、720p硬件H.264解码加速能很大程度上改善其欣赏体验,我们希望这只是软件上关闭了对应的支持,如果这样的话,未来X1600/X1300用户还是有机会欣赏1080分辨率的H.264视频。



硬件加速支持,并且提供相应的H,264 DXVA驱动和播放器下载,PCINLIFE在此提供第一手的测试报告,让大家先睹为快。

  NVIDIA表示,该公司提供的H.264硬件加速方案主要有以下特点:

  1、nForce 6150芯片组提供了目前唯一的集成图形芯片组硬件H.264解码加速;

  2、包括GeForce 7300、6600、6800、7800系列以及未来的图形处理器都提供了H.264加速;

  3、拥有目前效率最佳的H.264加速效果。

  H.264之所以被看重,首先是因为它只需要MPEG2一半的码率就能提供MPEG2相当的品质,这意味着宝贵的传输带宽和存储空间成本降低了一半;其次,H.264提供了比MPEG2更丰富的品质提升特性,包括6tap过滤实现1/2像素明亮度取样、运动补偿精确到1/4像素、环路解块、支持YUV 4:2:2和4:4:4等高色彩精度、采用YCgCo而非YCbCr色彩转换空间减少取样误差(后者难以采用浮点系数和取整)。

  现在日本的主要广播公司例如NHK、东京广播系统、东京电视台、日本电视网、朝日电视台、富士电视台都有采用H.264,美国的DirectTV、Dish Network、欧洲的Euro1080;德国的Premiere、ProSieben HD、Sat1 HD以及英国的BSkyB等直接卫星广播电视节目服务也都采用H.264。

  由于微软目前还没有提供H.264解码的DXVA界面,因此NVIDIA在其驱动中提供了一个专有的DXVA界面,透过这个界面以及专门编写的解码器就能调用NVIDIA的硬件预测以及解块加速。NVIDIA提供了一个支持NVIDIA H.264 DXVA加速的解码器清单,它们是PowerDVD 6 AVC 2.0、WinDVD 7.5以及Nero ShowTime 2升级版。

  NVIDIA表示,实际上支持NVIDIA H.264 DXVA的播放器不会只有这三个,实际上只要是支持DXVA并且依照NVIDIA指示编写的解码器,都能获得H.264加速,例如最近比较热门的CoreAVC开发人员就表示会商业版中提供GPU的支持,因此我们也许能看到支持NVIDIA的CoreAVC解码器。

  在具体的H.264支持能力上,NVIDIA表示目前的GeForce 6200、7300、6600、6800、7800系列都提供了H.264 DXVA,其中GeForce 7300、6600、6800、7800系列全部能支持1080p H.264。针对低端入门市场的GeForce 6200最高具备h.264 720p硬件加速,也要比ATI同级别的RADEON X1300要好得多(X1300按照ATI官方规格,对H.264的支持只能达到标清的水平)。

  针对整合图形的GeForce 6150也提供了H.264的加速支持,能加速的分辨率为720p,同级别的Intel、ATi以及其他整合图形芯片组厂商提供的产品目前都完全没有H.264加速的支持,如果你准备搭建基于整合图形的HTPC,那么nForce 6150的确是你的首选。



驱动以及来自Cyberlink的PowerDVD 6,这个PowerDVD6的版本号为060119-01。

  要想获得硬件加速,就需要按照上面的设定,把Enable hardware accelerATIon前面的选框点选上。

  在播放H.264(AVC)的时候,你打开配置->Infomaton(信息)标签,可以看到Video Accelerator已经启用(in use)。

  我们使用Ahead公司提供的TheGreatestGame_HD_AVC.mp4以及苹果公司提供的serenity_m1080p.mov片段进行H.264 CPU占用率测试。

  在测试中,我们发现在PowerDVD播放器中的CPU占用率明显要比在其他播放器中调用PowerDVD H.264解码器来播放低一些,而这个解码器无法在ATI RADEON X1000上启用加速。这意味着,如果想要公平的比较,在这个版本PowerDVD上的测试只适合于NVIDIA系的产品,如果想要和ATI产品比较,就需要在其他播放器上跑NVIDIA产品来比较。



声卡,CPU负责AAC解码:


TheGreatestGame_HD_AVC.mp4

  X轴为播放的时间点,Y轴为该时间点上的CPU占用率。

  我们测试的GeForce 6600是来自技嘉的GeForce 6600静音版,注意,测试包括了该卡打开/关闭硬件加速的占用率。



硬件加速,对CPU占用率的影响是相当大的,换句话说,就是NVIDIA的H.264加速的确能提供立竿见影的性能提升效果。

  其中The Greatest Game在打开之前的CPU占用率有多次达到100%,这意味着CPU已经满负荷运转,此时比较容易出现丢帧、声音跳跃的问题,而打开硬件加速后,参加测试的4款都达到了最高80%、平均低于50%的CPU占用率,CPU还能留有一定的余地处理其他事务。

  Serenity的测试结果也表明打开关闭硬件加速的CPU占用率差别非常明显,打开硬件加速前,CPU占用率峰值接近90%、平均高于6%,而打开后峰值只是略高于50%、平均在40%的水平。



CPU占用率测试

  我们采用了KMPlayer、Media Player Classic、Windows Media Player 10进行比较,其中WMP10能直接调用PowerDVD H.264/AVC解码器播放,但是没法设定;MPC和KMP都能调用出PowerDVD H.264/AVC解码器并作DXVA的开关设定,我们把开关都设定了在打开硬件加速状态。测试的时候,四个播放器都采用了Overlay渲染层以获得最佳的效能,KMplayer提供了superspeed模式,我们也打开了该模式。

  从测试结果来看,PDVD播放器和KMP基本上同样的性能表现,而WMP10和MPC则表现类似都逊色于Power DVD播放器或者KMPlayer。

  在使用上,这三个比较的播放器最容易使用的是WMP10,你无需任何设定就能播放H.264文件不过有时候你需要把文件更名为.mp4。KMP和MPC的易用度各有千秋,我喜欢KMP,因为它提供了非常实用的设置复位功能,多得它我才不会遇到MPC有时候莫名其妙的设置失效问题,尽管我已经非常熟悉MPC的使用:)

  关于播放器,我还想说一句,不要使用那些需要往系统安装那些捆绑了一大堆不同厂牌、版本codec的播放器——正所谓请神容易送神难呀。



ATI RADEON X1000播放H.264的比较

  很遗憾的是,我们无法在测试平台上让RADEON X1600播放1080的H.264视频(但是可以播放720p的),我们想着可能是ATI关闭了RADEON X1600的1080 H.264播放能力。

  我们使用了RADEON X1900XTX和GeForce 7800 GTX来比较,在这里提醒一下大家的是,我们之前的测试证明,GeForce 6600也能获得和GeForce 7800GTX同样的CPU占用率成绩。

  此外,ATI卡无法在NVIDIA提供的PowerDVD6上启用硬件加速(但是可以播放)。因此我们重新安装了干净的系统并安装Cyberlink H.264 ATI版解码器,该解码器无法在NVIDIA卡上调用(因此无法播放)。

  由于ATI版的PowerDVD H.264解码器并没有捆绑自己的播放器,因此我们在此使用了多个播放器作比较,当然除了WMP10不能找出设定办法外,MPC、KMP我们都透过过滤器属性设置打开了DXVA选项。

  和ATI比较的图表中有一个现象,那就是ATI的CPU占用率线比NVIDIA多了几秒才下摆为0,通常这是关闭文件由于分离器或者是帧速率低于影片额定速率造成的。

  从测试结果来看,在播放The Greatest Game的时候,NVIDIA的优势相当明显,ATI多次触顶(100%)。而在Serenity中,大家的成绩相对比较接近,但是ATI配合KMP的成绩出现更高的CPU占用率。

  (我们在不同的播放器测试中,已经确认过NVIDIA/ATI调用的分离器都是自己所属解码器/播放器的分离器)



硬件加速的效果依然明显,特别是The Greatest Game中,和2.6GHz关闭硬件加速相比,CPU占用率的差别非常明显,即使是1.6GHz性能也明显优于2.6GHz关闭硬件加速。



显示器的新标准,但是目前来看HDMI正有成为家庭影院的标准视频/音频标准趋势,在板卡上引入HDMI能够提高产品在家庭影院或者媒体中心方面的吸引力,不过目前市场上这样的产品还不多见,这是为什么呢(例如版权保护规格、BD/HD DVD推出时间、HDMI终端装机量等等)?

  回答:HMDI目前主要在数字家电中应用,在PC上也有开始大量采用的趋势。不过目前这样的应用还处于早期应用的阶段,因此市场上相应的产品并不很多。不过NVIDIA已经有HDMI参考设计提供给我们的客户,一些客户已经采用并且推出相应产品,比如Sony VGX-XL1 Digital Living System就是采用了GeForce 6200 HDCP/HDMI的方案并在CES上发表。

  NVIDIA的HDMI显卡解决方案参考设计也提供给了我们的显卡AIC,预计不久后就会有相应的产品出现在市场上。

  2、按照1月初HDMI.org的一份新闻稿,7家HDMI标准创始公司宣布制定一个具备48bit颜色、Dolby TrueHD and DTS-HD、迷你接头的新HDMI标准,并且会在2006年上半年推出这个标准,在图形方面你们目前的产品是否已经具备对应的支持呢?

  回答:你所说新的HDMI标准目前还处于标准制定的阶段,因此说到具体的产品还言之尚早。

  3、日前出现了关于HDCP版权保护的争议,主要是指目前的零售显示卡产品实际上缺乏HDCP,这意味着购买了含HDCP的正版影音产品用户可能无法在这些卡上尽情欣赏HDCP节目,你们对此的看法是怎么样的呢?

  回答:要播放HDCP的视频包含多方面,首先是HDCP保护的节目,支持HDCP的操作系统,支持HDCP的输出设备和支持HDCP的显示设备。目前这个阶段整个生态并不完善。估计今后支持HDCP的设备会越来越多。

  4、对应HDCP的零售显示卡在盗版比较严重的地区是否会受到盗版影响而担心销量问题呢?

  回答:具备HDCP的显卡和普通的显卡在其他功能上没有任何区别,因此即使不使用HDCP的功能,也可以和一般的显卡一样使用。

关于H.264以及VC-1的问题

  5、你们目前的产品哪些是具备H.264解码加速协助能力的呢?

  回答:目前NVIDIA所有GeFoece 6和7系列显卡具备的的PureVideo都支持H.264的硬件加速。除此以外,GeFoece 6150图形主板也可以支持H.264的硬件加速,这是唯一的一个支持H.264的整合图形处理器。

  在支持的能力方面,目前GeForce 6/7系列的中高端显卡(6600以上)均可以支持到1080p,而主流和整合的显卡可以支持到720p的加速。这一点上,我们比我们的竞争对手领先很多。

  6、有些网友提出硬件解码加速协助不算是真正的硬件解码,是这样的吗?

  回答:任何硬件解码都需要CPU参与工作,其中的区别是硬件加速带来的性能提升能有多少,能否在用户的平台上获得流畅的视频播放效果以及能否提供额外的后处理效果。对于H.264高清晰度视频来说,NVIDIA的显卡可以提供极高的加速能力,在很多情况下,通过硬件加速,可以将解码性能提高达2.5倍之多。这是业界目前最好的水平。

  另外,NVIDIA的PureVideo也是唯一能够支持HD后处理的视频解决方案,我们的中高端显卡能够支持HD视频的Inverse Telecine(3:2 pulldown) 和SpATIal-Temporal De-Interlacing的功能,这也是业界唯一的。对于最终用户来说,在PC上利用PureVideo的强大视频处理能力,可以流畅地播放各种HD视频和光盘内容,可以获得最佳的视频回放品质,并且将CPU的占用率保持在较低的水平,这就达到了视频硬件加速的目的。

  7、我们知道,H.264有多个profile以及level,目前你们支持H.264的产品能达到多高的profile和level解码能力呢?

  回答:H.264规范中Profile和level包含定义编码比特率和算法以及相应参数。简而言之, PureVideo H.264可以支持到1080p视频,这也是目前得到广泛应用的最高分辨率的视频。具体在bitrate方面,我们的PureVideo支持到25Mbps的视频。

  8、VC-1也被批准被下一代高清晰视频的编码标准,你们目前的产品能提供提供对应的硬件解码加速支持吗?有哪些产品具备呢?

  回答:VC-1也是HD-DVD和Blue-ray两大阵营的强制性标准之一(另外还包括H.264和mpeg-2)。对于VC-1的支持我们会在06年第二季度的驱动程序中实现,目前所有GeForce6/7系列的显卡均可以支持。目前根据我们的测试,NVIDIA的PureVideo可以将VC-1解码的性能与纯CPU解码相比提高2.5倍之多。

*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

参与讨论
登录后参与讨论
推荐文章
最近访客