视频会议系统的主流解决方案与技术趋势
视频会议系统的关键技术
视频会议系统传输的是多媒体数据,声音和动态图像的源信号的数据量较大,无法在一般条件的数字线路上传输。同时,基于对实际使用效果的要求,要求传输的声音、图像信号连续平滑,其他辅助功能易于使用。因此,对系统在声音/图像压缩、通讯线路条件、数据/应用程序共享等方面都有很高的技术要求。本文将从目前视频会议的主要技术、解决方案及未来技术趋势、网络技术标准等方面进行探讨,希望为该领域的研发人员提供参考。
1)多媒体信息处理技术
多媒体信息处理技术主要是针对各种媒体信息进行压缩和处理。视频会议的发展过程也反映出信息处理技术特别是视频压缩技术的发展历程。目前新的理论、算法不断推进多媒体信息处理技术的发展,进而推动着视频会议技术的发展。特别是在网络带宽不富裕的条件下,多媒体信息压缩技术已成为视频会议最关键的问题之一。
与基于PC机的CPU技术、基于专用芯片组技术相比较,媒体处理器因为具有特有的数字视音频输入输出接口、多媒体协处理器等使应用变得更加简单,而且设备厂家可以根据市场变化随时进行软件应用的调整,及时适应市场需求,而不会受制于专用芯片组本身的技术限制。媒体处理器支持的嵌入式操作系统以及软件优化,使 视频会议系统 更加高效、稳定、可靠。媒体处理器技术事实上已经成为视频会议的核心芯片技术,将来还将服务于3G可视手机等终端产品。
在 视频会议系统 中,目前的媒体处理器主要有:Philip公司的TriMedia系列及新品PNX1500、美国ESS公司的LVP、 ADI公司的ADSP2106X器件及Blackfin处理器、TI公司的C6X、C8X以及新推出的DM642多媒体DSP芯片,这些媒体处理器高速的运算能力可以实现适合不同协议的视频会议通信终端。采用这些芯片可以很方便地实现MPEG视频和音频处理、H.263视频处理,还可以实现其它的多媒体应用如DVD、数字机顶盒、数字电视等。
2)宽带网络技术正在迅速发展的IP网络,由于它是面向非连接的网络,因而对传输实时的多媒体信息而言是不适合的,但TCP/IP协议对多媒体数据的传输并没有根本性的限制。目前世界主要的标准化组织、产业联盟、各大公司都在对IP网络上的传输协议进行改进,并已取得初步成效,如 RTP/RTCP、RSVP、IPv6等协议。为在IP网络上大力发展诸如视频会议之类的多媒体业务打下了良好的基础。据预测,IP网上的视频会议业务将会大大超过电路交换网上的视频会议业务。
Internet的网络规模和用户数量迅猛发展,如何进一步扩展网上运行的业务种类并提高网络的服务质量是目前人们最关心的问题。由于 IP协议是无连接协议,Internet网络中没有服务质量的概念,不能保证有足够的吞吐量和符合要求的传送时延,只是尽最大努力(Best- effort)来满足用户的需要,所以如果不采取新的方法改善目前的网络环境,就无法大规模发展新业务。
在现有的网络技术中,从支持QoS的角度来看,ATM作为继IP之后迅速发展起来的一种快速分组交换技术具有得天独厚的技术优势。因此 ATM曾一度被认为是一种处处适用的技术,人们最终将建立通过网络核心便可到达另一个桌面终端的纯ATM网络。但是,实践证明这种想法是错误的。首先,纯 ATM网络的实现过于复杂,导致应用价格高,难被大众所接受。其次,在网络发展的同时,相应的业务开发没有跟上,导致目前ATM的发展举步维艰。第三,虽然ATM交换机作为网络的骨干节点已经被广泛使用,但ATM信元到桌面的业务发展却十分缓慢。
由于IP技术和ATM技术在各自的发展领域中都遇到了实际困难,彼此都需要借助对方以求得进一步发展,所以这两种技术的结合存在必然性。多协议标签交换(MPLS)技术就是为了综合利用网络核心的交换技术和网络边缘的IP路由技术各自的优点而产生的。其特点如下:
(1) 基于单一的转发机制,可在同一网内同时支持多种业务类型的转发;(2)通过短小固定的标签,采用精确匹配寻径方式取代传统路由器的最长匹配寻径方式; (3)通过集成链路层(ATM、帧中继)与网络层路由技术,解决了Internet扩展、保证IP QoS传输的问题;(4)利用显式路由功能同时通过带有QoS参数的信令协议建立受限标签交换路径(CR-LSP),因而能够有效地实施面向全国的流量工程。目前MPLS技术在QoS标签分配信令、解决VC合并、传输分类业务等许多方面还存在很多难点,需要进一步完善。
3)分布式处理技术视频会议实现点对点、一点对多点、多点之间的实时同步交互通信。 视频会议系统 要求不同媒体、不同位置的终端的收发同步协调,多点控制单元(MCU)有效地统一控制,使与会终端数据共享,有效协调各种媒体的同步传输,使系统更具有人性化的信息交流和处理方式。通信、合作、协调正是分布式处理的要求,也是交互式多媒体协同工作系统(CSCW)的基本内涵。因此从这个意义上说, 视频会议系统 是CSCW主要的群件系统之一。
主流媒体处理器解决方案
随着多媒体技术的广泛应用,采用DSP芯片设计多媒体设备,成为人们关注的方向。但是,对于可编程的媒体处理器的需求也很高。因为多媒体信号处理技术处于一个高速发展的阶段,各种国际标准共存,新标准不断涌现。例如,仅视频压缩编码,就有多种国际标准:H.261、H.263、MPEG1、 MPEG2、MPEG4和新的H.264等。在一个网络上传输的可能是多种不同标准的码流,而且对于一个设备而言,也要不断更新视频编码技术。
例如一个早期的视频会议设备采用H.261编码视频,在H.263出现后,最好是改用H.263标准,而且也许很快就会采用H.264 作为视频会议的编码标准。这就存在两个要求,一是设备的更新换代,二是多种标准的转换。对于用固定的专用芯片实现的设备,这两条都难以达到。但如果采用 DSP作为核心处理器,只需更新软件就可以达到第一个要求,增加部分功能软件,可以适度满足第二个要求。
正是考虑这种需要,一种新型的DSP芯片-媒体处理器(Media Processor)应运而生,并很快得到业界的广泛关注。飞利浦、ADI、TI等半导体供应商都十分看好媒体处理器市场,并推出了具有竞争力的产品。高处理能力芯片的出现给视频会议带来更小的延迟和更高的帧频。例如TI公司的TMS320 DM642、飞利浦的Trimedia和Equator的MAPCA,它们集成了丰富的多媒体信号接口,针对多媒体信号的特点优化了处理器结构,甚至内嵌了特殊协处理器用于进行专门操作,缓解通用处理器的压力,例如视频编码中的变长编解码(LC/VLD)。
媒体处理器提供了完全可编程的多媒体设备的实现工具。媒体处理器继承了通用DSP芯片的特点,针对多媒体应用扩充了各种接口功能,优化了中央处理器结构。尽管媒体处理器出现的时间不长,但已得到广泛关注,可以预见媒体处理器将会快速应用到多媒体设备制造业中。
中星微电子公司的多媒体芯片SoC平衡了集成度、灵活性、成本和功耗等多方面要求。目前其应用于 视频会议系统 中的多媒体芯片产品有 VC0301P、VC0302和VC0321。该公司的副总裁俞青介绍说,中星微电子的多媒体芯片可以支持目前主流的各种音频和视频算法, 并支持从无线多媒体到高端视频会议等一系列应用。在PC平台上,中星微电子与微软合作,最近推出基于USB2.0的视频即时通讯系统,使视频质量和系统稳定性上了一个新台阶。
针对视频会议等多媒体应用,飞利浦推出数字媒体处理器PNX1500,这是一款系统级芯片(SoC)。据飞利浦半导体公司高级媒体处理组市场总监Jan Koene介绍,“最新产品Nexperia PNX1500在运行控制任务以及数字信号处理任务方面具有出色的能力,而这两方面都是 视频会议系统 所要求的。可以在单片PNX1500上运行这两个任务,而在效率相同的情况下,这对竞争方案而言是难以实现的。通过在PNX1500上合并硬件模块,例如视频I/O、音频I/O和通用接口,可以降低BOM 成本。因为所有的音视频编解码功能都是用软件实现的,所以飞利浦的产品很容易适应新的标准,例如H.264。”
TI 的新型数字媒体处理器TMS320DM642带有三个视频口,均可输入或输出,支持BT656、百兆以太网口、多路音频串口、66MHz PCI等等,可支持四路D1图像,30帧/秒的MPEG-2的实时压缩。TI 的数字媒体处理器不仅能够以 Microsoft WMV9 格式提供高清晰视频流,而且还能够提供 MPEG-4、MPEG-2 以及 MPEG-1。此外,该器件还支持H.264。
TI公司半导体事业部高级业务代表郑小龙表示,除了提供 720 MHz DM642 的样片之外,目前 TI 还为 DM640 与 DM641 以及 600 MHz DM642 提供批量生产的器件。这些代码兼容的数字媒体处理器可扩展各种时钟速率及存储器容量,能够支持广泛的应用,例如从基于视频的便携式消费类电子产品到视频基础设施设备等。
微软公司 Windows Media 技术部副总裁 Amir Majidimehr 说:“对于 Windows Media 9 编码器与解码器而言,TI 的 DM642 是第一款成功通过 D1 清晰度条件下一致性测试的可编程 DSP。TI 的新型 720MHz DM642 有助于将 HD WM9 集成到各种具有代码兼容与可编程性能的嵌入式消费类应用中。”
ADI的Blackfin是一种高性能、双乘加器(MAC) DSP,具有微处理器性能,诸如监督和用户模式、存储保护、8-/16-/32位算术及多媒体处理扩展。Blackfin处理器既能作为主要的音视频处理器,又能用作图形用户界面(GUI)和网络处理的主处理器。Blackfin是完全可编程的。因此可以很容易地支持新标准,而无需改变硬件平台。例如 ADI可视电话平台中的Blackfin处理器能够支持H.264,这是通过软件升级来实现的。
据ADI公司软件和系统技术部产品行销经理Dan Ivanciw介绍,Blackfin处理器架构经过优化,能很好地执行控制和数字算法,可以作为主处理器和音视频处理器。“设计人员无须采用多个不同的处理器、不同的开发环境及不同的工具包,无论是正在开发典型主功能代码还是高级音视频编解码,采用Blackfin,开发团队只需要掌握一种编程方法、指令系统、开发工具环境。用户也会得到益处:缩短产品面市时间,削减开发成本,降低开发风险,提高IP复用性。”
在多媒体信号处理领域,特别是在视频处理方面,通常要求数字信号处理器具有针对多媒体应用的、优化的内核结构和丰富的媒体接口,而通用信号处理器在这方面性能得不到充分发挥。鉴于此,美国Equator公司推出了BSP系列高速宽带数字信号处理器。BSP-15是该系列中的一款,可与 MAP-CA反向兼容。
BSP-15是专门以视频应用为中心而设计的高效DSP,以高度集成的单芯片满足了宽带产品的需要。在400MHz的时钟频率下, BSP-15处理能力为40 GOPS(每秒400亿次整数运算),处理速度相当于奔腾III的8.5倍,是同系列MAP-CA芯片的1.33倍,是其它解决方案的10倍以上。BSP -15的核心功能是采用软件专为高性能、大视频流的宽带应用而设计,结合iMMediaTools软件开发环境及其提供的视音频库,BSP-15可以为数字视频图像应用提供高效的解决方案。
据某视频会议产品研发工程师介绍,选用BSP-15芯片进行视音频的系统设计具有3方面优势:其一,BSP-15 是专为视频图像处理而设计的,能够提供高质量的视频效果;其二,BSP-15具有丰富的片上I/O接口,不必添加过多的外围设备,因而可以降低整个系统的成本和设计的复杂度;其三,完全采用C语言编程,没有汇编语言要求,升级方便,灵活性高。与同系列的TI DSP及Philip的Trimedia 系列DSP相比,BSP-15不足之处是软件开发难度较大,稳定性也被怀疑。但由于其出色的处理性能,BSP-15处理器在消费电子产品、视频会议、数字图像处理等方面仍将占有较大的市场。
以色列VCON通信有限公司去年推出基于新一代Equator BSP-15多媒体处理器的高性能的视频会议编解码器-HD100视频会议引擎。VCON公司首席市场官Gordon Daugherty认为:“视频会议的质量越来越接近广播电视的质量,视频会议市场已经进入了一个新的阶段。VCON集成商可以利用HD100视频会议引擎小巧的体积、极高的音频视频质量,以极具竞争力的成本构建各种先进多媒体会议应用。”
未来视频会议的技术趋势
随着时延问题被IETF技术和标准(如组播技术、带宽预留协议和实时控制协议)逐步解决,基于IP的视频会议方案把终端互操作性和高传输性能结合了起来。就标准而言,资源预留协议(RSVP)有助于避免网络拥塞,保证了视频会议的传输质量;实时传送协议(RTP)虽然不能保证数据传输的完整性,但能利用时间戳方法处理好定时关系,使传输过程中的数据顺序不被打乱。视频通信将会变得更容易,费用会更低,传统的会议模式已经远远不能适应网络时代的需求。而 视频会议系统 作为支持人们远距离进行实时信息交流、开展协同工作的应用系统,使协作成员可以远距离进行直观、真实的视/音频交流。
ADI公司软件和系统技术部产品行销经理Dan Ivanciw认为,视频会议的技术趋势之一是需要更高压缩率的视频编解码技术;还有在服务质量和安全方面有所改进的网络;今天功能固定的、不灵活的视频会议产品需要加以替换,或者采取昂贵的硬件升级去兼容,或者在将来利用这些变化和改良。另一趋势是基于IP的视频服务与VoIP产品融合。第三种普遍趋势是:服务供应商给更广泛的住户和商业客户提供IP视频增值服务。这种情况也存在于大多数产品领域,用户总是希望增加更多功能,例如三方或多方音视频会议。附加的功能需要终端设备具有更强大的处理能力,但是通过把一些性能融进终端设备中可以减少基础架构方面的需求。
飞利浦半导体公司的Jan Koene也认为,视频会议的主要趋势是更先进的编解码技术,例如符合H.264标准;另一个趋势是基于POTS(PSTN)的 视频会议系统 将会转变到基于IP的系统;第三个趋势是分辨率将从现有的CIF级增加到SD级,甚至HD级。
中星微电子的俞青则表示,除了需要适合视频会议终端的高质量/低码率的视频压缩技术以外,视频会议应用层的抗误码技术和视频会议服务器端的QoS控制技术也是视频会议重要的技术发展趋势。
中兴通讯视讯系统部工程师王亮将视频会议的发展趋势总结为“四化”建设:
1.系统功能多元化具有图文同传功能:除视音频外,可以方便地传送和显示电脑文档用于培训、汇报、交流;视频会议与电话系统浑然一体:可方便接入会议电话系统,通过电话、手机也可加入会议;视频会议和办公自动化(OA)系统有机结合,实现以下功能:OA网上进行会议组织、会议邮件通知、会议控制、系统维护和升级;OA网上实现个人可视通话及多方会议;OA网上只用普通PC即可在任何时间学习会议或培训内容;集中指挥、远程调度-电视墙显示统览全局,接入电话远程指挥。
2.系统组网多样化
有网络就能开会,通过专线、ISDN、IP(ADSL、LAN接入)、电话等现有网络接入各种多媒体终端。
3.图像清晰化
视频会议需要更优异、更清晰、更成熟的图像编解码技术。
4.使用、维护简捷化
易于使用,可自行组织、控制会议;进行远程管理、远程维护、升级,降低维护成本;更新设计,大幅提高系统稳定性。
华为公司多媒体产品线营销工程部部长陈崇军指出,视频会议未来的发展首先需要更为先进的音视频编解码技术和更专业的图像及语音前后端处理技术;其次还要能与下一代网络相融合,例如支持IPv6等;第三需要集成度更高、处理能力更强的终端技术。他进一步说明,视频编解码技术会向H.264发展,语音技术向高保真、低带宽发展;MCU向交换机和路由器融合;随着网络宽带化,视频会议终端也将智能化,其发展方向是小型化、全信息化家庭网络中心宽带智能终端,将通讯、娱乐、信息等各种功能融合在一起。
网络技术标准推动视频会议发展
网络技术标准的制定为多媒体应用奠定了基础。H.323协议是IP网络多媒体通信标准,解决各厂商设备的互通互控问题。H.264的出台,使得视频会议能以更低的成本提供更高质量的视频效果,以前由于资金和技术问题无法实现的视频应用也有望成为现实。就像网络日志(Weblogs)、即时消息等在过去几年成为重要的网络应用一样,H.264技术将有力地推动新的视频应用不断诞生。
采用H.264技术的MPEG-4在低码率视频传输上取得了突破性的进展。据悉,Tandberg和Polycom已经生产出支持H.264的产品,华为将在今年底公布H.264的产品,鼎视通在远航系列产品中也宣布支持该标准。
2003年7月,ITU批准了H.239标准,基于此项技术,视频用户可以得到双流视频服务。据Polycom公司技术总监余宝生介绍, Polycom的人物+内容(People+Content)双流技术允许主机在一个视频会议中同时发送视频和内容(PowerPoint、浏览器屏幕内容等)。另外,该标准所提供的方案同时适用于基于信令的H.320和H.245系统,可以实现在会议系统中同时传送和显示多路视频信息。 RADVISION、Sony和VCON等公司也都宣布支持H.239,并生产相关产品。Tandberg的Duo Video也可以实现该功能。
随着各种技术的不断发展和一系列国际标准的出台,视频会议技术及其设备由少数大公司一统天下的局面被打破了,逐渐发展成为由外商(如: Polycom、Tandberg、VTEL、VCON等)和中国本土企业(如:中兴、华为、中太、瑞福特等)共同分争视频会议市场的格局。高速IP网络及互联网的迅猛发展,使视频会议的应用与发展进入了一个新的时期。视讯技术在未来的几年内将会越来越广泛地被应用到各个领域,成为信息社会的主流应用之一。