- 注册
- 2002-01-16
- 消息
- 9,686
- 荣誉分数
- 5
- 声望点数
- 0
建置自己的数字影像撷取系统(一)
导论
好象不管什么产品,拍成广告后都会变得很神奇。只要拿一台摄像机,拍几个镜头,把影像撷取到计算机系统里再轻轻按几下,这些似乎看来不连贯的片段,立刻就变成了电影版的大作,而且您还可以把它刻成光盘寄给您外婆看,或是放在您的网站上供人欣赏。看起来真是简单极了。不过实际上,在计算机里撷取或剪辑这类数字影像,可绝对不是如此单纯的事情喔!
计算机上的NLE(非线性剪辑)影像编修系统(图片由Pinnacle提供)
这一篇评析介绍分成两个部份,首先在这一篇当中,我会为各位简介数字影像撷取的基本知识,目前系统有哪些功能及限制,能够买到哪些器材(与其价格),以及您能够预期达到的效果。在下一篇里我们将更深入地探讨,由各方面比较这些器材,并且告诉您该如何选购才不会白花冤枉钱。
影像压缩是重要关键
不可避免的,想录制影像有很多要求:比如频宽、储存设备、时间、以及金钱。各位也许会认为,什么东西只要是数字格式的都会比较好,不过遗憾的是在储存以及传输大量信息时,将这种模拟格式的资料转成数字格式,在效率上并不会有明显的提升。举个例子来说好了,一般您家里用小耳朵天线接收,并在价值60美元的电视上播放NTSC(电视格式之一,由美国国家电视制式委员会制定)格式的电视节目,其串流资料的传输率大约是每秒26 MBytes(译注:相当于208 Mbps,此处单位是兆字节Megabytes而不是兆位Megabits)。如果扣掉其中的载波信息,以及NTSC信号内含的额外封包信息(为了接下来比较上的方便我们将单位改成Megabits),那么剩下来的大概有124 Mbps。不过这样算起来每分钟也有1.5 Gbytes,每小时甚至高达93.5 Gbytes呢!而且要是您想做些特殊效果,像是将两个画面渐渐淡化连接,那么因为您需要两个影像流,简单来说就需要两倍的传输率。要是您想保有HDTV(高清晰度电视)的高画质,每秒接近5 Gbits的数字是跑不掉的。
您可以发现我们的讨论,好象已经进入TB(Terabyte)级容量以及GB/s(Gigabyte/s)级传输速率的科技了。最近您可以用150美金买到一颗30 GB的EIDE(增强型IDE接口)界面硬盘。虽然在EIDE规格中的最大传输速率是每秒33 MB(兆字节),不过这只是理论值。在理想状态下EIDE硬盘的读写动作,速率大概在每秒12-15 MB左右,不过大部分的硬盘都得要靠快取技术,而且通常只在很短的时间当中才能达到这个数字,实际上EIDE硬盘的读写速度大概都只在每秒3到6 MB左右吧。同样的,Wide Ultra SCSI(小型计算机系统接口之一)界面虽然号称理论传输速率每秒40 MB,而SCSI Wide Ultra II则有每秒约80 MB,但这些SCSI界面的表面数字也都不过是理论值而已,实际上大部分SCSI界面硬盘的真正读写速率都只在每秒6到13 MB左右罢了。
上面我们讨论的范围,也只到未压缩的单个资料流影像的26 MB/s传输速率的一半而已。目前是有办法解决这些瓶颈(不过这些方法都是非常昂贵的)问题的,像是用光纤搭配特殊设计的RAID(磁盘阵列)系统,不过就连这些系统都有其它方面的问题,这些我们稍后会提到。
色彩空间
所以,如果我们没办法借助调整计算机的设备来迎合这些未经压缩的影像资料的话,那么就只好把影像借助压缩的方式,将其调整成能够管理的资料量。但是影像压缩是门很深奥的技术。像是在电视上影像是交错式的,而在计算机上则不是。影像的运作方式相当复杂,电视使用YUV(亮度和色差信号)的变化型(称作Y'CbCr或是ITU-R 601规格),而计算机使用的是RGB(三原色)(您可以在Poynton's Color FAQ找到一份蛮完整,有关色彩空间的常见问题集(FAQ)文件,不过得先提醒您它探讨的问题有些深度,而且这还只是针对电视使用色彩的独特方式,做个大概的简介而已)。影像运作的频率对大多数的计算机时脉与显示大不相同。最后还有一点,模拟影像讯号对计算机标准规格来说噪声是相当多的。
压缩规格(CODECs)
在此之前我们Tom's硬件指南已经有一则介绍 影像压缩的文章。不过我在此会再一次将它拿出来,并且加进一些额外信息,作为下一篇影像撷取介绍的参考。
影像压缩规格(compression/decompression algorithms,CODECs,或称编译码规格)已经有约十年的历史,其中也有一些像MPEG-2(Motion Picture Experts Group-2)这类不错的压缩规格,但它们全都有一些各自的缺点。所有影像编码方式都照着既定基本的方式来运作,而且不管厂商如何吹嘘它们的规格有多好,影像压缩总是会失真。总之,影像的每一张画面都先被撷取(数字化),然后使用各种神奇的技巧压缩过之后,再被转变成非交错式的RGB影像。理论上,一些人眼注意不到的地方会被剔除,这种方式因为每次只处理一张画面,所以被称为画面内压缩(intraframe compression)。
某些编码方法处理就到此为止,像是M-JPEG(motion JPEG)就只是把每一张独立的画面(使用JPEG压缩算法),像翻书一样快速连续播放。不过每秒压缩30张画面还是个累人的工作,所以使用M-JPEG技术的影像撷取卡,通常都使用Zoran(卓然)公司的ZR36060或是ZR36050等专用编码芯片。数字摄像机(DV cameras)采用的手法类似,并可以及时压缩及播放影像。(注:数字摄录像机利用机器中的特殊芯片,来进行独自的压缩方式,所以不管您在电视上看到的广告词怎么写,DV(digital video)格式并不是未压缩过的。DV格式对影像玩家们来说也有部份的问题,这些也请容我后述)
这种方式主要的问题是,随影像的复杂度不同,压缩后画面的资料量大小也会不同。您的译码程序必须能够持续针对不同大小资料量的画面调整(如维持一定的资料速率时),或是强迫您的编码程序将每个画面压缩成相同大小。当然这也代表有些画面只需要简单的压缩,有些画面则得压的更小。而且别忘了,压得越小影像就越差!
MPEG-1算法
在MPEG-1算法当中,每一个画面的资料大小都必须相同,所以在压缩每个画面时,算法本身会动态的变化压缩程度,不过在画面与画面之间还有额外的压缩动作。这个接下来的动作称为画面间压缩(interframe compression)。它的基本概念是用来剔除在一连串的画面中看起来相同的部份,与其压缩每个完整的画面,我们只需要注意到画面之间的变化。
我们从第一张画面开始,并将它使用JPEG(Joint Photographic Experts Group)压缩,这张图片就成为我们的参考用影像了(我们通常称之为I画格或是内部编码画格:Intracoded frame)。接下来我们把下一张画面也压缩起来,接着比较它们两者的不同。我们把所有重复的信息全部都剔除掉,只记录下两画面间的不同之处,这个留下来的部份称为P画面或是预先参照画格(Predictive coded frame)。接下来对每张画面做同样的动作,随着时间这可能会发生一些错误,由于这些错误是会累积的,您可以不时重新插入一张I画格来将所有资料重新设定。您也可以借助插入一张特殊画格来对比前后画格的方式,来提升算法的效能,这称为B画格或是双向修正画格(Bidirectionally interpolated frame)。它们之间的资料大小以I画格最大,P画格次之,B画格则是最小的一个。由许多I,P以及B画格所组成的资料则称作GOP(影像集合,Group of Pictures)。
MPEG-1规格原本是被设计成非等向的压缩算法。这也就是说编码影片时所需要的运算能力比译码时还要来的高。这对播放来说很不错,但对撷取或是压缩来说就不太好了。
MPEG-1 for VCD规格(也称作白皮书规格)中规定MPEG资料流必须持续以1.15 Mbps的速率来传送(为了1倍速CD-ROM的考量)。为了能够在播放时维持这样固定的传输率,对每个画面的压缩程度会一直改变。(对了,如果压缩前面提到的124 Mbps电视影像串流,那么把它压成MPEG-1的话压缩比可相当于100:1喔!)
这里还有一些其它问题要解决。我们之前也说过影像是带有很多噪声的,就算您对着一片白墙稍微拍下一组画面,几乎每个画面还是会多少不一样。虽然以RGB值来说由10,10,10跳到10,10,9再回到原样对人眼来说可能很难发觉,但对计算机而言这两组像素值完全不同,并会将它们视为必须记录的部份。
虽然现在您可以预先对影像做处理,或是再改进算法使它更精密,不过这些都牵扯到处理时间、影像品质、压缩比以及额外设备的需求,甚至随着您影像来源的不同,结果也会有很大差异。在静态的场景下您也许还能把那些杂点给过滤掉,但要是画面之间的变化相当大的时候那么结果又会如何呢?当摄像机变焦、转动或移位时几乎每个像素都不相同,像是风中的麦田、流动的小溪和燃烧的火光,这类的影像都很难去压缩。镜头剪接、淡出以及叠化等等效果也都会改变每个像素,使得前面说的画面内压缩方式的效益完全不见了。
MPEG-2算法
更先进的算法,则是在编码时采用可变的资料速率。MPEG-2规格使用的就是这种技术,如果场景快速改变,或是影像不容易压缩的时候,MPEG-2会特别注意并处理这些画面。播放程序也需要能够动态改变资料速率。如果比较速率的话,MPEG-1 VCD大概是1.15 Mbps,而MPEG-2 DVD则由4 Mbps到9.8M bps左右(大约是40:1的压缩比)。
MPEG的问题点
随着算法的复杂化,它们也衍生出一些问题。举例来说吧,因为MPEG的IBP数据结构,使得播放程序必须先读取整个GOP到内存里,才能够针对B或P画格来译码。这会有多方面的影响。首先,MPEG不像模拟电视一样会有画质低劣的动作,因为MPEG是所谓「非全有即全无(all-or-nothing)」型的算法。要是MPEG资料出了什么问题,您不会看到模糊不清的影像,而是什么都看不到。
这也代表MPEG相当不适合在网络上做串流的动作。因为封包会在任何时间抵达,也可能不照顺序,要是其中一个画格不完全,那么整个译码的动作就得停顿等到资料补全,更糟糕的是可能会因此死机。
这另外也代表MPEG不易来编辑。您不能说「从这边到那边剪掉」,因为剪掉的部份不一定包含I画格或是整个GOP区段。MPEG的编修软件会先译码所有画面,等到编辑完成后再重新编码回去。但不幸的是,既然MPEG是失真压缩法,那么随着您每一次的编辑,影像品质也自然每况愈下。
还有,就算现在资料速率已经控制在4到6 Mbps,这些储存空间以及传输性能的需求,可还仍旧会让信息人员伤透脑筋!
MPEG-2科技的后继
您是不是已经被MPEG-1与MPEG-2弄昏头了?不过这边还有其它MPEG规格得提喔。MPEG-4目前才刚刚面世,而MPEG-7与MPEG-21也已经有眉目了。这些新MPEG规格基本上是原本MPEG算法的延伸,但是它们都对多媒体、低速率(可由5 kbps到10 Mbps调整)以及与3D对象、立体音效等等特殊功能做过最佳化了。虽然这些玩意听起来很复杂,不过想亲自动手还得等上一段时间,因为这些规格都还在研发中,几乎没有正式的工具供您使用。不过好处是,这些初步的MPEG-4工具都是基于软件的,所以您还是可以用现成的影像设备,来搭配这项新的技术。
有关MPEG的不错链结与信息可以在以下这些地方找到:
http://www.visiblelight.com/mpeg/
http://www.mpeg.org/MPEG/index.html
http://www.cselt.it/mpeg/
来点正面的情报吧
这么看来压缩影像似乎很不容易,而且又一堆问题。不过相对的也是会有正面的观点啦。当初这些影像压缩的算法开发出来的时候,还只是486与P-90的时代,而开发这类影像撷取与压缩产品的公司自然放弃使用CPU(中央处理器)做所有需要的运算。时至今日情形仍旧没变。举例来说,就算一颗400Mhz(兆赫)的CPU在用软件译码看DVD MPEG-2时,还得用掉近乎80%的运算能力(而且记住,编码可比译码难多了)。就算这其中有许多牵扯到CSS(Content Scrambling System,数字防拷保护)防拷的细节,不过这还是很吃力的工作。市面上是有不少软件产品,不过它们离实时处理都还有一大段距离。许多需要软件再绘制的效果,每分钟的影片得花上4到10分钟来处理。
所以,既然CPU已经不列入考虑范围,厂商们只好借助特殊芯片来作这些吃力的工作,把CPU搁在一旁。今天对自己建置一台数字影像撷取系统的人来说,就算买了顶级30,000美金的编码器,一台旧300Mhz CPU的机器也够用了。
另一个不错的消息是,由于数字影像技术是在过去五年之间研发出来的,许多专业器材的价位也降了不少。当初第一块MPEG-2撷取卡得要60,000美金,现在呢?400美金应该够了吧。
时间就是金钱
不过,要是您可以只花400美金就买到一块MPEG-2的撷取卡,那么厂商为什么还能开出1,500美金,5,000美金,甚至30,000美金的价码?品质当然也是一项要求,但在数字影像处理当中,「速度」是最重要的关键。那些影片后制工作室,既然替人处理影像每分钟收费好几百块美金,那么他们当然不在意花大把钞票,来购买可以让他们实时处理这些影像的高端设备。因为当您的顾客就在您身后拿着秒表等着的时候,您应该说不出像「呃,我们开始搞了,先去?垩一两个小时再回来吧。」这类的话吧。这对DIY族来说尤其是好消息,因为到某个价格点之前您都是花钱买画质,超过以后就是花钱买速度了。要是您觉得等一下也没什么,那么您就能省下好几千块美金。成品做出来的品质都一样,只不过它不用花您一台新车的钱。
NT上的Video Toaster软件(图片由Newtek提供)
所以诀窍就在于找到那条基准线,而且注意别超过它(当然您可能需要再深入了解产品,要是您发现这玩意真不错玩,那么您就不必再花大钱重新买过啦)。另外在您出门买撷取卡前得考虑的,是一句计算机界老俗语「一分钱一分货(garbage in, garbage out.)」。您或许能只花100美金买到一块分辨率限制在320 x 240,15 fps(每秒张数)的产品,不过当然啦,您也别想做出任何超过它能耐的影片了。
面对昂贵影像的现实吧!
虽然近年来这类产品的价格越来越低,但合适的家用级产品撷取卡还是得要250美金到900美金。而且更不幸的是,这只是一切的开始。
我之前也提过,影像需要庞大频宽以及 储存空间。EIDE硬盘是已经足够了,不过这已经逼近总线以及硬盘本身的极限了。我认识的专业影像处理人员,或是资深的玩家们,用的都是Ultra SCSI 2界面以及硬盘…很大很大的硬盘。
我个人是喜欢Adaptec AHA 2940UW界面卡(虽然念起来很饶舌),和5,000到7,500转的IBM或是希捷(Seagate)的新Cheetah硬盘。这里有两个要点,首先不是所有SCSI界面卡都相同,有些便宜的产品与系统总线相性不太合。它们会把整个总线占为己有,并且对其他系统部份造成影响。虽然影像撷取有99%是撷取卡、界面卡与硬盘的工作,但是CPU和内存还是需要部份必要的处理。您的SCSI界面卡与硬盘或许能够搞定影像资料流,不过却还是得等被抢光资源的CPU告诉它鼠标的指令。我也看过总线部份做的不够好的主板,会让SCSI界面卡无法发挥全力。
再来,硬盘(以及档案系统)是针对其中会有空档的大量的小读写动作而设计的。它们并不是被设计来处理读写相当大,而且必须连续不间断的资料流。因为这个原因,许多硬盘都搭配快取缓冲区来加快速度,但不幸的是这些快取都太小了,在您存取10 GB的影像档案时这不会带来任何好处。要是您发现您撷取影像时会有掉格(可说是最常见的问题)问题时,您可能就得把硬盘快取关掉了。
另外,有一些硬盘会每隔几秒做热校正的动作,虽然这只是一瞬间,但也可能已足够造成掉格的问题,新型的或是所谓AV等级的硬盘基本上不会发生问题,但是您得注意旧硬盘是否能够完全跟上影像撷取的速度。
最后根据您使用的操作系统您可能会碰上档案大小2 GB的限制。FAT-16格式使用16-bit(16位)串行来记录扇区(空间最小管理单位)的使用,最大可能的大小是串行资料限制(65,536)乘以扇区最大大小(32,768位),也就是2,147,483,648位(2 GB)。和其它计算机设计领域一样,FAT格式的设计者从没想过有谁会需要(或能够)存超过2 GB的档案。这个问题会发生在PC FAT 16(或更早的格式),Linux NFS与麦金塔(上至OS X苹果机系统)上面,但不会发生在NTFS以及FAT 32(虽可能有其它问题发生)上。大多数撷取系统以及对应软件都针对这个问题做了一些处理,但不是每一套都有。要是您发现您没办法撷取超过数分钟(也有可能数十秒钟,端看您的设定)的影像,那么您可能是碰到了这个问题,所以可以打算将系统升级成FAT-32格式或是NTFS格式。
面对昂贵影像的现实吧!(续)
所以要是您发现您便宜的EIDE硬盘没办法胜任如此重责大任,那么您就得投资在SCSI界面卡以及几台容量大且快速的硬盘上。如果您是认真想搞这玩意,也可以升级到RAID系统,不过现在还不打算探讨。至于计算机的其它组件倒就不必用太好的,您会需要一颗性能平均的CPU(300-400Mhz以上)以及足够的内存(Win98上要128MB,Win2K或NT则需256MB)。因为大部分撷取系统都会忽略显卡,并将影像传送过去,一般任何可以玩游戏,并支持Direct Draw硬件功能的显卡都可以。主板内建的显示功能(特殊AGP设定),ATI(冶天)All-in-Wonder系列卡,以及Matrox(迈拓) Millennium(不含Millennium II)可能会出些问题,因为它们会抢PCI以及内存的资源。这个问题也可能发生在高端声卡、DVD解压卡以及Ultra66界面卡上。还有因为网卡随时都和CPU通讯,也可能会造成问题。所以如果您无论如何都需要连上网络,那么最好使用NT。
最后,有许多旧系统(和少部份新系统)、芯片组、处理器以及周边在IRQ(中断请求)处理以及内存区块上的处理上不佳。有时候一些小小的IRQ设定以及升级驱动程序可以解决问题,但是有些设定就是没办法用来处理或撷取影像。我听说Compaq(康柏)内建火线界面的Presarios系列,Sony(新力)的VAIO系列,内建AGP显示功能的HP(惠普)计算机,内建MPEG功能的IBM Aptiva,和旧型的Packard Bell计算机都有这方面的问题。另外像Pentium(奔腾) Pros,AMD(超微) K5s,Cyrix P120/P150s,还有Pentium 60/66/75/90/100外接式升级处理器都不建议使用。
除了撷取卡、合适软件和您的计算机以外,您可能会发现最花钱的部份全部都出在摄影设备上。您可以花些钱买台不错的摄像机以及VCR(录象机)(用来将影像传到撷取卡中)。您还需要录像带,电池,三脚架,长长的影音线和插头,电视装置(在剪接时可以观看),一些基本的音效设备(麦克风、混音器、均衡器等)还有其它各式各样的小东西,相信您的存折会越来越薄。
我不打算在这里推荐摄像机,不过我要提醒各位,DV和Digital8摄像机有点不同,并且需要特殊的撷取设定。如果您要买一台DV摄像机,那么就找一台有IEEE 1394界面和外部控制功能的。许多DV撷取系统可以直接连上摄像机,并且有开始停止、准确画格搜寻等等的控制功能。这对批次作业和非线性剪辑来说是不错的功能。
撷取系统的基本运作
基本上影像撷取系统可以分为五种:模拟M-JPEG,模拟MPEG,DV,模拟/数字组合,以及其它(有些使用类似Indeo的专用压缩规格,有些超高文件得花好几千块美金)。它们也可以再细分为实时处理和非实时处理(虽然这并不是指一开始如何撷取影像,而是指能够实时插入某些过场特效)。还有我们说到模拟,指的是输入信号而不是最后结果(虽然某些撷取卡没办法直接转回VCR来)。
所有撷取系统都设计成可以接受某些输入方式:像是PAL(逐行倒相制式),NTSC,SECAM(顺序与存储彩色电视系统),composite(合成),component(组件),S-Video(Super-Video,超级电视信号)及DV等等。所以您得先确定您的撷取卡是否能搭配您的影像来源。
有些撷取卡附有外接的配线分接器(或是把所有配线都放在外接盒中),这类分接器很方便,因为它可以让您不用到计算机后面去插或拔线。相信我,您一定会常常碰到这档事。
所有撷取系统都有最大分辨率以及画面张数,有些还会有最大速率限制。较平价的系统分辨率大多是最大到320 x 240,不过记得您可以做出比较小的影像,但没办法在不损失影像品质的情况下扩大影像,所以您至少得买640 x 480或720 x 480的机种。为了最佳的品质,您也至少需要每秒可以捕捉60张画面的系统,而不考虑30张的产品。 还有关于传输速率,至少要有3.6 MB/s。
模拟M-JPEG撷取卡是数字影像撷取界的先锋,但由于MPEG和DV等替代品,已经渐渐淡出市场。不过您还是可以买到它们(而且价格诱人),效果也还不错。
模拟MPEG系统则分成两种:MPEG-1与MPEG-2规格。如果您对影像质量很坚持(或是您以后「可能」会很坚持),那么就值得买高端的MPEG-2系统,谁知道会不会有一天您会把自己的作品放在DVD上呢?MPEG-1系统已经能够充分满足需求,不过各产品间的差异也颇大。
DV撷取系统比较特殊,并且需要DV摄像机或是DV VCR当作输入。这些系统可以依照专用DV编码芯片的位置,细分为内接与外接两种。有些早期的DV系统使用摄像机内建的芯片处理影像,它们从DV摄像机取得影像流,将它们转成像AVI等格式之后再送回摄像机做DV编码动作。一开始这类产品有些复杂,不过近年来有很大的改进。
DV系统的优势,在于大部分产品能够通过IEEE 1394界面直接与DV摄像机等设备联机或控制,对批次作业来说非常方便。
一些DV撷取系统有一项特殊的外部控制功能。它不是将DV信号撷取下来直接存在硬盘上,而是撷取成压缩过的AVI(或其它格式)。当您作好编修并按下开始按钮,系统会将必要的部份由摄像机设备拿出来,然后输出回DV格式。当然啦,这需要您的DV撷取系统知道如何去控制摄像机设备。所以要是您有一台DV摄像机,那么您得先知道系统支不支持您的机器。
撷取系统的基本运作(续)
DV摄像机与放影机(图片由Panasonic提供)
模拟数字组合系统可以接受传统模拟输入或是DV摄像机输入。这些系统提供的弹性,值得让现在有一台模拟摄像机,但又想买数字摄像机的人考虑。
几乎所有撷取卡都会附赠让您做基本撷取编修动作的软件。如果撷取系统的500美金标价吓到您了,想想里头说不定会附赠市价接近800美金的软件的话您应该会比较释怀。不过要是您有特殊的需求,像是在网络上用RealVideo或是QuickTime做广播,那么您可能还是得购买额外的软件。
您也可能发现有一天觉得Adobe,友立(Ulead)或Avid附赠的精简版软件已经不够使用,所以想购买完整版,不过记住专业品质的非线性编辑及特效软件可是相当昂贵的。
除了基本功能以外,各系统之间的差异还包括速度,内建转移特效,以及附赠软件。所有系统都适合拿来作网络广播(虽然有的不够好),而每个售价250美金上下的系统可以让您获得VHS(家用录像系统)或以上的画质。想要HDTV的高画质得花不少钱,但只要不到1,000美金您应该就能买到一部逼近DVD画质的撷取系统了。
所有事都有折衷方案以及代价。在购买撷取系统时,最好还是购买您所能负担的最佳机种。要做出小一号的影像或是较低的画面速率很容易,但是想让一个又小又差的影像变漂亮就很难了。
下回预告
目前有许多书籍文章,以及许多杂志与网站致力于这方面的研究,我没有办法在这一篇文章中讨论一切。在下一部份的介绍中,我们将要来看看一些不到1,000美金的系统规格,它们能做些什么或不能做些什么,以及该如何建置起来。所以各位要是家里也有这些设备,不妨现在就拿出来拍些玩意吧!这样到时候我们来试着组装系统时,才会有东西让您来玩玩。
导论
好象不管什么产品,拍成广告后都会变得很神奇。只要拿一台摄像机,拍几个镜头,把影像撷取到计算机系统里再轻轻按几下,这些似乎看来不连贯的片段,立刻就变成了电影版的大作,而且您还可以把它刻成光盘寄给您外婆看,或是放在您的网站上供人欣赏。看起来真是简单极了。不过实际上,在计算机里撷取或剪辑这类数字影像,可绝对不是如此单纯的事情喔!
计算机上的NLE(非线性剪辑)影像编修系统(图片由Pinnacle提供)
这一篇评析介绍分成两个部份,首先在这一篇当中,我会为各位简介数字影像撷取的基本知识,目前系统有哪些功能及限制,能够买到哪些器材(与其价格),以及您能够预期达到的效果。在下一篇里我们将更深入地探讨,由各方面比较这些器材,并且告诉您该如何选购才不会白花冤枉钱。
影像压缩是重要关键
不可避免的,想录制影像有很多要求:比如频宽、储存设备、时间、以及金钱。各位也许会认为,什么东西只要是数字格式的都会比较好,不过遗憾的是在储存以及传输大量信息时,将这种模拟格式的资料转成数字格式,在效率上并不会有明显的提升。举个例子来说好了,一般您家里用小耳朵天线接收,并在价值60美元的电视上播放NTSC(电视格式之一,由美国国家电视制式委员会制定)格式的电视节目,其串流资料的传输率大约是每秒26 MBytes(译注:相当于208 Mbps,此处单位是兆字节Megabytes而不是兆位Megabits)。如果扣掉其中的载波信息,以及NTSC信号内含的额外封包信息(为了接下来比较上的方便我们将单位改成Megabits),那么剩下来的大概有124 Mbps。不过这样算起来每分钟也有1.5 Gbytes,每小时甚至高达93.5 Gbytes呢!而且要是您想做些特殊效果,像是将两个画面渐渐淡化连接,那么因为您需要两个影像流,简单来说就需要两倍的传输率。要是您想保有HDTV(高清晰度电视)的高画质,每秒接近5 Gbits的数字是跑不掉的。
您可以发现我们的讨论,好象已经进入TB(Terabyte)级容量以及GB/s(Gigabyte/s)级传输速率的科技了。最近您可以用150美金买到一颗30 GB的EIDE(增强型IDE接口)界面硬盘。虽然在EIDE规格中的最大传输速率是每秒33 MB(兆字节),不过这只是理论值。在理想状态下EIDE硬盘的读写动作,速率大概在每秒12-15 MB左右,不过大部分的硬盘都得要靠快取技术,而且通常只在很短的时间当中才能达到这个数字,实际上EIDE硬盘的读写速度大概都只在每秒3到6 MB左右吧。同样的,Wide Ultra SCSI(小型计算机系统接口之一)界面虽然号称理论传输速率每秒40 MB,而SCSI Wide Ultra II则有每秒约80 MB,但这些SCSI界面的表面数字也都不过是理论值而已,实际上大部分SCSI界面硬盘的真正读写速率都只在每秒6到13 MB左右罢了。
上面我们讨论的范围,也只到未压缩的单个资料流影像的26 MB/s传输速率的一半而已。目前是有办法解决这些瓶颈(不过这些方法都是非常昂贵的)问题的,像是用光纤搭配特殊设计的RAID(磁盘阵列)系统,不过就连这些系统都有其它方面的问题,这些我们稍后会提到。
色彩空间
所以,如果我们没办法借助调整计算机的设备来迎合这些未经压缩的影像资料的话,那么就只好把影像借助压缩的方式,将其调整成能够管理的资料量。但是影像压缩是门很深奥的技术。像是在电视上影像是交错式的,而在计算机上则不是。影像的运作方式相当复杂,电视使用YUV(亮度和色差信号)的变化型(称作Y'CbCr或是ITU-R 601规格),而计算机使用的是RGB(三原色)(您可以在Poynton's Color FAQ找到一份蛮完整,有关色彩空间的常见问题集(FAQ)文件,不过得先提醒您它探讨的问题有些深度,而且这还只是针对电视使用色彩的独特方式,做个大概的简介而已)。影像运作的频率对大多数的计算机时脉与显示大不相同。最后还有一点,模拟影像讯号对计算机标准规格来说噪声是相当多的。
压缩规格(CODECs)
在此之前我们Tom's硬件指南已经有一则介绍 影像压缩的文章。不过我在此会再一次将它拿出来,并且加进一些额外信息,作为下一篇影像撷取介绍的参考。
影像压缩规格(compression/decompression algorithms,CODECs,或称编译码规格)已经有约十年的历史,其中也有一些像MPEG-2(Motion Picture Experts Group-2)这类不错的压缩规格,但它们全都有一些各自的缺点。所有影像编码方式都照着既定基本的方式来运作,而且不管厂商如何吹嘘它们的规格有多好,影像压缩总是会失真。总之,影像的每一张画面都先被撷取(数字化),然后使用各种神奇的技巧压缩过之后,再被转变成非交错式的RGB影像。理论上,一些人眼注意不到的地方会被剔除,这种方式因为每次只处理一张画面,所以被称为画面内压缩(intraframe compression)。
某些编码方法处理就到此为止,像是M-JPEG(motion JPEG)就只是把每一张独立的画面(使用JPEG压缩算法),像翻书一样快速连续播放。不过每秒压缩30张画面还是个累人的工作,所以使用M-JPEG技术的影像撷取卡,通常都使用Zoran(卓然)公司的ZR36060或是ZR36050等专用编码芯片。数字摄像机(DV cameras)采用的手法类似,并可以及时压缩及播放影像。(注:数字摄录像机利用机器中的特殊芯片,来进行独自的压缩方式,所以不管您在电视上看到的广告词怎么写,DV(digital video)格式并不是未压缩过的。DV格式对影像玩家们来说也有部份的问题,这些也请容我后述)
这种方式主要的问题是,随影像的复杂度不同,压缩后画面的资料量大小也会不同。您的译码程序必须能够持续针对不同大小资料量的画面调整(如维持一定的资料速率时),或是强迫您的编码程序将每个画面压缩成相同大小。当然这也代表有些画面只需要简单的压缩,有些画面则得压的更小。而且别忘了,压得越小影像就越差!
MPEG-1算法
在MPEG-1算法当中,每一个画面的资料大小都必须相同,所以在压缩每个画面时,算法本身会动态的变化压缩程度,不过在画面与画面之间还有额外的压缩动作。这个接下来的动作称为画面间压缩(interframe compression)。它的基本概念是用来剔除在一连串的画面中看起来相同的部份,与其压缩每个完整的画面,我们只需要注意到画面之间的变化。
我们从第一张画面开始,并将它使用JPEG(Joint Photographic Experts Group)压缩,这张图片就成为我们的参考用影像了(我们通常称之为I画格或是内部编码画格:Intracoded frame)。接下来我们把下一张画面也压缩起来,接着比较它们两者的不同。我们把所有重复的信息全部都剔除掉,只记录下两画面间的不同之处,这个留下来的部份称为P画面或是预先参照画格(Predictive coded frame)。接下来对每张画面做同样的动作,随着时间这可能会发生一些错误,由于这些错误是会累积的,您可以不时重新插入一张I画格来将所有资料重新设定。您也可以借助插入一张特殊画格来对比前后画格的方式,来提升算法的效能,这称为B画格或是双向修正画格(Bidirectionally interpolated frame)。它们之间的资料大小以I画格最大,P画格次之,B画格则是最小的一个。由许多I,P以及B画格所组成的资料则称作GOP(影像集合,Group of Pictures)。
MPEG-1规格原本是被设计成非等向的压缩算法。这也就是说编码影片时所需要的运算能力比译码时还要来的高。这对播放来说很不错,但对撷取或是压缩来说就不太好了。
MPEG-1 for VCD规格(也称作白皮书规格)中规定MPEG资料流必须持续以1.15 Mbps的速率来传送(为了1倍速CD-ROM的考量)。为了能够在播放时维持这样固定的传输率,对每个画面的压缩程度会一直改变。(对了,如果压缩前面提到的124 Mbps电视影像串流,那么把它压成MPEG-1的话压缩比可相当于100:1喔!)
这里还有一些其它问题要解决。我们之前也说过影像是带有很多噪声的,就算您对着一片白墙稍微拍下一组画面,几乎每个画面还是会多少不一样。虽然以RGB值来说由10,10,10跳到10,10,9再回到原样对人眼来说可能很难发觉,但对计算机而言这两组像素值完全不同,并会将它们视为必须记录的部份。
虽然现在您可以预先对影像做处理,或是再改进算法使它更精密,不过这些都牵扯到处理时间、影像品质、压缩比以及额外设备的需求,甚至随着您影像来源的不同,结果也会有很大差异。在静态的场景下您也许还能把那些杂点给过滤掉,但要是画面之间的变化相当大的时候那么结果又会如何呢?当摄像机变焦、转动或移位时几乎每个像素都不相同,像是风中的麦田、流动的小溪和燃烧的火光,这类的影像都很难去压缩。镜头剪接、淡出以及叠化等等效果也都会改变每个像素,使得前面说的画面内压缩方式的效益完全不见了。
MPEG-2算法
更先进的算法,则是在编码时采用可变的资料速率。MPEG-2规格使用的就是这种技术,如果场景快速改变,或是影像不容易压缩的时候,MPEG-2会特别注意并处理这些画面。播放程序也需要能够动态改变资料速率。如果比较速率的话,MPEG-1 VCD大概是1.15 Mbps,而MPEG-2 DVD则由4 Mbps到9.8M bps左右(大约是40:1的压缩比)。
MPEG的问题点
随着算法的复杂化,它们也衍生出一些问题。举例来说吧,因为MPEG的IBP数据结构,使得播放程序必须先读取整个GOP到内存里,才能够针对B或P画格来译码。这会有多方面的影响。首先,MPEG不像模拟电视一样会有画质低劣的动作,因为MPEG是所谓「非全有即全无(all-or-nothing)」型的算法。要是MPEG资料出了什么问题,您不会看到模糊不清的影像,而是什么都看不到。
这也代表MPEG相当不适合在网络上做串流的动作。因为封包会在任何时间抵达,也可能不照顺序,要是其中一个画格不完全,那么整个译码的动作就得停顿等到资料补全,更糟糕的是可能会因此死机。
这另外也代表MPEG不易来编辑。您不能说「从这边到那边剪掉」,因为剪掉的部份不一定包含I画格或是整个GOP区段。MPEG的编修软件会先译码所有画面,等到编辑完成后再重新编码回去。但不幸的是,既然MPEG是失真压缩法,那么随着您每一次的编辑,影像品质也自然每况愈下。
还有,就算现在资料速率已经控制在4到6 Mbps,这些储存空间以及传输性能的需求,可还仍旧会让信息人员伤透脑筋!
MPEG-2科技的后继
您是不是已经被MPEG-1与MPEG-2弄昏头了?不过这边还有其它MPEG规格得提喔。MPEG-4目前才刚刚面世,而MPEG-7与MPEG-21也已经有眉目了。这些新MPEG规格基本上是原本MPEG算法的延伸,但是它们都对多媒体、低速率(可由5 kbps到10 Mbps调整)以及与3D对象、立体音效等等特殊功能做过最佳化了。虽然这些玩意听起来很复杂,不过想亲自动手还得等上一段时间,因为这些规格都还在研发中,几乎没有正式的工具供您使用。不过好处是,这些初步的MPEG-4工具都是基于软件的,所以您还是可以用现成的影像设备,来搭配这项新的技术。
有关MPEG的不错链结与信息可以在以下这些地方找到:
http://www.visiblelight.com/mpeg/
http://www.mpeg.org/MPEG/index.html
http://www.cselt.it/mpeg/
来点正面的情报吧
这么看来压缩影像似乎很不容易,而且又一堆问题。不过相对的也是会有正面的观点啦。当初这些影像压缩的算法开发出来的时候,还只是486与P-90的时代,而开发这类影像撷取与压缩产品的公司自然放弃使用CPU(中央处理器)做所有需要的运算。时至今日情形仍旧没变。举例来说,就算一颗400Mhz(兆赫)的CPU在用软件译码看DVD MPEG-2时,还得用掉近乎80%的运算能力(而且记住,编码可比译码难多了)。就算这其中有许多牵扯到CSS(Content Scrambling System,数字防拷保护)防拷的细节,不过这还是很吃力的工作。市面上是有不少软件产品,不过它们离实时处理都还有一大段距离。许多需要软件再绘制的效果,每分钟的影片得花上4到10分钟来处理。
所以,既然CPU已经不列入考虑范围,厂商们只好借助特殊芯片来作这些吃力的工作,把CPU搁在一旁。今天对自己建置一台数字影像撷取系统的人来说,就算买了顶级30,000美金的编码器,一台旧300Mhz CPU的机器也够用了。
另一个不错的消息是,由于数字影像技术是在过去五年之间研发出来的,许多专业器材的价位也降了不少。当初第一块MPEG-2撷取卡得要60,000美金,现在呢?400美金应该够了吧。
时间就是金钱
不过,要是您可以只花400美金就买到一块MPEG-2的撷取卡,那么厂商为什么还能开出1,500美金,5,000美金,甚至30,000美金的价码?品质当然也是一项要求,但在数字影像处理当中,「速度」是最重要的关键。那些影片后制工作室,既然替人处理影像每分钟收费好几百块美金,那么他们当然不在意花大把钞票,来购买可以让他们实时处理这些影像的高端设备。因为当您的顾客就在您身后拿着秒表等着的时候,您应该说不出像「呃,我们开始搞了,先去?垩一两个小时再回来吧。」这类的话吧。这对DIY族来说尤其是好消息,因为到某个价格点之前您都是花钱买画质,超过以后就是花钱买速度了。要是您觉得等一下也没什么,那么您就能省下好几千块美金。成品做出来的品质都一样,只不过它不用花您一台新车的钱。
NT上的Video Toaster软件(图片由Newtek提供)
所以诀窍就在于找到那条基准线,而且注意别超过它(当然您可能需要再深入了解产品,要是您发现这玩意真不错玩,那么您就不必再花大钱重新买过啦)。另外在您出门买撷取卡前得考虑的,是一句计算机界老俗语「一分钱一分货(garbage in, garbage out.)」。您或许能只花100美金买到一块分辨率限制在320 x 240,15 fps(每秒张数)的产品,不过当然啦,您也别想做出任何超过它能耐的影片了。
面对昂贵影像的现实吧!
虽然近年来这类产品的价格越来越低,但合适的家用级产品撷取卡还是得要250美金到900美金。而且更不幸的是,这只是一切的开始。
我之前也提过,影像需要庞大频宽以及 储存空间。EIDE硬盘是已经足够了,不过这已经逼近总线以及硬盘本身的极限了。我认识的专业影像处理人员,或是资深的玩家们,用的都是Ultra SCSI 2界面以及硬盘…很大很大的硬盘。
我个人是喜欢Adaptec AHA 2940UW界面卡(虽然念起来很饶舌),和5,000到7,500转的IBM或是希捷(Seagate)的新Cheetah硬盘。这里有两个要点,首先不是所有SCSI界面卡都相同,有些便宜的产品与系统总线相性不太合。它们会把整个总线占为己有,并且对其他系统部份造成影响。虽然影像撷取有99%是撷取卡、界面卡与硬盘的工作,但是CPU和内存还是需要部份必要的处理。您的SCSI界面卡与硬盘或许能够搞定影像资料流,不过却还是得等被抢光资源的CPU告诉它鼠标的指令。我也看过总线部份做的不够好的主板,会让SCSI界面卡无法发挥全力。
再来,硬盘(以及档案系统)是针对其中会有空档的大量的小读写动作而设计的。它们并不是被设计来处理读写相当大,而且必须连续不间断的资料流。因为这个原因,许多硬盘都搭配快取缓冲区来加快速度,但不幸的是这些快取都太小了,在您存取10 GB的影像档案时这不会带来任何好处。要是您发现您撷取影像时会有掉格(可说是最常见的问题)问题时,您可能就得把硬盘快取关掉了。
另外,有一些硬盘会每隔几秒做热校正的动作,虽然这只是一瞬间,但也可能已足够造成掉格的问题,新型的或是所谓AV等级的硬盘基本上不会发生问题,但是您得注意旧硬盘是否能够完全跟上影像撷取的速度。
最后根据您使用的操作系统您可能会碰上档案大小2 GB的限制。FAT-16格式使用16-bit(16位)串行来记录扇区(空间最小管理单位)的使用,最大可能的大小是串行资料限制(65,536)乘以扇区最大大小(32,768位),也就是2,147,483,648位(2 GB)。和其它计算机设计领域一样,FAT格式的设计者从没想过有谁会需要(或能够)存超过2 GB的档案。这个问题会发生在PC FAT 16(或更早的格式),Linux NFS与麦金塔(上至OS X苹果机系统)上面,但不会发生在NTFS以及FAT 32(虽可能有其它问题发生)上。大多数撷取系统以及对应软件都针对这个问题做了一些处理,但不是每一套都有。要是您发现您没办法撷取超过数分钟(也有可能数十秒钟,端看您的设定)的影像,那么您可能是碰到了这个问题,所以可以打算将系统升级成FAT-32格式或是NTFS格式。
面对昂贵影像的现实吧!(续)
所以要是您发现您便宜的EIDE硬盘没办法胜任如此重责大任,那么您就得投资在SCSI界面卡以及几台容量大且快速的硬盘上。如果您是认真想搞这玩意,也可以升级到RAID系统,不过现在还不打算探讨。至于计算机的其它组件倒就不必用太好的,您会需要一颗性能平均的CPU(300-400Mhz以上)以及足够的内存(Win98上要128MB,Win2K或NT则需256MB)。因为大部分撷取系统都会忽略显卡,并将影像传送过去,一般任何可以玩游戏,并支持Direct Draw硬件功能的显卡都可以。主板内建的显示功能(特殊AGP设定),ATI(冶天)All-in-Wonder系列卡,以及Matrox(迈拓) Millennium(不含Millennium II)可能会出些问题,因为它们会抢PCI以及内存的资源。这个问题也可能发生在高端声卡、DVD解压卡以及Ultra66界面卡上。还有因为网卡随时都和CPU通讯,也可能会造成问题。所以如果您无论如何都需要连上网络,那么最好使用NT。
最后,有许多旧系统(和少部份新系统)、芯片组、处理器以及周边在IRQ(中断请求)处理以及内存区块上的处理上不佳。有时候一些小小的IRQ设定以及升级驱动程序可以解决问题,但是有些设定就是没办法用来处理或撷取影像。我听说Compaq(康柏)内建火线界面的Presarios系列,Sony(新力)的VAIO系列,内建AGP显示功能的HP(惠普)计算机,内建MPEG功能的IBM Aptiva,和旧型的Packard Bell计算机都有这方面的问题。另外像Pentium(奔腾) Pros,AMD(超微) K5s,Cyrix P120/P150s,还有Pentium 60/66/75/90/100外接式升级处理器都不建议使用。
除了撷取卡、合适软件和您的计算机以外,您可能会发现最花钱的部份全部都出在摄影设备上。您可以花些钱买台不错的摄像机以及VCR(录象机)(用来将影像传到撷取卡中)。您还需要录像带,电池,三脚架,长长的影音线和插头,电视装置(在剪接时可以观看),一些基本的音效设备(麦克风、混音器、均衡器等)还有其它各式各样的小东西,相信您的存折会越来越薄。
我不打算在这里推荐摄像机,不过我要提醒各位,DV和Digital8摄像机有点不同,并且需要特殊的撷取设定。如果您要买一台DV摄像机,那么就找一台有IEEE 1394界面和外部控制功能的。许多DV撷取系统可以直接连上摄像机,并且有开始停止、准确画格搜寻等等的控制功能。这对批次作业和非线性剪辑来说是不错的功能。
撷取系统的基本运作
基本上影像撷取系统可以分为五种:模拟M-JPEG,模拟MPEG,DV,模拟/数字组合,以及其它(有些使用类似Indeo的专用压缩规格,有些超高文件得花好几千块美金)。它们也可以再细分为实时处理和非实时处理(虽然这并不是指一开始如何撷取影像,而是指能够实时插入某些过场特效)。还有我们说到模拟,指的是输入信号而不是最后结果(虽然某些撷取卡没办法直接转回VCR来)。
所有撷取系统都设计成可以接受某些输入方式:像是PAL(逐行倒相制式),NTSC,SECAM(顺序与存储彩色电视系统),composite(合成),component(组件),S-Video(Super-Video,超级电视信号)及DV等等。所以您得先确定您的撷取卡是否能搭配您的影像来源。
有些撷取卡附有外接的配线分接器(或是把所有配线都放在外接盒中),这类分接器很方便,因为它可以让您不用到计算机后面去插或拔线。相信我,您一定会常常碰到这档事。
所有撷取系统都有最大分辨率以及画面张数,有些还会有最大速率限制。较平价的系统分辨率大多是最大到320 x 240,不过记得您可以做出比较小的影像,但没办法在不损失影像品质的情况下扩大影像,所以您至少得买640 x 480或720 x 480的机种。为了最佳的品质,您也至少需要每秒可以捕捉60张画面的系统,而不考虑30张的产品。 还有关于传输速率,至少要有3.6 MB/s。
模拟M-JPEG撷取卡是数字影像撷取界的先锋,但由于MPEG和DV等替代品,已经渐渐淡出市场。不过您还是可以买到它们(而且价格诱人),效果也还不错。
模拟MPEG系统则分成两种:MPEG-1与MPEG-2规格。如果您对影像质量很坚持(或是您以后「可能」会很坚持),那么就值得买高端的MPEG-2系统,谁知道会不会有一天您会把自己的作品放在DVD上呢?MPEG-1系统已经能够充分满足需求,不过各产品间的差异也颇大。
DV撷取系统比较特殊,并且需要DV摄像机或是DV VCR当作输入。这些系统可以依照专用DV编码芯片的位置,细分为内接与外接两种。有些早期的DV系统使用摄像机内建的芯片处理影像,它们从DV摄像机取得影像流,将它们转成像AVI等格式之后再送回摄像机做DV编码动作。一开始这类产品有些复杂,不过近年来有很大的改进。
DV系统的优势,在于大部分产品能够通过IEEE 1394界面直接与DV摄像机等设备联机或控制,对批次作业来说非常方便。
一些DV撷取系统有一项特殊的外部控制功能。它不是将DV信号撷取下来直接存在硬盘上,而是撷取成压缩过的AVI(或其它格式)。当您作好编修并按下开始按钮,系统会将必要的部份由摄像机设备拿出来,然后输出回DV格式。当然啦,这需要您的DV撷取系统知道如何去控制摄像机设备。所以要是您有一台DV摄像机,那么您得先知道系统支不支持您的机器。
撷取系统的基本运作(续)
DV摄像机与放影机(图片由Panasonic提供)
模拟数字组合系统可以接受传统模拟输入或是DV摄像机输入。这些系统提供的弹性,值得让现在有一台模拟摄像机,但又想买数字摄像机的人考虑。
几乎所有撷取卡都会附赠让您做基本撷取编修动作的软件。如果撷取系统的500美金标价吓到您了,想想里头说不定会附赠市价接近800美金的软件的话您应该会比较释怀。不过要是您有特殊的需求,像是在网络上用RealVideo或是QuickTime做广播,那么您可能还是得购买额外的软件。
您也可能发现有一天觉得Adobe,友立(Ulead)或Avid附赠的精简版软件已经不够使用,所以想购买完整版,不过记住专业品质的非线性编辑及特效软件可是相当昂贵的。
除了基本功能以外,各系统之间的差异还包括速度,内建转移特效,以及附赠软件。所有系统都适合拿来作网络广播(虽然有的不够好),而每个售价250美金上下的系统可以让您获得VHS(家用录像系统)或以上的画质。想要HDTV的高画质得花不少钱,但只要不到1,000美金您应该就能买到一部逼近DVD画质的撷取系统了。
所有事都有折衷方案以及代价。在购买撷取系统时,最好还是购买您所能负担的最佳机种。要做出小一号的影像或是较低的画面速率很容易,但是想让一个又小又差的影像变漂亮就很难了。
下回预告
目前有许多书籍文章,以及许多杂志与网站致力于这方面的研究,我没有办法在这一篇文章中讨论一切。在下一部份的介绍中,我们将要来看看一些不到1,000美金的系统规格,它们能做些什么或不能做些什么,以及该如何建置起来。所以各位要是家里也有这些设备,不妨现在就拿出来拍些玩意吧!这样到时候我们来试着组装系统时,才会有东西让您来玩玩。