CM即Content Manager,是IBM在内容管理领域中的核心产品。该产品一直在内容管理市场占有较高的占有率。IBM在全球拥有超过9000个内容管理的客户,并且在前60家银行中有39家使用IBM内容管理产品,在前45家保险公司中有25家使用IBM内容管理产品。那么CM究竟是什么东西,又与媒体资产管理何干呢?
这要从什么是媒体资产管理来说了,媒体资产管理系统是一个对各种媒体及内容(如视/音频资料、文本文件、图表等)进行管理的总体解决方案。它满足媒体资产拥有者收集、保存、查找、编辑、发布各种信息的要求,为媒体资产的使用者提供访问内容的简便方法,高效地保存和利用媒体资产的内容管理系统。这下就清楚多了,媒体资产就是内容管理针对媒体应用的特殊性衍生出来的一套非结构化数据管理系统。
CM的功能可谓是一应俱全,从内容的创建获取、审批、存储管理、权限管理、访问查询到最终的发布,每一部份都给出了丰富的功能,也可以说是IBM软件的一个大的集合。
我们先来看看CM是什么样的方案,在来说说在媒体资产管理中是如何应用的。
CM是专门针对内容管理的商业化产品,支持众多的国际标准,比如都柏林元数据标准,ODMA标准,XML(XQUERY/XPATH),LDAP等等,它是在众多的工业标准之上开发的开放产品,基于国际标准的元数据管理模型、特有的三角形架构、基于存储软件的多级存储机制,采用了众多先进的技术来满足这些内容管理的要求。
CM采用众多的成熟的商业化产品,并且基于开放的平台,由于是同一家公司的产品(只有少量的组件是采用第三方产品),从而保证了系统的通用性和兼容性,较少了集成的难度,这些软件可以无缝的配合在一起,发挥各自最大的可用性,并且充分保证系统的性能。使CM具有良好的扩展性。由于CM系统拥有成熟、可靠的专利技术(如类三角形的内容管理体系架构等),基于存储管理的先进的多级存储管理机制,提供多级存储设备之间的数据迁移能力,以及易于扩展的分布式内容对象存储体系,使得系统非常容易的扩充和升级,不受容量的限制,因此使其一直在企业级内容管理方案中保持领先的地位。
在媒体行业中内容是该企业中最重要的,除了要保存内容之外就是要让内容成为资产,让资产能够再利用为企业再次的创造价值。
对于内容而言,如果想要其可以被再利用,再增值,就需要使内容成为资产。如果想要将内容变为资产,需要加入权限管理。权限管理简单来说就是指什么人在何种情况下可以对哪个内容作什么样的操作。加入了权限管理后,对内容的利用就可以因人而易,使得内容信息可以被再利用,生成资产价值。
这些资产信息可直接经发布系统发布到各种渠道,如互联网等, 而以后的所有操作均以此阶段创建的媒体资产为基础。所有的内容信息均基于同一个内容模块,提供集文档、图片、图表,音、视频、账单和交互式内容等资源于一体的立体化信息服务。由于共用同一个内容模块,信息的采编、发布结合得更加紧密,使得随意丰富的发布信息成为可能。
从整体上来看,CM是提供了一套整体的内容解决方案,那么我们把媒体资产中涉及的技术分开来看看,CM是如何实现这些部分的。
在媒体资产管理中涉及的技术有采集编码技术、存储技术、媒体分析技术、查询检索技术、数字版权保护技术、发布技术等。
采集编码技术:
对于IBM来讲虽然其有连Vela用的都是IBM生产的MPEG2的处理芯片但其软件产品中却没有如此好的产品与之相适应,在IBM实施的几个大型媒体资产项目中对于采集编码部分均采用第三方或合作方的产品。如:CNN项目中采用的视音频处理设备及软件均为Sony的产品。
存储技术:
媒体行业的特点就是其内容量非常之大,不光是总量大,而且单体也相当之大,如一部电影数字化以后高码流的文件可达上百个GB的数据量,这对存储技术就提出了更高的要求。在扩展性方面要求系统能够支持从GB到TB级,甚至到PB级的扩展。但用户普遍担心由于数据量的增大或大数据量的交换导致效率的降低。在这些方面IBM有其独特的解决办法。在其三角形结构上,内置的多层级存储管理技术可以使每个资源对象库都可支持多级存储体系的模式。资源服务器内置的存储集合功能可以根据用户已有的存储介质及存储内容的访问速度、期限等需要制定灵活的存储管理策略,而且一个存储集合可以跨多个资源服务器,实现对不同优先级别资料的不同存储部署策略。通过和IBM TSM(Tivoli Storage Manager)软件的集成,可以提供给用户更多存储介质的选择,从而实现多级存储模式。
媒体分析技术:
现在很多厂商开始在媒体分析技术上做文章,针对视频的内容进行分析,如:人面部特征分析、场景分析等,但属于是叫好不叫座,主要是实用性太差,在人面部分析中如果人面部是出于正面的话识别率可达90%左右,但总不能期待所有的视频资料中的人物全都是大头像。这种技术较适合于公安系统中的嫌疑犯比对。IBM在很早就在DB2中集成了一种可以利用截取的一幅图像查找到颜色、风格相近的其他图像的技术。但在CM后期的版本中却不见了踪影,不知是何原因。但不得不承认IBM在视频及语音的识别分析技术上一直是走在前面的。
查询检索技术:
在CM中集成了丰富的查询技术,包括文本以及数字化音频和视频信息的查询工具。用户使用自由文本查询工具简单而自然地表达查询请求,查询结果是一个按序列值排列的文件列表,相关概率最大的文件排列在最前面。而且还利用了自然语言处理技术和按语言语义统计对文档排序的技术提供基于概念的正文检索系统。在中文全文检索功能中,支持中文全文引挚,在建立索引时可以对文档进行语言分析,包括:文本格式分析;切词;数字及数量词的识别;专有中文名词的识别(如:中文人名的识别,外国人名的对应等等);运行中文语言词条的各种形式(如:规范格式,近义词,观念功能,支持词源,支持衍生词);用户领域的跟踪;GTR全文检索引擎功能的继承(布尔查询,关联查询的段落定位查询,精确查询,模糊查询,支持通配符等等)。并且支持最新的XQuery和XPath。
数字版权保护技术:
内容一旦数字化后用户就开始后怕,为什么呢?由于数字化导致内容得复制成为非常简单得事情,原来模拟磁带每次复制后都有相应的质量损失,数字化的复制就不存在这样的问题,怎样保护用户的合法权益呢?相应的就提出了数字版权保护的技术。
CM提供一系列全面的管理工具,对电子知识财产的访问和使用进行许可、控制和监督,并保护信息拥有者和最终用户的利益。在CM中集成水印及数字隐含应用,可以实现附加版权信息、注册商标的水印嵌入等功能。在INTERNET网络上进行信息发布时,通过集成在CM中的加密信封技术,可以保证数字信息在网上传递过程中的安全性、完整性。只得欣喜的是在微软的数字版权技术屡次被加密的情况下,IBM的数字加密技术目前尚无人将其破解,也就是说还算安全吧。
发布技术:
CM中的TransCoder功能可以适应各种发布渠道所需要的格式和风格,包括专线连接、卫星发送、Internet网络、PDA、移动电话等等,如发送到Internet时发送高清晰度的信息图形;而相同的信息发送到PDA时,则根据PDA的实际需要,仅发送缩略的题目和文摘等。由此,极大的丰富了系统的输出模式,为系统的进一步扩展奠定了基础。同时由于CM内部集成了视频服务器VideoCharger,因此支持多媒体中低码数据流的发布。
从上面看IBM是一个相当不错的内容管理平台,可是对于媒体行业中是如何评价CM的呢?
行业中有一种说法就是:CM是一个不错的管理平台,但深陷进去就拔不出来。这种说法有其一定的道理,因为首先CM消耗的费用是相当大的,虽然IBM的销售经常说其小规模的应用也就几十万而已,但真正应用起来软硬件动则就上千万,因此它只适合大型系统使用,如:新华社、中央电视台、SBL等。而且后期维护的费用也是相当大的。本人在实施完新华社的CM项目后深刻的体会到这句话的含义,无论从耗费资金和技术难度来讲都是如此。在实施新华社项目时,由于IBM提供的开发接口是建立在EIP之上的,简单的开发是简而易行的,但遇到深层次的开发就无从下手,而且在这方面IBM中国的支持也是相当差劲的,导致我们在泥潭里深陷差点不能自拔。虽然有如上的问题但到现在为止本人还是认为从平台角度来讲CM还是相当好的一套系统,可能只是不太适应国内媒体资产管理的需求吧。