|
|
MPEG-7标准
0 U$ f) h) @- n8 v" v/ m N! ? MPEG-7标准被称为“多媒体内容描述接口”,为各类多媒体信息提供一种标准化的描述,这种描述将与内容本身有关,允许快速和有效的查询用户感兴趣的资料。它将扩展现有内容识别专用解决方案的有限的能力,特别是它还包括了更多的数据类型。换而言之,MPEG-7规定一个用于描述各种不同类型多媒体信息的描述符的标准集合。该标准于1998年10月提出。
5 D# D3 O9 s; P/ p+ @4 }; ^, s( z ` C! o9 f- H) S) }6 f" |, y+ _1 k
MPEG-7的目标是支持多种音频和视觉的描述,包括自由文本、N维时空结构、统计信息、客观属性、主观属性、生产属性和组合信息。对于视觉信息,描述将包括颜色、视觉对象、纹理、草图、形状、体积、空间关系、运动及变形等。
- ], W& T7 m7 t# W; [
8 U/ D; E" F4 f; |( n/ ^# c1 @+ C+ b7 L MPEG-7的目标是根据信息的抽象层次,提供一种描述多媒体材料的方法以便表示不同层次上的用户对信息的需求。以视觉内容为例,较低抽象层将包括形状、尺寸、纹理、颜色、运动(轨道)和位置的描述。对于音频的较低抽象层包括音调、调式、音速、音速变化、音响空间位置。最高层将给出语义信息:如“这是一个场景:一个鸭子正躲藏在树后并有一个汽车正在幕后通过。”抽象层与提取特征的方式有关:许多低层特征能以完全自动的方式提取,而高层特征需要更多人的交互作用。MPEG-7还允许依据视觉描述的查询去检索声音数据,反之也一样。 # l; N T- q3 f- X: O% g
: P! F2 J3 e: W6 q# E4 Q& Y( n MPEG-7的目标是支持数据管理的灵活性、数据资源的全球化和互操作性。
5 g' r% B0 R- ~7 D1 u' h8 o2 |" S ) S) x" d- a- ^6 d1 d
MPEG-7标准化的范围包括:一系列的描述子(描述子是特征的表示法,一个描述子就是定义特征的语法和语义学);一系列的描述结构(详细说明成员之间的结构和语义);一种详细说明描述结构的语言、描述定义语言(DDL);一种或多种编码描述方法。
# _- L; F6 y, J# i# p
/ ~8 j3 `; Z& Z) @# v 在我们的日常生活中,日益庞大的可利用音视频数据需要有效的多媒体系统来存取、交互。这类需求与一些重要的社会和经济问题相关,并且在许多专业和消费应用方面都是急需的,尤其是在网络高度发展的今天,而MPEG-7的最终目的是把网上的多媒体内容变成象现在的文本内容一样,具有可搜索性。这使得大众可以接触到大量的多媒体内容,MPEG-7标准可以支持非常广泛的应用,具体如下:
' B6 y7 E: r* W& N# x- K6 A
- A7 @* u9 o9 \" h(1)音视数据库的存储和检索; + y; o0 A1 m/ U& L" W" j
(2)广播媒体的选择(广播、电视节目); 3 D* m3 x0 X3 `
(3)因特网上的个性化新闻服务; / z5 T8 L+ O( U0 U4 V. Z
(4)智能多媒体、多媒体编辑; , a0 Y2 }3 w4 S+ E b; ]. Y
(5)教育领域的应用(如数字多媒体图书馆等); ) `& b) L! n( h8 e3 i6 t0 u
(6)远程购物; , F( m8 k* y4 Y5 {9 s
(7)社会和文化服务(历史博物馆、艺术走廊等);
1 l" e5 {! S3 G4 U$ q* _7 K/ r(8)调查服务(人的特征的识别、辩论等); 6 {8 ^# S. c D4 W& {: L
(9)遥感; Z# t6 Z; e) f7 F# D/ \ d
(10)监视(交通控制、地面交通等);
9 C3 ?7 N3 W+ [2 O* v9 u! z1 v2 u(11)生物医学应用; 7 a! p: `) s5 A6 y- G6 V) M/ I& o
(12)建筑、不动产及内部设计; , D8 C( N% p9 n3 I+ T% i. _
(13)多媒体目录服务(如,黄页、旅游信息、地理信息系统等); / C" ?- D) u' X4 q% c
(14)家庭娱乐(个人的多媒体收集管理系统等)。 ; _9 _. n' h+ _3 L5 X( B f5 {4 L
' G1 Q8 V, x- f3 [* I; ^/ ?
原则上,任何类型的AV(Audio-Video)材料都可以通过任何类型的查询材料来检索,例如,AV材料可以通过视频、音乐、语言等来查询,通过搜索引擎来匹配查询数据和MPEG-7的音视频描述。下面给出几个查询例子: $ S) U5 f1 k7 W: S$ q, K8 g9 Y/ D: m
6 s, N9 E% l+ |, m6 w1 ]- m
音乐:在键盘上弹几个音符就能得到包含(或近似)要求曲调的音乐作品列表,或以某种方式匹配音符的图象,例如,从情感方面。
2 W/ q2 J( v U/ k - E) [! ]4 I5 P
图形:在屏幕上画几条线就能得到类似图形、标识、表意文字(符号)等的一组图象。 5 J% }. |8 ^0 {; |6 g0 F. n
' S6 z' t" w( ^4 ?# N
运动:对一组给定的物体,描述在物体之间的运动和关系,就会得到实现所描述的时空关系的动画列表。 + l- w+ U% g ^4 E. _
9 Z4 g+ W# [0 ^% ~' Y9 }- a
电影拍摄剧本(剧情说明):对给定的内容,描述出动作就会得到发生类似动作的电影拍摄剧本(剧情说明)列表。 " E- X& C( ]0 H3 ^' T. u1 e+ B0 t; h
& h! o0 E5 r- c |
|