Está en la página 1de 134

专 利 权 无 效 宣 告 请 求 书

请按照 “注意事项”正确填写本表各栏 此框内容由国家知识产权局填写

② 专利号 2011800291923 授权公告日 2018-08-10 ①案件编号 000000



利 发明创造名称 显著性图和变换系数块的编码

请 专利权人 GE 视频压缩有限责任公司

姓名或名称 联合专利有限责任公
用户代码 电话 +1 650-999-0889

③无效宣告请求人

居民身份证件号码或统一社会信用代码/组织机构代码
电子邮箱

国籍或注册国家(地区) 美国 邮政编码 200090

经常居所地或营业所所在地 美国

省、自治区、直辖市 市县

城区(乡)、街道、门牌号 华盛顿特区西北康涅狄格大道 1875 号 10 层

姓名 闫宇,周方华 电话 010-58256366

电子邮箱 邮政编码 100013


省、自治区、直辖市 北京市 市县 东城区

城区(乡)、街道、门牌号 北京市东城区北三环东路 36 号 2 号楼 C1910 房间


名称 北京魏启学律师事务所 代码 11398

利 姓 名 周方华 姓 名 闫宇
代 代 代
理 理 执业证号 1139817980.1 理 执业证号 1139813014.0
机 人 人
(1) 电 话 010-58256366 (2) 电 话 010-58256366

⑥ 根据专利法第 45 条及专利法实施细则第 65 条的规定,对上述专利权提出无效宣告请求。

⑦无效宣告请求的理由、范围及所依据的证据

理 由 范 围 依据的证据
专利法第 22 条,第 2 款 权利要求 1、3、4、5、6、7、8 证据 1 及其部分译文
实施细则第 条,第

1
101001
2019.4
专 利 权 无 效 宣 告 请 求 书

专利法第 22 条,第 3 款 权利要求 1、3、4、5、6、7、8 证据 1 及其部分译文、证据 2


实施细则第 条,第

专利法第 26 条,第 4 款 权利要求 1、5、6、7 涉案专利授权文本
实施细则第 条,第

⑧结合证据对无效宣告请求理由的具体陈述意见:

请参见附件无效宣告请求书正文。

⑨附件清单:
【附件名称】 无效宣告请求书正文 【附件属性】 电子件
【附件名称】 证据 1:US2008/0219578A1 【附件属性】 电子件
【附件名称】 证据 1 部分译文 【附件属性】 电子件
【附件名称】 证据 2:CN101682771A 【附件属性】 电子件
【附件名称】 涉案专利授权文本 【附件属性】 电子件
【附件名称】 无效请求人资格文件及其译文 【附件属性】 电子件

⑩无效宣告请求人或专利代理机构签字或者盖章 11 国家知识产权局处理意见

北京魏启学律师事务所

2021 年 02 月 04 日 年 月 日

2
101001
2019.4
无效宣告请求书正文

尊敬的专利局复审和无效审理部:
根据专利法第45条、专利法实施细则第65条的规定,请求人请求宣告
如下发明专利(以下称为“涉案专利”)的专利权无效:
专利号:ZL201180029192.3
申请日:2011年4月11日
授权公告日:2018年8月10日
发明名称:显著性图和变换系数块的编码

一、无效宣告请求的范围及理由
1、涉案专利的权利要求1、3~8不具备新颖性,不符合专利法第22条
第2款的规定。
2、涉案专利的权利要求1、3~8不具备创造性,不符合专利法第22条
第3款的规定。
3、涉案专利的权利要求1、5、6和7不清楚,不符合专利法第26条第4
款的规定。
4、涉案专利的权利要求1、5、6和7得不到说明书支持,不符合专利法
第26条第4款的规定。

二、证据
证据1:US2008/0219578A1,公开日为2008年9月11日;及其部分中文
译文。
证据2:CN101682771A,公开日为2010年3月24日。
证据1和证据2的公开日早于涉案专利的优先权日2010年4月13日,根据
专利法第22条第2款和第3款的规定,证据1和证据2可以作为现有技术评价
涉案专利的新颖性和创造性。

三、具体理由陈述
(一)关于新颖性和创造性

-1-
无效宣告请求书正文

1、关于权利要求1不具有新颖性和创造性
权利要求1的内容如下:
1.一种用于解码来自数据流的指示变换系数块内的显著变换系数的位
置的显著性图的装置,所述装置包括:
解码器,被配置为从所述数据流抽取指示所述变换系数块内的显著变
换系数的位置的显著性图,然后抽取所述变换系数块内的所述显著变换系
数的值,在抽取所述显著性图时,通过上下文自适应熵解码从所述数据流
顺序地抽取第一类型语法元素;以及(以下称为“特征a”)
关联器,被配置为在所述变换系数块的位置中以预定扫描次序,将顺
序抽取的第一类型语法元素顺序地关联至所述变换系数块的位置,
(以下称
为“特征b”)
其中,所述解码器被配置为,在对所述第一类型语法元素进行上下文
自适应熵解码时,使用上下文,其中,依据显著变换系数根据先前被抽取
并被关联的第一类型语法元素而位于的若干位置,对于每个所述第一类型
语法元素,各自地选择所述上下文,所述若干位置在与当前第一类型语法
元素关联的位置的邻近区域内。(以下称为“特征c”)

1.1、关于主题名称“一种用于解码来自数据流的指示变换系数块内的
显著变换系数的位置的显著性图的装置”
证据1的第0052段记载了“残差块是通过将原始图像块与由帧内预测或
帧间预测产生的预测块之间的误差值变换至频域,然后对该值进行量化而
得到的块”,这公开了残差块是通过对预测块与原始图像块之间的差值进行
变换而获得,残差块即变换系数块;第0054段记载了“将残差块中不为0
的显著系数表达为1”,这公开了残差块内的系数包括显著变换系数。
证据1的第0027和0031段公开了解码指示残差块(即变换系数块)内的
显著变换系数的位置的显著性图的装置,具体请参见如下内容:
[0027]本发明提供一种用于基于上下文的二进制算术编码及解码的方
法和设备,其中,当编码指示残差块的显著系数的位置的显著性图时,进
一步划分使用与先前残差块的相关性的上下文建模,并且使MPS和LPS之
间的差异更大,从而可以提高二进制算术编码的性能。

-2-
无效宣告请求书正文

[0031]根据本发明的另一方面,提供了一种用于基于上下文的自适应
二进制算术解码的设备,包括:上下文选择单元,根据与当前残差块的系
数相对应的至少一个先前解码的残差块的系数是否是不为0的显著系数,选
择用于解码指示待解码的当前残差块中的显著系数的位置的预定标志的上
下文;以及二进制算术解码单元,根据所选择的上下文,使用概率信息对
表示当前残差块的显著系数的标志进行二进制算术解码。
证据1的图17和第0095至0102段公开了解码装置1700,其从图17的左侧
接收数据流,其中,第0100段公开了解码装置1700的算术解码单元1720对
指示残差块的系数的位置的标志进行解码,第0097段记载了“选择上下文
以解码预定标志即指示待解码的当前块的显著系数的位置的显著性图”。因
而,证据1公开了解码来自数据流的显著性图。
因此,证据1公开了涉案专利的权利要求1的主题名称。

1.2、关于特征a“解码器,被配置为从所述数据流抽取指示所述变换
系数块内的显著变换系数的位置的显著性图,然后抽取所述变换系数块内
的所述显著变换系数的值,在抽取所述显著性图时,通过上下文自适应熵
解码从所述数据流顺序地抽取第一类型语法元素”
(1)关于“解码器,从所述数据流抽取指示所述变换系数块内的显著
变换系数的位置的显著性图,然后抽取所述变换系数块内的所述显著变换
系数的值”
证据1的图17和第0096段公开了解码装置1700包括算术解码单元1720。
证据1的第0094段公开了从数据流中先解码显著性图,然后解码水平信
息和显著系数,具体请参见如下内容:
[0094]在操作1620中,通过使用根据在操作1620中选择的上下文的概
率信息,位流中指示当前残差块的显著系数的位置的显著性图被解码,然
后,显著系数的水平信息即符号和绝对值(abs)信息被解码,从而复原显
著系数位置处的系数值。
证据1的图17公开了解码装置的输入是数据流,因而第0094段提到的被
解码的显著性图和显著系数必然源自于数据流,其中公开的先解码显著系
统然后解码水平信息和显著系数相当于公开了“从所述数据流抽取指示所
述变换系数块内的显著变换系数的位置的显著性图,然后抽取所述变换系
-3-
无效宣告请求书正文

数块内的所述显著变换系数的值”。
另外,尽管证据1第0094段使用的术语是“解码”,但是本领域技术人
员理解,解码显著性图、水平信息和显著系数的过程就是从数据流“抽取”
显著性图、水平信息和显著系数的过程,这是证据1隐含公开的内容。
因此,证据1公开或隐含公开了“解码器,从所述数据流抽取指示所述
变换系数块内的显著变换系数的位置的显著性图,然后抽取所述变换系数
块内的所述显著变换系数的值”的特征。

(2)关于“在抽取所述显著性图时,通过上下文自适应熵解码从所述
数据流顺序地抽取第一类型语法元素”
证据1的第0031段公开了“在抽取所述显著性图时,通过上下文自适应
解码从所述数据流抽取第一类型语法元素”,具体请参见如下内容:
[0031]根据本发明的另一方面,提供了一种用于基于上下文的自适应
二进制算术解码的设备,包括:上下文选择单元,根据与当前残差块的系
数相对应的至少一个先前解码的残差块的系数是否是不为0的显著系数,选
择用于解码指示待解码的当前残差块中的显著系数的位置的预定标志的上
下文;以及二进制算术解码单元,根据所选择的上下文,使用概率信息对
表示当前残差块的显著系数的标志进行二进制算术解码。
证据1的图7和第0054段记载了“以图7的残差块1中示出的曲折扫描顺
序进行扫描,基于上下文的二进制算术编码残差块的显著性图81至84”,这
公开了显著性图的编码顺序。解码是与编码互逆的过程,因此,在解码显
著性图时抽取第一类型语法元素的顺序是与编码互逆的顺序,这是证据1
隐含公开的内容。
证据1的图13及其对应的段落公开了图像编码装置1300包括熵编码单
元1340,图像编码装置1300进行编码处理之后输出经编码数据流。证据1
的图17公开的解码装置1700接收经编码的数据流以对其进行解码。解码是
与编码互逆的过程,因此,证据1隐含公开了解码时使用的是熵解码。

另外,证据1的第0100段也公开了通过上下文自适应解码从数据流抽取
第一类型语法元素,具体请参见如下内容:

-4-
无效宣告请求书正文

[0100]算术解码单元1720根据所选择的上下文,利用概率信息,对指
示当前残差块的系数的位置的标志进行二进制算术解码。
证据1的第0053段记载了“根据本发明,通过考虑残差块之间的这些空
间相关性,根据先前残差块的对应系数是否是显著系数,对指示当前残差
块的第i个扫描索引(i=1,2,3,……,15,16)的系数是否是显著系数的预
定标志(即significant_coeff_flag[i])进行编码时通常使用的上下文被进一
步划分和选择,并且通过使用基于所选择的上下文的概率模型,编码
significant_coeff_flag[i]”,这也公开或隐含公开了使用上下文以及基于所选
择的上下文的概率模型,来解码表示残差块内的系数是否是显著系数的标
志,从而公开了通过上下文自适应解码从数据流抽取第一类型语法元素。
因此,证据1公开或者隐含公开了“在抽取所述显著性图时,通过上下
文自适应熵解码从所述数据流顺序地抽取第一类型语法元素”的特征。
综上,证据1公开或隐含公开了特征a。

1.3、关于特征b“关联器,被配置为在所述变换系数块的位置中以预
定扫描次序,将顺序抽取的第一类型语法元素顺序地关联至所述变换系数
块的位置”
证据1的第0054段记载了“例如,如图8所示,假设通过将残差块中不
为0的显著系数表达为1、将非显著系数表达为0而生成了显著性图81、82、
83和84,现在将描述对显著性图81至84的编码。以图7的残差块1中示出的
曲折扫描顺序进行扫描,基于上下文的二进制算术编码残差块的显著性图
81至84”,这公开了根据图7所述的扫描次序扫描系数值来生成图8所示的显
著性图,该显著性图表示变换系数块的位置。即,公开了特征b。
证据1的第0094段也公开了对显著性图以及数据流中的水平信息和绝
对值信息进行解码,从而恢复显著系数位置处的系数值。这也公开了将上
述系数值与变换系数块的位置相关联,即公开了将第一类型语法元素关联
至变换系数块的位置,具体请参见如下内容:
[0094]在操作1620中,通过使用根据在操作1620中选择的上下文的概
率信息,位流中指示当前残差块的显著系数的位置的显著性图被解码,然
后,显著系数的水平信息即符号和绝对值(abs)信息被解码,从而复原显
著系数位置处的系数值。
-5-
无效宣告请求书正文

由于特征b中关联器的功能已被证据1所公开,因此,证据1的解码装置
必然包括该关联器。
因此,证据1公开或隐含公开了涉案专利的权利要求1中的特征b。

1.4、关于特征c“其中,所述解码器被配置为,在对所述第一类型语
法元素进行上下文自适应熵解码时,使用上下文,其中,依据显著变换系
数根据先前被抽取并被关联的第一类型语法元素而位于的若干位置,对于
每个所述第一类型语法元素,各自地选择所述上下文,所述若干位置在与
当前第一类型语法元素关联的位置的邻近区域内”
(1)关于“在对所述第一类型语法元素进行上下文自适应熵解码时,
使用上下文”
证据1已公开该特征,具体请参见对特征a中的“在抽取所述显著性图
时,通过上下文自适应熵解码从所述数据流顺序地抽取第一类型语法元素”
的分析。

(2)关于“依据显著变换系数根据先前被抽取并被关联的第一类型语
法元素而位于的若干位置,对于每个所述第一类型语法元素,各自地选择
所述上下文,所述若干位置在与当前第一类型语法元素关联的位置的邻近
区域内”
证据1的第0099段记载了“当选择用于解码当前残差块的显著性图的上
下文时,上下文选择单元1710可以使用两个先前解码的残差块的显著性图、
或分别位于当前残差块的上方和左方的两个相邻的先前残差块的显著性
图”,这公开了使用邻近的两个先前残差块的显著性图作为上下文,来进行
当前残差块的解码,从而公开了上述特征。
另外,证据1的图11和第0073段公开了,在编码显著性图100的第一扫
描索引101时,参考邻近的先前残差块1的显著性图111的第一扫描索引111
和邻近的先前残差块2的显著性图121的第一扫描索引121。
证据1的第0071段也公开了,通过使用当前残差块的邻近的上方和左方
的两个残差块的显著性图作为上下文,来编码当前显著性图。
在证据1公开了在编码过程中依据与先前被编码的第一类型语法元素

-6-
无效宣告请求书正文

相关联的若干位置、针对当前第一类型语法元素选择上下文的情况下,与
编码互逆的解码必然以对应的方式的选择上下文。即,证据1也隐含公开了
上述特征。
因此,证据1公开或隐含公开了涉案专利的权利要求1中的特征c。

综上,证据1公开了涉案专利的权利要求1中的所有特征,并且,涉案
专利和证据1都属于图像编解码的技术领域,且都能够解决使用上下文对显
著性图进行解码的技术问题并达到相同技术效果,因此,涉案专利的权利
要求1相对于证据1不具备新颖性。
另外,根据上述分析,即使认为有部分特征未被证据1明确公开,该部
分特征也是本领域公知常识。因此,涉案专利的权利要求1相对于证据1和
公知常识的结合不具备创造性。

2、关于权利要求3不具有新颖性和创造性
权利要求3的内容如下:
3 .一种基于变换的解码器,所述解码器被配置为使用根据权利要求1
或2所述的对来自数据流的指示变换系数块内的显著变换系数的位置的显
著性图进行解码的装置对所述变换系数块解码,并对所述变换系数块执行
从频谱域到空间域的变换。

根据对权利要求1的分析,证据1的图17公开了使用权利要求1所述的装
置对变换系数块进行解码。
证据1的图7和第0051段记载了“将说明根据本发明通过考虑空间相关
性来选择用于编码显著性图的上下文的过程”,这公开了考虑空间相关性来
编码显著性图。
证据1的第0052段记载了“残差块是通过将原始图像块与由帧内预测或
帧间预测产生的预测块之间的误差值变换至频域,然后对该值进行量化而
得到的块”,这公开了通过将预测块和原始图像块之间的差值变换到频谱域,
来获得变换系数块。
因此,证据1的编码过程是执行从空间域到频谱域的变化来获得变换系
-7-
无效宣告请求书正文

数块,则与编码过程互逆的解码过程必然是对变换系数块执行从频谱域到
空间域的变换,即证据1隐含公开了“基于变换的解码器对所述变换系数块
执行从频谱域到空间域的变换”。
另外,解码器对变换系数块执行从频谱域到空间域的变换也是本领域
公知常识。
综上,在涉案专利的权利要求1不具备新颖性和创造性的情况下,权利
要求3中引用权利要求1的技术方案相对于证据1不具备新颖性,并且相对于
证据1和公知常识的结合不具备创造性。

3、关于权利要求4不具有新颖性和创造性
权利要求4的内容如下:
4 .一种预测性解码器,包括:
基于变换的解码器,被配置为使用根据权利要求1或2所述的对来自数
据流的指示变换系数块内的显著变换系数的位置的显著性图进行解码的装
置对所述变换系数块解码,并对所述变换系数块执行从频谱域到空间域的
变换以获得残差块;
预测器,被配置为为表示空间取样信息信号的信息取样阵列的块提供
预测;以及
组合器,被配置为组合所述块的所述预测和所述残差块以重建信息取
样阵列。

(1)关于“基于变换的解码器,被配置为使用根据权利要求1或2所述
的对来自数据流的指示变换系数块内的显著变换系数的位置的显著性图进
行解码的装置对所述变换系数块解码,并对所述变换系数块执行从频谱域
到空间域的变换以获得残差块”
根据对权利要求3的分析,证据1或者证据1与公知常识的结合公开了该
特征中引用权利要求1的内容。

(2)关于“预测器,被配置为为表示空间取样信息信号的信息取样阵
列的块提供预测”以及“组合器,被配置为组合所述块的所述预测和所述
-8-
无效宣告请求书正文

残差块以重建信息取样阵列”
证据1的图13和第0081至0082段公开了图像编码装置1300,其中,预测
单元1310进行输入图像的帧内预测并生成预测图像,具体请参见如下内容:
[0081]参照图13,图像编码设备1300包括预测单元1310、变换/量化单
元1320、反向变换/反向量化单元1330及熵编码单元1340。
[0082]预测单元对输入图像进行帧间预测以及帧内预测并生成预测图
像。
帧内预测即以表示空间取样信息信号的空间信息取样阵列的块为单位
的空间预测,因此,证据1公开或隐含公开了涉案专利的权利要求4所述的
“预测器”的特征。
另外,证据1的第0051段记载了“考虑空间相关性来选择用于编码显著
性图的上下文”,即公开了考虑空间相关性进行编码;第0052段记载了“残
差块是通过将原始图像块与由帧内预测或帧间预测产生的预测块之间的误
差值变换至频域,然后对该值进行量化而得到的块”,即公开了编码时通过
对预测块和原始图像块之间的差进行变换来获得残差块,这公开或隐含公
开了预测器的预测对象是以块为单位的信息。因此,证据1公开或隐含公开
了预测器对表示空间取样信息信号的信息取样阵列的块提供预测。
解码和编码为互逆的处理。在证据1的编码器包括进行空间预测的上述
预测器的情况下,证据1隐含公开了解码器包括进行逆向的空间预测的预测
器,从而隐含公开了涉案专利的权利要求4所述的“预测器”的特征。
证据1的第0083段记载了“将作为预测单元1310中生成的预测图像与输
入图像之间的差异的残差图像在变换/量化单元1320中被变换到频域中然
后被量化”,即公开了预测单元1310生成的预测图像与输入图像之差是残差
图像,变换/量化单元1320处理该残差图像。结合证据1的图13可知,变换/
量化单元1320处理后的残差图像经熵编码单元1340编码后输出数据流。
由于证据1公开了编码器将预测器所提供的预测与输入图像之差(残差
块)编码为数据流,因此,证据1隐含公开了解码器在重建输入图像(信息
取样阵列)时,对所述预测和所述残差块进行组合,以重建输入图像,从
而隐含公开了涉案专利的权利要求4所述的“组合器”的特征。
因此,在涉案专利的权利要求1不具备新颖性和创造性的情况下,权利
要求4中引用权利要求1的技术方案相对于证据1不具备新颖性,并且相对于
-9-
无效
效宣告请求
求书正文

证据1 和公知常
常识的结合
合不具备
备创造性。


另外,证 据2的图3 所示)和
3(如下所 和说明书第
第13页第 2段至第 14页第1段

公开了
了视频解码
码器60, 其中,预
预测单元 空间预测 单元并为
元54包含空 为熵解码后

据提供预 测,加法
的数据 法器64组合
合预测单
单元54的预
预测以及
及经过熵解
解码单元552
处理后
后获得的残
残差。


证据2的说
说明书第 13页第4段
段记载了 如下内容
容:

对于帧内 译码,预
预测单元554可包含
含空间预测
测单元, 而对于帧
帧间译码 ,
预测单
单元54可 包含运动
动补偿单元
元。逆量
量化单元5 逆量化,且
56执行逆 且逆变换单

元58执
执行逆变 换以将视
视频块的系
系数变回
回到像素域
域。加法 器将来自
自单元54 的
预测块
块与来自 逆变换单
单元58的经
经重构的
的残差块进
进行组合 经重构的 块,
合以产生经
所述经
经重构的 块存储在
在参考帧存
存储件62 果需要的 话,经重
2中。如果 重构的视频

块还可
可在被存 储在参考
考帧存储件
件62中之
之前通过去
去块滤波 器单元(未
未图示)。
经解码
码的视频 从参考帧
帧存储件662输出, 且还可被
被反馈到 预测单元
元54以供后

续预测
测中使用 。

关于证据 2的说明书
书第13页
页第4段记
记载的“帧
帧内译码”
”,说明书
书第11页 第
2段记 载了“帧
帧内预测模
模式可包 4×4亮度
包含多个4 测模式、 多个8× 8
度帧内预测
亮度帧
帧内预测模
模式、多 16亮度帧
多个16×1 帧内预测模 及多个8×8色度帧 内
模式以及
预测模
模式”,其 4×4亮度
其中的“4 度”、“8× 16亮度” 和“8×
×8亮度”、“16×1 ×8
色度”
”即“表 示空间取
取样信息信
信号的信
信息取样阵
阵列的块
块”。

因此,证 据2公开了
了使用预
预测单元5
54进行空 间预测以
以及使用 加法器644
组合预
预测块与残
残差块以
以产生经重
重构的块 给出了“ 预测器, 被配置 为
块,即,给
- 10 -
无效宣告请求书正文

为表示空间取样信息信号的信息取样阵列的块提供预测”以及“组合器,
被配置为组合所述块的所述预测和所述残差块以重建信息取样阵列”的技
术启示。
证据2涉及视频译码中的自适应系数扫描,属于与证据1和涉案专利相
同的图像编解码的技术领域。因此,在证据1公开了图13所示的预测性编码
器的情况下,本领域技术人员根据证据2所给出的预测性解码器的技术启示,
结合证据1和证据2、或者结合证据1、证据2和本领域公知常识可以获得涉
案专利权利要求4中引用权利要求1的所述的预测性解码器,而不需要付出
创造性的劳动。

综上,在涉案专利的权利要求1不具备新颖性和创造性的情况下,权利
要求4中引用权利要求1的技术方案相对于证据1不具备新颖性,并且相对于
证据1与证据2和/或公知常识的结合不具备创造性。

4、关于权利要求5不具有新颖性和创造性
权利要求5的内容如下:
5 .一种用以将指示变换系数块内的显著变换系数的位置的显著性图编
码为数据流的装置,所述装置包括:计算机、微处理器或者可编程逻辑设
备,被配置为编码指示所述变换系数块内的显著变换系数的位置的显著性
图,然后编码所述变换系数块内的所述显著变换系数的值成为数据流,在
编码所述显著性图时,通过上下文自适应熵编码将第一类型语法元素顺序
编码为所述数据流,其中,所述装置进一步被配置为在所述变换系数块的
位置中以预定的扫描次序将所述第一类型语法元素顺序地编码为所述数据
流,其中所述装置被配置为,在对每个所述第一类型语法元素进行上下文
自适应熵编码时使用上下文,其中,依据显著变换系数位于的并且与先前
被编码为数据流的第一类型语法元素关联的若干位置,对于所述第一类型
语法元素,各自地选择所述上下文,所述若干位置在与当前第一类型语法
元素关联的位置的邻近区域内。

(1)关于主题名称“一种用以将指示变换系数块内的显著变换系数的
位置的显著性图编码为数据流的装置”
- 11 -
无效宣告请求书正文

证据1的第0027段公开了编码显著性图的装置,具体请参见如下内容:
[0027]本发明提供一种用于基于上下文的二进制算术编码及解码的方
法和设备,其中,当编码指示残差块的显著系数的位置的显著性图时,进
一步划分使用与先前残差块的相关性的上下文建模,并且使MPS和LPS之
间的差异更大,从而可以提高二进制算术编码的性能。
证据1的图14公开了编码装置1400,其处理过程与图17的解码装置1700
互逆。根据证据1的第0089段记载的“算术编码单元1420使用选择的上下文
对形成当前残差块的显著性图的每个二进制值进行二进制算术编码”和图
14右侧输出的数据流可知,证据1公开了将显著性图编码为数据流。
因此,证据1公开了涉案专利的权利要求5的主题名称。

(2)关于“所述装置包括:计算机、微处理器或者可编程逻辑设备”
证据1公开了通过计算机系统来实现其发明,具体请参见如下内容:
[0103]本发明还可以被实现为计算机可读记录介质上的计算机可读代
码。计算机可读记录介质是数据存储设备,其可以存储随后可以由计算机
系统读取的数据。计算机可读记录介质的示例包括只读存储器(ROM)、
随机存取存储器(RAM)、CD-ROM、磁带、软盘和光学数据存储设备。
计算机可读记录介质也可以分布在联网的计算机系统上,以便存储并以分
布式方式执行计算机可读代码。
计算机系统必然包括计算机、微处理器或者可编程逻辑设备,因此,
证据1公开或隐含公开了“所述装置包括:计算机、微处理器或者可编程逻
辑设备”。

证据2的说明书第18页第4段至第19页第1段也公开了“所述装置包括:
计算机、微处理器或者可编程逻辑设备”,具体请参见如下内容:
因此,本文中所描述的技术可以硬件、软件、固件或其任一组合来实
施。被描述为模块或组件的任何特征可一起实施于集成逻辑装置中或单独
实施为离散但可共同操作的逻辑装置。如果以软件实施,那么所述技术可
至少部分地由包含指令的计算机可读媒体实现,所述指令在被执行时实施
上述方法中的一者或一者以上。计算机可读数据存储媒体可形成可包括封

- 12 -
无效宣告请求书正文

装材料的计算机程序产品的一部分。计算机可读媒体可包含例如同步动态
随机存取存储器(SDRAM)等随机存取存储器(RAM)、只读存储器(ROM)、
非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器
(EEPROM)、快闪存储器、磁性或光学数据存储媒体,等等。另外或替代
地,所述技术可至少部分地由计算机可读通信媒体来实现,所述计算机可
读通信媒体携载或传送呈指令或数据结构形式且可由计算机存取、读取和/
或执行的代码。
所述代码可由一个或一个以上处理器(例如,一个或一个以上数字信号
处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵
列(FPGA),或其它等效的集成或离散逻辑电路)执行。因此,术语“处理
器”如本文中所用可指代前述结构中的任一者或适合实施本文中所描述的
技术的任何其它结构。另外,在一些方面中,本文中所描述的功能性可提
供于经配置以用于编码和解码的专用软件模块或硬件模块内,或并入组合
式视频编码器-解码器(CODEC)中。而且,所述技术可全部实施于一个或一
个以上电路或逻辑元件中。

另外,通过计算机、微处理器或者可编程逻辑设备运行代码来实现编
解码功能也是本领域的公知常识。

(3)关于“被配置为编码指示所述变换系数块内的显著变换系数的位
置的显著性图,然后编码所述变换系数块内的所述显著变换系数的值成为
数据流”
证据1的图9和第0058至0060段公开了上述特征。图9示出一种图像编码
方法,其中,第0058段公开了在操作910中编码显著性图,第0060段公开了
在后续操作中编码显著变换系数的值,具体请参见如下内容:
[0058]参照图9,在操作910中,从当前残差块的系数中确定不为0的显
著系数,该显著系数被设为1,从而生成指示当前残差块中系数的位置的显
著性图。换句话说,当前残差块中系数中的不为0的显著系数被设为1以生
成显著性图。通过significant_coeff_flag[i]表示显著性图,其中扫描索引i的
不为0的系数具有值1,扫描索引i的为0的系数具有值0。
[0060]在操作930中,通过使用根据选择的上下文的MPS和LPS的概率
- 13 -
无效宣告请求书正文

值,形成当前残差块的显著性图的二进制值significant_coeff_flag[i]被二进
制算术编码。例如,当图8所示的显著性图4的二进制值以曲折扫描顺序扫
描并编码时,形成显著性图4的二进制位串0111101000100000的各个位通过
使用根据先前残差块的对应索引的二进制值所选择的上下文进行二进制算
术编码。
另外,证据1的图13公开了图像编码装置1300,其包括预测单元1310、
变换/量化单元1320、反变换/反量化单元1330和熵编码单元1340,该熵编码
单元1340进行基于上下文的二进制算术编码,以生成数据流。图14公开了
基于上下文的二进制算术编码装置1400。其中,如图13和图14所示,编码
装置进行编码后生成数据流。
因此,证据1公开了“被配置为编码指示所述变换系数块内的显著变换
系数的位置的显著性图,然后编码所述变换系数块内的所述显著变换系数
的值成为数据流”。

(4)关于“在编码所述显著性图时,通过上下文自适应熵编码将第一
类型语法元素顺序编码为所述数据流,其中,所述装置进一步被配置为在
所述变换系数块的位置中以预定的扫描次序将所述第一类型语法元素顺序
地编码为所述数据流”
基于以上分析,证据1的图13和图14均公开了,在编码显著性图时通过
基于上下文的自适应熵编码来生成数据流。
证据1的图7和第0054段记载了“以图7的残差块1中示出的曲折扫描顺
序进行扫描,基于上下文的二进制算术编码残差块的显著性图81至84”,这
公开了显著性图的编码顺序,即通过曲折扫描的扫描次序来将第一类型语
法元素顺序编码为数据流。
证据1的第0089至0090段和图15公开了上下文自适应编码,具体请参见
如下内容:
[0089]算术编码单元1420使用选择的上下文对形成当前残差块的显著
性图的每个二进制值进行二进制算术编码。具体来说,使用通过上下文选
择单元1410选择的上下文所提供的形成当前残差块的显著性图的各个二进
制值的概率使实数0.0至实数1.0的间隔逐渐变窄。
[0090]图15示出根据本发明实施例在图14示出的算术编码单元1420中
- 14 -
无效宣告请求书正文

进行的二进制算术编码的过程的示例。在图15中,假设形成当前残差块的
显著性图的二进制值为010。1的概率为0.2,0的概率为0.8。这里,如上所
述,1和0的概率是通过根据与当前残差块的显著性图的二进制值相对应的
先前残差块的显著性图的二进制值是0还是1而选择的上下文所提供的概率。
0和1的概率根据显著性图的各扫描索引而变化。但是,为方便说明,这里
假设显著性图的各二进制值的1和0的概率相同。
因此,证据1公开了“在编码所述显著性图时,通过上下文自适应熵编
码将第一类型语法元素顺序编码为所述数据流,其中,所述装置进一步被
配置为在所述变换系数块的位置中以预定的扫描次序将所述第一类型语法
元素顺序地编码为所述数据流”。

(5)关于“其中所述装置被配置为,在对每个所述第一类型语法元素
进行上下文自适应熵编码时使用上下文,其中,依据显著变换系数位于的
并且与先前被编码为数据流的第一类型语法元素关联的若干位置,对于所
述第一类型语法元素,各自地选择所述上下文,所述若干位置在与当前第
一类型语法元素关联的位置的邻近区域内”
该特征已被证据1公开,具体分析如下。
证据1的图11和第0073段公开了,在编码显著性图100的第一扫描索引
101时,参考邻近的先前残差块1的显著性图111的第一扫描索引111和邻近
的先前残差块2的显著性图121的第一扫描索引121,具体请参见如下内容:
[0073]例如,在对当前残差块的显著性图100的第1个扫描索引101的二
进制值0进行编码时,如果在当前残差块之前被处理的先前残差块1的显著
性图110和先前残差块2的显著性图120的对应的第1个扫描索引111和121的
系数均为0,则选择(CTX 1,0→0)。如果先前残差块1的显著性图的第1个扫
描索引111的系数是显著系数且先前残差块2的显著性图120的第1个扫描索
引121的系数是0,则选择(CTX 1,1→0)。如果先前残差块1的显著性图110
和先前残差块2的显著性图120的对应的第1个扫描索引111和121的系数均
为显著系数,则选择(CTX 1,1→1)。
证据1的第0071也公开了,通过使用当前残差块的邻近的上方和左方的
两个残差块的显著性图作为上下文,来编码当前显著性图,具体请参见如
下内容:

- 15 -
无效宣告请求书正文

[0071]在另一实施例中,当对用于编码当前显著性图的上下文进行编
码时,可以使用至少两个残差块的显著性图或分别位于当前残差块的上方
和左方的两个相邻残差块的显著性图来确定上下文。也就是说,对于先前
两个残差块或分别位于当前残差块的上方和左方的两个相邻残差块的两个
系数均为显著系数、上述系数均为非显著系数以及只有一个系数是显著系
数的各情况,在编码当前残差块的显著性图中的各个二进制值时可以确定
不同的上下文。

综上,涉案专利的权利要求5相对于证据1不具备新颖性,并且相对于
证据1与证据2和/或公知常识的结合不具备创造性。

5、关于权利要求6不具有新颖性和创造性
权利要求6的内容如下:
6 .一种用于解码来自数据流的指示变换系数块内的显著变换系数的位
置的显著性图的方法,所述方法包括以下步骤:
从所述数据流抽取指示所述变换系数块内的显著变换系数的位置的显
著性图,然后抽取所述变换系数块内的所述显著变换系数的值,在抽取所
述显著性图时,通过上下文自适应熵解码从所述数据流顺序地抽取第一类
型语法元素;以及
在所述变换系数块的位置中以预定扫描次序将顺序抽取的第一类型语
法元素顺序地关联至所述变换系数块的位置,
其中,在对所述第一类型语法元素进行上下文自适应熵解码时,使用
上下文,其中,依据显著变换系数根据先前被抽取并被关联的第一类型语
法元素而位于的若干位置,对于每个所述第一类型语法元素,各自地选择
所述上下文,所述若干位置在与相应的第一类型语法元素关联的位置的邻
近区域内。

涉案专利的权利要求6是与权利要求1对应的方法权利要求,因此,基
于对权利要求1的分析,权利要求6相对于证据1不具备新颖性,并且相对于
证据1与公知常识的结合不具备创造性。

- 16 -
无效宣告请求书正文

6、关于权利要求7不具有新颖性和创造性
权利要求7的内容如下:
7 .一种用于将指示变换系数块内的显著变换系数的位置的显著性图编
码为数据流的方法,所述方法包括以下步骤:
编码指示所述变换系数块内的显著变换系数的位置的显著性图,然后
编码所述变换系数块内的所述显著变换系数的值成为数据流,在编码所述
显著性图时,通过上下文自适应熵编码将第一类型语法元素顺序编码为所
述数据流,其中,将所述第一类型语法元素顺序地编码为所述数据流在所
述变换系数块的位置中以预定的扫描次序执行,在每个所述第一类型语法
元素进行所述上下文自适应熵编码时使用上下文,其中,依据显著变换系
数位于的并且与先前被编码为数据流的第一类型语法元素关联的若干位置,
对于所述第一类型语法元素,各自地选择所述上下文,所述若干位置在与
当前第一类型语法元素关联的位置的邻近区域内。

涉案专利的权利要求7是与权利要求5对应的方法权利要求,因此,基
于对权利要求5的分析,权利要求7相对于证据1不具备新颖性,并且相对于
证据1和公知常识的结合不具备创造性。

7、关于权利要求8不具有新颖性和创造性
权利要求8的内容如下:
8 .计算机可读数字存储介质,具有含程序代码的计算机程序存储在其
上,当在计算机上运行时,所述程序代码执行根据权利要求6或7所述的方
法。

证据1公开了通过计算机系统读取存储在计算机可读存储介质上的计
算机可读代码来实现其发明,即公开了涉案专利的权利要求8所述的计算机
可读存储介质,具体请参见如下内容:
[0103]本发明还可以被实现为计算机可读记录介质上的计算机可读代
码。计算机可读记录介质是数据存储设备,其可以存储随后可以由计算机
- 17 -
无效宣告请求书正文

系统读取的数据。计算机可读记录介质的示例包括只读存储器(ROM)、
随机存取存储器(RAM)、CD-ROM、磁带、软盘和光学数据存储设备。
计算机可读记录介质也可以分布在联网的计算机系统上,以便存储并以分
布式方式执行计算机可读代码。
证据2的说明书第18页第4段也公开了涉案专利的权利要求8所述的计
算机可读存储介质,具体请参见如下内容:
因此,本文中所描述的技术可以硬件、软件、固件或其任一组合来实
施。被描述为模块或组件的任何特征可一起实施于集成逻辑装置中或单独
实施为离散但可共同操作的逻辑装置。如果以软件实施,那么所述技术可
至少部分地由包含指令的计算机可读媒体实现,所述指令在被执行时实施
上述方法中的一者或一者以上。计算机可读数据存储媒体可形成可包括封
装材料的计算机程序产品的一部分。计算机可读媒体可包含例如同步动态
随机存取存储器(SDRAM)等随机存取存储器(RAM)、只读存储器(ROM)、
非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器
(EEPROM)、快闪存储器、磁性或光学数据存储媒体,等等。另外或替代
地,所述技术可至少部分地由计算机可读通信媒体来实现,所述计算机可
读通信媒体携载或传送呈指令或数据结构形式且可由计算机存取、读取和/
或执行的代码。

另外,将包含程序代码的计算机程序存储在计算机可读数字存储介质,
并在计算机上运行该计算机程序以执行方法,这也是本领域的公知常识。

因此,在涉案专利的权利要求6和7不具备新颖性和创造性的基础上,
权利要求8相对于证据1不具备新颖性,并且相对于证据1与证据2和/或公知
常识的结合不具备创造性。

(二)关于不清楚和不支持
1、关于权利要求1、5至7不清楚
涉案专利的权利要求1限定了“关联器,被配置为在所述变换系数块的
位置中以预定扫描次序,将顺序抽取的第一类型语法元素顺序地关联至所

- 18 -
无效宣告请求书正文

述变换系数块的位置”,然而,本领域技术人员不清楚该预定扫描次序为何
种扫描次序,因此,权利要求1的保护范围不清楚,不符合专利第26条第4
款的规定。
基于同样的理由,权利要求5至7的保护范围也不清楚,不符合专利法
第26条第4款的规定。

2、关于权利要求1、5至7得不到说明书支持
涉案专利的说明书仅在图8中记载了从左上方到右下方或者从左下方
到右上方的特定扫描次序,本领域技术人员无法预知除了该特定扫描次序
之外的其它扫描次序是否能够实现其技术方案,因此,权利要求1得不到说
明书支持,不符合专利第26条第4款的规定。
基于同样的理由,权利要求5至7也得不到说明书支持,不符合专利法
第26条第4款的规定。

综上所述,涉案专利的权利要求1、3至8不符合专利法第22条第2款和
第3款的规定,涉案专利的权利要求1、5至7不符合专利法第26条第4款的规
定,恳请国家知识产权局宣告涉案专利的专利权无效。

- 19 -
证据1
证 据 1 的 部 分 译 文

用于上下文自适应二进制算术编码及解码的方法和设备

公开号:US2008/0219578A1

公开日:2008 年 09 月 11 日


 
说 明 书 译 文
用于上下文自适应二进制算术编码及解码的方法和设备

相关专利申请的交叉引用

[0001]本申请要求在 2007 年 3 月 7 日提交韩国专利局、申请号为 10-2007-0022584


的韩国专利申请的优先权,其全部内容通过引用结合在本申请中。

背景技术

[0002] 1、技术领域

[0003]本发明的设备和方法涉及上下文自适应二进制算术编码(CABAC),具体
涉及对用于指示残差块内的具有非零值的显著系数的位置的显著性图进行
CABAC 编码及 CABAC 解码的设备和方法。

[0004] 2、现有技术

[0005]由于运动图片数据量非常大,通常在存储或发送运动图片数据前将其压缩。
压缩数据的方法有很多,并且数据的压缩应满足预定的标准。这些标准包括
MPEG-4 标准第 10 部分“高级视频编码(AVC)”或 ITU-T H.264 标准。制定 H.264
是为了应对诸如移动通信网络等通信信道的快速渗透,并且旨在使各种通信基础
结构能够从传统的电路交换方法切换到分组交换服务。与以前的 MPEG-4 标准
第 2 部分“可视编解码”相比,H.264 的编码效率提高了 50%以上。H.264 是一种
视频数据压缩标准,它考虑了快速变化的无线环境和互联网环境,从而减少了错
误。H.264 还考虑了网络自适应方法。

[0006]H.264 采用上下文自适应二进制算术编码(CABAC),这是一种具有更高
压缩效率的算术编码技术。CABAC 是一种采用符号的概率来压缩数据的熵编码
方法。

[0007]图 1 是示出传统技术中 CABAC 设备的框图。在 H.264 编码过程中,在残


差块单元中进行离散余弦变换,每个残差块的大小为 44。随后,针对每个 44
残差块生成一个语法元素。

[0008]参照图 1,传统技术的 CABAC 编码设备大体上包括二进制化器 10、上下


文建模器 20 和二进制算术编码器 30。另外,算术编码器 30 包括常规编码引擎
32 和旁路编码引擎 34。

[0009]如果输入了非二进制值的语法元素,则二进制化器 10 将该语法元素映射
至二进制值的序列中,由此输出二进制位串。

[0010]为了提高编码进程的处理速度,通过二进制化器 10 映射至二进制值而得
到的二进制位串、或从具有二进制值的语法元素中选择的预定的二进制值不输入
到上下文建模器 20 而由旁路编码器 34 编码,并输出为位流。其他二进制值输入


 
说 明 书 译 文
到上下文建模器 20。这里,二进制值指示二进制位串中的各个位。

[0011]基于输入的二进制值或先前编码的语法元素,上下文建模器 20 确定对当
前输入的二进制值进行编码所需的概率模型。

[0012]常规编码引擎 32 基于上下文建模器 20 中确定的概率模型来对输入的二进


制值进行算术编码,并生成位流。

[0013]根据 H.264 标准草案,将当前编码的块分类到如下表 1 种所示的大略五种


类型,应用不同的上下文从而针对每个类型的块将语法元素编码。

表1
块类型 # of coeff 上下文类型
帧内 16*16 模式亮度 DC 16 0:Luma-Intra16-DC

帧内 16*16 模式亮度 AC 15 1: Luma-Intra16-AC

帧内 4*4 模式亮度 DC 块 16 2:Luma-44
帧内模式亮度 DC 块 16
帧内模式 U 色度 DC 块 4 3:Chroma-DC
帧内模式 V 色度 DC 块 4
帧内模式 U 色度 DC 块 4
帧内模式 V 色度 DC 块 4
帧内模式 U 色度 DC 块 15 4: Chroma-AC
帧内模式 V 色度 DC 块 15
帧内模式 U 色度 DC 块 15
帧内模式 V 色度 DC 块 15

[0014]在根据 H.264 的编码过程中,以 44 残差块为单位进行 DCT 和量化处理,


之后,针对每个 44 残差块生成残差数据的语法元素。H.264 中定义的 44 残差
块的语法元素包括 coded_block_flag、significant_coeff_flag[i]和 coeff_sign_flag[i]。

[0015]图 2 是示出传统技术中编码残差数据的过程的流程图。

[0016]参照图 2,在操作 210 中,对指示当前 44 残差块的 16 个量化后的系数中


是否包括非零系数值的 coded_block_flag 进行编码。在给定的残差块中,如果
coded_block_flag 为 0,则说明不存在待发送的信息。根据 H.264 标准草案,通
过使用用于对与当前残差块相同类型的相邻块进行编码的上下文信息,来确定用
于对当前残差块的 coded_block_flag 进行编码时使用的上下文,这些相邻块位于
当前残差块的上方和左方。

[0017]在操作 220 中,如果当前 44 残差块中存在非零系数值(以下称为显著系


数),则编码指示显著系数的位置的显著性图。用有效位和块结束符(EOB)形
成显著性图。有效位指示根据每个扫描索引的系数是显著系数还是 0,并由

 
说 明 书 译 文
significant_coeff_flag[i]表示。这里,significant_coeff_flag[i]指示 44 残差块的 16
个系数中第 i 个扫描索引的系数值是否为 0。

[0018]图 3A 和 3B 示出传统技术中 44 残差块的显著性图。

[0019]参照图 3A,假设 44 残差块 31 中的系数中的 x 标记位置处的系数具有预


定的非零值。在这种情况下,如图 3B 所示,通过将 44 残差块的系数中的每个
显著系数表达为 1、将每个非显著系数表达为 0,得到显著性图 32。按照预定的
扫描顺序扫描显著性图,从而执行基于上下文的算术编码。例如,在从左到右,
从上到下扫描内容的光栅扫描的情况下,如图 3A 所示的显著性图被编码时,基
于 上 下 文 编 码 二 进 制 位 串 1111111110101000 。 为 了 编 码 显 著 性 图 , 对
significant_coeff_flag 和 last_significant_coeff_flag 使用了 15 种不同的概率模型。
用于编码显著性图的上下文是根据预定扫描顺序的扫描位置确定的。也就是说,
根据传统技术,当编码图 3B 所示的显著性图时,根据每个系数的位置确定所使
用的上下文。

[0020]再次参照图 2,在操作 230 中,编码显著系数的水平信息即显著系数的符


号和绝对值(abs)。关于图像编码有效性,已知 CABAC 的性能通常比上下文自
适应可变长度编码(CAVLC)的性能更好。CAVLC 的开销比 CABAC 的开销大
10-15%。

[0021]图 4 示出了对于各种根据传统技术的量化参数值,CABAC 和 CAVLC 之


间的性能差异。图 4 示出了使用 CAVLC 对图像序列(足球 CIF)的符号和纹理
进行编码时的开销量相对于使用 CABAC 编码相同的图像的符号和纹理时发生
的开销量的增量。符号(◆)表示与 CABAC 相比,使用 CAVLC 对图像序列(足
球 CIF)的符号进行编码时增加的开销量。符号(■)表示与 CABAC 相比,使
用 CAVLC 编码图像序列(足球 CIF)的纹理时增加的开销量。

[0022]参照图 4,编码纹理时,随着量化参数(QP)值的增大,使用 CAVLC 时


产生的开销量比 CABAC 产生的开销量大大增加。但是,当 QP 值低时,使用
CAVLC 时产生的开销与使用 CABAC 产生的开销量没有太大差异。参照图 4,
例如,当 QP 值为 24 时,使用 CAVLC 编码纹理时开销的增量仅为 3%。换句话
说,当 QP 值小时,即图像的画质良好时,CABAC 的编码性能相对下降。

[0023]在低 QP 下 CABAC 编码性能降低的原因之一是指示显著系数的位置的显


著性图的上下文建模效率低下。

[0024]图 5 示出根据传统技术编码 4×4 残差块的显著性图时出现的各个扫描索引


中的显著系数的概率。图 6 示出根据传统技术针对量化参数值的变化编码 4×4
残差块的显著性图时出现的各个扫描索引中非显著系数的概率。图 5 示出当
QP=24 且足球 QCIF 图像的 4×4 残差块的显著性图按照光栅扫描顺序被扫描时每
个扫描索引的显著系数的概率。图 6 示出当 BUS CIF 图像的 4×4 残差块的显著
性图分别在 QP=24、QP=30 和 QP=34 时的各扫描索引中出现非显著系数即为 0
的系数的概率。这里,扫描索引是指示根据扫描顺序的 4×4 残差块的每个系数的


 
说 明 书 译 文
位置的索引。例如,扫描索引 1 表示位于 4×4 残差块的第一行第一列的直流
(DC)
分量的系数的位置。

[0025]参照图 5,在如第二和第五扫描索引的一些扫描索引中,显著系数的概率
和非显著系数的概率均为约 50%,并彼此相似。参照图 6,随着 QP 值减小,DC
分量周围的系数,特别是,例如,在第 1 个、第 5 个和第 9 个扫描索引中,显著
系数和非显著系数之间的概率差变得相对较小。

[0026]由此,在传统技术中,一些扫描索引中的非显著系数的概率和显著系数的
概率被设为相似的值。也就是说,当编码显著性图时,根据扫描索引设置上下文,
并且在根据选择的上下文的概率模型中,某些扫描索引的最大概率符号(MPS)
和最小概率符号(LPS)的概率可以被设为相似的值。MPS 和 LPS 的概率相似
时 CABAC 的性能降低。这是众所周知的。因此,当选择了用于编码显著性图的
上下文时,为了扩大 MPS 和 LPS 的概率之间的差,需要更高效进行上下文建模
的方法。

发明内容

[0027]本发明提供一种用于基于上下文的二进制算术编码及解码的方法和设备,
其中,当编码指示残差块的显著系数的位置的显著性图时,进一步划分使用与先
前残差块的相关性的上下文建模,并且使 MPS 和 LPS 之间的差异更大,从而可
以提高二进制算术编码的性能。

[0028]根据本发明的一个方面,提供了一种基于上下文的自适应二进制算术编码
的方法,包括:从预定大小的当前残差块中的系数中确定不为 0 的显著系数;根
据对应于所述当前残差块的系数的至少一个先前的残差块的系数是否是显著系
数,选择用于编码指示所述当前残差块中显著系数的位置的预定标志的上下文;
以及根据选择的上下文对所述标志进行基于上下文的自适应二进制算术编码。

[0029]根据本发明的另一方面,提供了一种用于基于上下文的自适应二进制算术
编码的设备,包括:存储单元,其存储与在预定大小的当前残差块之前处理的残
差块的语法元素相关的信息,以及与指示显著系数的位置的预定标志相关的信息;
上下文选择单元,其根据与当前残差块的系数相对应的至少一个先前的残差块的
系数是否是显著系数,通过使用从存储单元读取的标志信息,选择用于对指示当
前残差块中的显著系数的位置的标志进行编码的上下文;以及算术编码单元,其
通过使用选择的上下文对当前残差块的标志进行基于上下文的自适应二进制算
术编码。

[0030]根据本发明的另一方面,提供了一种基于上下文的自适应二进制算术解码
的方法,包括:根据与当前残差块的系数相对应的至少一个先前解码的残差块的
系数是否是不为 0 的显著系数,选择用于解码指示待解码的当前残差块中的显著
系数的位置的预定标志的上下文;以及根据所选择的上下文,使用概率信息对表
示当前残差块的显著系数的标志进行二进制算术解码。


 
说 明 书 译 文
[0031]根据本发明的另一方面,提供了一种用于基于上下文的自适应二进制算术
解码的设备,包括:上下文选择单元,根据与当前残差块的系数相对应的至少一
个先前解码的残差块的系数是否是不为 0 的显著系数,选择用于解码指示待解码
的当前残差块中的显著系数的位置的预定标志的上下文;以及二进制算术解码单
元,根据所选择的上下文,使用概率信息对表示当前残差块的显著系数的标志进
行二进制算术解码。

附图说明

[0032]通过参考附图详细描述其示例性实施例,本发明如上所述以及其他特征和
优势将变得更加明显,其中:

[0033]图 1 是示出传统技术中用于上下文自适应二进制算术编码(CABAC)的
设备的框图。

[0034]图 2 是示出传统技术中编码残差数据的过程的流程图。

[0035]图 3A 和 3B 示出传统技术中 4×4 残差块的显著性图。

[0036]图 4 示出了传统技术中针对各种量化参数值而言 CABAC 和上下文自适应


可变长度编码(CAVLC)之间的性能差异。

[0037]图 5 示出根据传统技术编码 4×4 残差块的显著性图时每个扫描索引中的显


著系数出现的概率。

[0038]图 6 示出针对传统技术中量化参数值的变化,当 4×4 残差块的显著性图被


编码时每个扫描索引中非显著系数出现的概率。

[0039]图 7 示出根据本发明实施例进行编码的 4×4 残差块的示例。

[0040]图 8 示出根据本发明实施例的图 7 所示的 4×4 残差块的显著性图的示例。

[0041]图 9 是根据本发明实施例基于上下文对图像进行编码的方法的流程图。

[0042]图 10 示出根据本发明实施例使用与先前残差块相关的信息选择的上下文
的概率模型与根据传统的 H.264 标准草案的上下文的概率模型之间的比较。

[0043]图 11 是示出根据本发明实施例确定在编码当前残差块的显著性图时使用
的上下文的过程的细节图。

[0044]图 12 示出根据本发明实施例使用与两个先前残差块相关的信息所选择的
上下文的概率模型的示例。

[0045]图 13 是示出应用了根据本发明实施例的基于上下文的二进制算术编码设


 
说 明 书 译 文
备的图像编码设备结构的框图。

[0046]图 14 是示出根据本发明实施例的基于上下文的二进制算术编码设备的结
构的框图。

[0047]图 15 示出根据本发明实施例进行二进制算术编码的过程的示例。

[0048]图 16 是示出根据本发明实施例的基于上下文的二进制算术解码方法的流
程图。

[0049]图 17 示出根据本发明实施例的基于上下文的二进制算术解码设备的结构。

具体实施方式

[0050]现在将参照附图更全面地描述本发明,附图中示出了本发明的示例性实施
例。

[0051]首先,将说明根据本发明通过考虑空间相关性来选择用于编码显著性图的
上下文的过程。

[0052]图 7 示出根据本发明实施例进行编码的 4×4 残差块的示例。图 8 示出根据


本发明实施例的图 7 所示的 4×4 残差块的显著性图的示例。图 7 中,(Sa,b)表示
残差块 a 的第 b 个扫描索引的系数值。以下,假设残差块是通过将原始图像块与
由帧内预测或帧间预测产生的预测块之间的误差值变换至频域,然后对该值进行
量化而得到的块。此外,扫描索引是指示残差块中每个系数的位置的索引,并且
指示根据预定扫描顺序的显著性图的二进制值或残差块中系数的位置。例如,假
设以曲折扫描顺序扫描 4×4 残差块,则 4×4 残差块中的每个系数可以定义为由
根据扫描顺序的扫描索引 1 至 16 中任一个所表示的位置上的值。

[0053]先前残差块的系数和当前残差块的对应的系数之间存在预定的相关性。具
体来说,如果先前残差块的第 i 个扫描索引处的系数是不为 0 的显著系数,则当
前残差块中与该系数对应的第 i 个扫描索引处的系数也是不为 0 的显著系数的可
能性很大。例如,在图 7 中,如果残差块 3 的 DC 系数(S3,1)是非零显著系数,
则下一个块即残差块 4 的 DC 系数(S4,1)很可能也是非零显著系数。同样,如果
残差块 3 的 DC 系数(S3,1)为 0,则下一个残差块 4 的 DC 系数(S4,1)很可能也是
0。空间上彼此相邻的残差块的系数、特别是 DC 分量系数(Sa,1)(a=1,2,3,4)与
例如系数(Sa,2)、(Sa,3)、(Sa,4)、(Sa,5)和(Sa,6)(a=1,2,3,4)的具有相对低频分量
的相邻系数间的相关性很大。根据本发明,通过考虑残差块之间的这些空间相关
性,根据先前残差块的对应系数是否是显著系数,对指示当前残差块的第 i 个扫
描 索 引( i=1,2,3,……, 15,16 )的系数是否是显著系数的预定标志(即
significant_coeff_flag[i])进行编码时通常使用的上下文被进一步划分和选择,并
且通过使用基于所选择的上下文的概率模型,编码 significant_coeff_flag[i]。

[0054]例如,如图 8 所示,假设通过将残差块中不为 0 的显著系数表达为 1、将


 
说 明 书 译 文
非显著系数表达为 0 而生成了显著性图 81、82、83 和 84,现在将描述对显著性
图 81 至 84 的编码。以图 7 的残差块 1 中示出的曲折扫描顺序进行扫描,基于上
下文的二进制算术编码残差块的显著性图 81 至 84。根据本发明,对当前残差块
的显著性图的二进制值 significant_coeff_flag[i]编码时,根据至少一个或更多个先
前残差块的显著性图中的对应二进制值是 0 还是 1,确定用于对当前正在编码的
显著性图的二进制值 0 和 1 进行编码的上下文。例如,当对显著性图 4 的第 1
个扫描索引 89 的二进制值 0 进行编码时,根据先前残差块的显著性图 3 的第 1
个扫描索引 88 的对应二进制值是 0 还是 1,选择不同的上下文。在此,由 MPS
和 LPS 的概率值形成上下文,并且与先前显著性图中对应扫描索引的二进制值
相同的二进制值成为 MPS。也就是说,如果先前显著性图中对应扫描索引的二
进制值是 0,则 MPS 为 0,而如果对应扫描索引的二进制值是 1,则 MPS 为 1。

[0055]同样,根据先前残差块的显著性图 3 中对应索引的二进制值,选择用于对
显著性图 84 中的其余扫描索引的每个二进制值进行编码的上下文。如果对应于
当前残差块的显著性图的第 i 个扫描索引的先前残差块的显著性图的二进制值被
定义为 j(j=0, 1),且用于对当前显著性图的第 i 个扫描索引的二进制值进行编
码的上下文被定义为(CTXi,j),则当先前显著性图中对应扫描索引的二进制值是
0 时,选择(CTX i,0)以对当前显著性图的第 i 个扫描索引的二进制值进行编码,
并且当先前显著性图中对应扫描索引的二进制值为 1 时,选择(CTXi,1)。

[0056]例如,在图 8 中,对显著性图 4 的第 1 个索引 89 的二进制值进行编码时,


先前残差块的显著性图 3 的对应的第 1 个扫描索引 88 的二进制值为 1,因此选
择上下文(CTX 1,1)。如果先前残差块的显著性图 3 的对应的第 1 个扫描索引 88
的二进制值为 0,则当编码显著性图 4 的第 1 个扫描索引 89 的二进制值时,选
择上下文(CTX 1,0)。同样,当对显著性图 4 的第 i 个扫描索引的二进制值进行编
码时,根据先前残差块的显著性图 3 的对应的第 i 个扫描索引的二进制值,选择
上下文(CTX i,0)和(CTX i,1)中的任何一个。在先前显著性图的对应扫描索引的二
进制值为 0 时选择的上下文(CTX i,0)中,二进制值 0 在当前显著性图的扫描索引
中有更大的概率值。在先前显著性图的对应扫描索引的二进制值为 1 时选择的上
下文(CTX i,1)中,二进制值 1 在当前显著性图的扫描索引中有更大的概率值。

[0057]图 9 是根据本发明实施例基于上下文对图像进行编码的方法的流程图。

[0058]参照图 9,在操作 910 中,从当前残差块的系数中确定不为 0 的显著系数,


该显著系数被设为 1,从而生成指示当前残差块中系数的位置的显著性图。换句
话说,当前残差块中系数中的不为 0 的显著系数被设为 1 以生成显著性图。通过
significant_coeff_flag[i]表示显著性图,其中扫描索引 i 的不为 0 的系数具有值 1,
扫描索引 i 的为 0 的系数具有值 0。

[0059]在操作 920 中,根据在当前残差块之前被编码的至少一个或更多个先前残


差块的对应系数是否是显著系数,确定用于对当前残差块的显著性图进行编码的
上下文。为了确定用于对当前残差块的显著性图进行编码的上下文时考虑的先前
残差块的显著性图,可以使用在当前残差块之前编码的一个残差块的显著性图、
先前编码的至少两个残差块的显著性图、或分别位于当前残差块的上方和左方的


 
说 明 书 译 文
两个残差块的显著性图。但本发明并不限于此。为确定用于对当前残差块的显著
性图进行编码的上下文而考虑的先前残差块的显著性图的数量和类型可以发生
各种变化。

[0060]在操作 930 中,通过使用根据选择的上下文的 MPS 和 LPS 的概率值,形


成当前残差块的显著性图的二进制值 significant_coeff_flag[i]被二进制算术编码。
例如,当图 8 所示的显著性图 4 的二进制值以曲折扫描顺序扫描并编码时,形成
显著性图 4 的二进制位串 0111101000100000 的各个位通过使用根据先前残差块
的对应索引的二进制值所选择的上下文进行二进制算术编码。

[0061]图 10 示出根据本发明实施例使用与先前残差块相关的信息选择的上下文
的概率模型与根据传统的 H.264 标准草案的上下文的概率模型之间的比较。图
10 中示出了当 4×4 残差块的显著性图的第 1 个扫描索引 significant_coeff_flag[1]
被编码时使用的上下文的概率模型。另外,在图 10 所示的图中,X 轴上的 a→b
(a,b=0,1)表示先前残差块的显著性图中 significant_coeff_flag[1]=a,且当前残
差块的显著性图中 significant_coeff_flag[1]=b 的情况。也就是说,0→1 表示先前
残差块的为 0 的系数变为当前残差块中的显著系数的情况。1→0 表示先前残差
块的显著系数变为当前残差块中为 0 的系数的情况。1→1 表示先前残差块和当
前残差块中的系数均为显著系数的情况。0→0 表示先前残差块和当前残差块中
的系数均为 0 的情况。此外,图 10 所示的图中 Y 轴指示当前残差块的显著性图
中二进制值(b)的概率值,根据先前残差块的对应系数的值选择的上下文设置该
概率值。

[0062]参照图 10,在传统 H.264 标准草案中,根据当前残差块的扫描索引确定上


下文,而不管先前残差块的对应系数是 0 还是 1。H.264 标准草案中,在第 1 个
扫描索引位置,使用 1 的概率被设为 45%且 0 的概率被设为 55%的上下文。

[0063]但是,根据本发明,为了对当前残差块的显著性图进行编码,对先前残差
块的对应系数为显著系数的情况和该对应系数是非显著系数的情况进行划分,并
应用不同的上下文即不同的概率模型。

[0064]具体来说,如果先前残差块的对应系数是非显著系数(当 a→b 中 a 为 0
时),考虑空间相关性,从而选择当前残差块的对应系数也是非显著系数的概率
更大的上下文模型。如图 10 所示,在根据本发明的先前残差块的系数是 0 时选
择的上下文中,当前残差块的系数是显著系数的概率(0→1)为约 0.28(28%) ,
当前残差块的系数是 0 的概率(0→0)为约 0.72(72%)。因此,根据本发明,
当先前残差块的系数是为 0 的非显著系数时,选择 0 是 MPS 且概率比 1 的概率
大的上下文。

[0065]同样,根据本发明,当先前残差块的对应系数是显著系数(当 a→b 中 a
为 1)时,选择当前残差块的对应系数也是显著系数的概率更大的上下文模型。
在图 10 中,基于根据本发明在先前残差块的系数为显著系数时选择的上下文,
当前残差块的系数是显著系数(1→1)的概率为约 0.65(65%),当前残差块的
系数是 0(1→0)的概率为约 0.35(35%)。因此,根据本发明,当先前残差块的


 
说 明 书 译 文
系数是显著系数时,选择 1 是 MPS 且概率比 0 的概率大的上下文。

[0066]另外,在如图 10 所示的本发明中,通过根据先前残差块的系数是否是显
著系数而选择的上下文所设置的 MPS 和 LPS 的概率值之间的差被设为更大的值,
从而改善 CABAC 的性能。由于 CABAC 的性能随 MPS 和 LPS 的概率值之间的
差的增大而改善,因此,本发明根据先前残差块的系数是否是显著系数而应用次
分割的上下文模型,从而改善 CABAC 的性能。

[0067]图 11 是示出根据本发明实施例确定在编码当前残差块的显著性图时使用
的上下文的过程的细节图。

[0068]如上所述,为了确定用于对当前残差块的显著性图进行编码的上下文时考
虑的先前残差块的显著性图,可以使用在当前残差块之前编码的一个残差块的显
著性图、先前编码的至少两个残差块的显著性图、或分别位于当前残差块的上方
和左方的两个相邻残差块的显著性图。

[0069]例如,在对当前残差块的显著性图 100 的第 1 个扫描索引 101 的二进制值


0 进行编码时,根据在当前残差块之前被处理的先前残差块 1 的显著性图 110 的
对应的第 1 个扫描索引 111 处的系数是否是显著系数,可以确定不同的上下文。
在图 11 所示的情况下,先前残差块 1 的对应的第 1 个扫描索引 111 处的系数是
显著系数 1,因此当前残差块的对应的第 1 个扫描索引 101 的系数很可能也是显
著系数。在这种情况下,选择 MPS 是 1 且 1 具有相对较大概率的上下文,当前
残差块的显著性图 100 在第 1 个扫描索引处的二进制值 0 对应于 LPS。

[0070]用于实现根据先前残差块的对应系数来选择用于对当前残差块的显著性
图进行编码的上下文的处理的程序代码示例如下:

{ For ui<T
if(prev_block(Coeff[ui])
ctx_num_sig[coeff[ui]]=CTX1
Else
ctx_num_sig[coeff[ui]]=CTX2
For ui≥T
ctx_num_sig[coeff[ui]]=CTX3}

这里,prev_block(Coeff[ui])是二进制值,指示先前残差块中在预定扫描索引(ui)
处的系数是否是显著值,且在先前残差块的系数是显著系数时为 1,在该系数是
非显著系数时为 0。在程序代码中,选择用于对形成显著性图的每个二进制值进
行编码的上下文的过程仅针对预定数量(T)的二进制值而执行。这是因为,当
用曲折扫描方法进行扫描时,DC 系数和相邻系数间的空间相关性大,而高频分
量间的相关性较小。根据程序代码,当先前残差块的系数是显著系数时,选择
CTX1 作为用于对当前残差块的显著性图在预定扫描索引(ui)处的二进制值进行
编码而选用的上下文(ctx_num_sig[coeff[ui]])。当先前残差块的系数是非显著系数
时,选择 CTX2 作为用于对当前残差块的显著性图在预定扫描索引(ui)处的二进
10 
 
说 明 书 译 文
制值进行编码而选用的上下文(ctx_num_sig[coeff[ui]])。根据程序代码,当对指示
除与 DC 系数相邻的预定数量(T)的系数以外的剩余系数是否是显著系数的二
进制值进行编码时,选择 CTX3。

[0071]在另一实施例中,当对用于编码当前显著性图的上下文进行编码时,可以
使用至少两个残差块的显著性图或分别位于当前残差块的上方和左方的两个相
邻残差块的显著性图来确定上下文。也就是说,对于先前两个残差块或分别位于
当前残差块的上方和左方的两个相邻残差块的两个系数均为显著系数、上述系数
均为非显著系数以及只有一个系数是显著系数的各情况,在编码当前残差块的显
著性图中的各个二进制值时可以确定不同的上下文。

[0072]再次参考图 11,现在说明根据两个先前残差块的对应系数是否是显著系数
来确定用于对当前残差块的显著性图进行编码的上下文的情况。假设与当前残差
块的显著性图 100 的第 i 个扫描索引相对应的先前残差块 1 的显著性图 110 的二
进制值为 x(x=0,1),且先前残差块 2 的显著性图 120 的对应二进制值为 y(y=0,1),
则根据先前残差块 1 和 2 的显著性图 110 和 120 在对应扫描索引处的 x 和 y 值,
选择(CTX i,0→0)、(CTX i,0→1)、(CTX i,1→0)和(CTX i,1→1)中的一个作为
上下文(CTX i,x→y),以用于对当前显著性图的第 i 个扫描索引的二进制值进行
编码。

[0073]例如,在对当前残差块的显著性图 100 的第 1 个扫描索引 101 的二进制值


0 进行编码时,如果在当前残差块之前被处理的先前残差块 1 的显著性图 110 和
先前残差块 2 的显著性图 120 的对应的第 1 个扫描索引 111 和 121 的系数均为 0,
则选择(CTX 1,0→0)。如果先前残差块 1 的显著性图的第 1 个扫描索引 111 的系
数是显著系数且先前残差块 2 的显著性图 120 的第 1 个扫描索引 121 的系数是 0,
则选择(CTX 1,1→0)。如果先前残差块 1 的显著性图 110 和先前残差块 2 的显著
性图 120 的对应的第 1 个扫描索引 111 和 121 的系数均为显著系数,则选择(CTX
1,1→1)。

[0074]同样,当使用分别位于当前残差块的上方和左方的两个相邻残差块的显著
性图,并假设与当前残差块的显著性图 100 的第 i 个扫描索引相对应的先前残差
块 1 的显著性图 110 的二进制值为 x(x=0,1),且先前残差块 3 的显著性图 130
的对应的二进制值为 y(y=0,1)时,根据先前残差块 1 和 3 的显著性图 110 和
130 在对应扫描索引处的 x 和 y 值,选择(CTX i,0→0)、(CTX i,0→1)、(CTX i,
1→0)和(CTX i,1→1)中的一个作为上下文(CTX i,x→y)以对当前显著性图的第
i 个扫描索引的二进制值进行编码。

[0075]图 12 示出根据本发明实施例使用与两个先前残差块相关的信息选择的上
下文的概率模型的示例。在图 12 所示的图中,x 轴上的 a→b→c(a,b=0,1)
表示与当前残差块的显著性图的预定索引的二进制值(c)相对应的两个先前残
差块的显著性图的二进制值由 a 变成 b。例如,如在上文中描述的图 11 中,如
果当前残差的显著性图 100 的第 1 个索引 101 的二进制值为 0,且先前残差块 1
和 2 的显著性图 110 和 120 的对应的第 1 索引 111 和 121 的二进制值分别为 1 和
0,则表达为 0→1→1。另外,图 12 中的 y 轴表示通过根据先前残差块的对应系

11 
 
说 明 书 译 文
数的值选择的上下文所设置的当前残差块的显著性图的二进制值(c)的概率值。

[0076]参照图 12,为了对当前残差块的显著性图进行编码,对两个先前残差块的
对应系数均为非显著系数的情况(情况 1:0→0→0,0→0→1)、两个先前残差
块的对应系数均为显著系数的情况(情况 2:1→1→0,1→1→0)以及两个先前
残差块的对应系数中的一个是显著系数而另一个是非显著系数的情况(情况 3:
0→1→0,0→1→1,1→0→0,1→0→1)加以区分,并采用不同的上下文即不同
的概率模型。

[0077]具体来说,当先前残差块的对应系数均为非显著系数(情况 1)时,考虑
空间相关性,从而选择当前残差块的系数也是非显著系数的概率较大的上下文模
型。

[0078]如图 12 所示,根据本发明,当先前残差块的系数均为 0 时,选择 0 是 MPS


的概率为约 0.75(75%)且 1 是 LPS 的概率为约 0.25(25%)的上下文。

[0079]同样,根据本发明,当先前残差块的对应系数均为显著系数时(情况 2),
选择当前残差块的系数也是显著系数的概率更大的上下文模型。如图 12 所示,
根据本发明,当先前残差块的系数均为 1 时,选择作为 MPS 的 1 的概率为约 0.80
(80%)且作为 LPS 的 0 的概率为约 0.20(20%)的上下文。同时,当先前残差
块仅有一个对应系数是显著系数时(情况 3),考虑扫描索引,从而使对于与 DC
系数邻近的较低频分量的系数,1 的概率更大,并考虑到先前残差块仅有一个对
应系数是显著系数,选择具有较低概率值的上下文。

[0080]图 13 是示出应用了根据本发明实施例的基于上下文的二进制算术编码设
备的图像编码设备的结构的框图。本发明的基于上下文的二进制算术编码设备应
用于图 13 所示的熵编码单元 1340。

[0081]参照图 13,图像编码设备 1300 包括预测单元 1310、变换/量化单元 1320、


反向变换/反向量化单元 1330 及熵编码单元 1340。

[0082]预测单元对输入图像进行帧间预测以及帧内预测并生成预测图像。

[0083]将作为预测单元 1310 中生成的预测图像与输入图像之间的差异的残差图


像在变换/量化单元 1320 中被变换到频域中然后被量化。变换和量化后的图像在
反向变换/反向量化单元 1330 中被反向变换和反向量化,并被加入到预测图像中,
从而恢复图像。然后,该结果在预测下一个输入图像时被使用。

[0084]熵编码单元 1340 以预定大小的残差块为单位进行基于上下文的二进制算


术编码,从而生成位流。

[0085]图 14 是示出根据本发明实施例的基于上下文的二进制算术编码设备的结
构的框图。

12 
 
说 明 书 译 文
[0086]参照图 14,本实施例的基于上下文的二进制算术编码设备 1400 包括上下
文选择单元 1410、算术编码单元 1420 和存储单元 1430。

[0087]存储单元 1430 存储与在当前残差块之前被处理的残差块的语法元素和先


前残差块的显著性图相关的信息。

[0088]上下文选择单元 1410 根据先前残差块的对应系数是否是显著系数,使用


存储单元 1430 中存储的与先前残差块的显著性图相关的信息选择用于对当前残
差块的显著性图进行编码的上下文。

[0089]算术编码单元 1420 使用选择的上下文对形成当前残差块的显著性图的每


个二进制值进行二进制算术编码。具体来说,使用通过上下文选择单元 1410 选
择的上下文所提供的形成当前残差块的显著性图的各个二进制值的概率使实数
0.0 至实数 1.0 的间隔逐渐变窄。

[0090]图 15 示出根据本发明实施例在图 14 示出的算术编码单元 1420 中进行的


二进制算术编码的过程的示例。在图 15 中,假设形成当前残差块的显著性图的
二进制值为 010。1 的概率为 0.2,0 的概率为 0.8。这里,如上所述,1 和 0 的概
率是通过根据与当前残差块的显著性图的二进制值相对应的先前残差块的显著
性图的二进制值是 0 还是 1 而选择的上下文所提供的概率。0 和 1 的概率根据显
著性图的各扫描索引而变化。但是,为方便说明,这里假设显著性图的各二进制
值的 1 和 0 的概率相同。

[0091]参照图 15,在对显著性图的二进制值 010 中的第一个二进制值 0 进行编码


的情况下,以新的间隔更新初始间隔[0.0-1.0]底部 80%的部分[0.0-0.8]。此外,
当对下一个二进制值 1 进行编码时,以新的间隔更新[0.0-0.8]顶部 20%的部分
[0.64-0.8]。此外,当对下一个 0 进行编码时,以新的间隔更新[0.64-0.8]底部 80%
的[0.64-0.768]。从与包括在间隔[0.64-0.768]中的实数 0.75 相对应的二进制数 0.11
中删除第一个数字 0,并将小数部分 11 输出为与显著性图的二进制值 010 相对
应的位流。

[0092]图 16 是示出根据本发明实施例的基于上下文的二进制算术解码方法的流
程图。

[0093]参照图 16,在操作 1610 中,根据至少一个先前解码的残差块的对应系数


是否是不为 0 的显著系数,选择上下文以解码预定标志即指示待解码的当前块的
显著系数的位置的显著性图。如上所述,为了解码当前残差块的显著性图,可以
通过使用在当前残差块之前被编码的一个残差块的显著性图、至少两个残差块的
显著性图、或分别位于当前残差块的上方和左方的两个相邻残差块的显著性图,
来确定上下文。

[0094]在操作 1620 中,通过使用根据在操作 1620 中选择的上下文的概率信息,


位流中指示当前残差块的显著系数的位置的显著性图被解码,然后,显著系数的
水平信息即符号和绝对值(abs)信息被解码,从而复原显著系数位置处的系数

13 
 
说 明 书 译 文
值。

[0095]图 17 示出根据本发明实施例的基于上下文的二进制算术解码设备的结构。

[0096]参照图 17,根据本实施例的基于上下文的二进制算术解码设备包括上下文
选择单元 1710、算术解码单元 1720 以及存储单元 1730。

[0097]根据至少一个先前解码的残差块的对应系数是否是不为 0 的显著系数,上
下文选择单元 1710 选择上下文以解码预定标志即指示待解码的当前块的显著系
数的位置的显著性图。

[0098]具体来说,如果先前残差块的系数是显著系数,上下文选择单元 1710 选
择指示当前残差块的对应系数为显著系数的标志的概率较高的上下文。如果先前
残差块的系数为非显著系数,则上下文选择单元 1710 选择指示当前残差块的对
应系数为非显著系数的标志的概率较高的上下文。

[0099]在此,当选择用于解码当前残差块的显著性图的上下文时,上下文选择单
元 1710 可以使用两个先前解码的残差块的显著性图、或分别位于当前残差块的
上方和左方的两个相邻的先前残差块的显著性图。

[0100]算术解码单元 1720 根据所选择的上下文,利用概率信息,对指示当前残


差块的系数的位置的标志进行二进制算术解码。

[0101]存储单元 1730 存储与在当前残差块之前处理的残差块的语法元素有关的


信息以及与用于指示系数的位置的显著性图有关的信息。

[0102]根据如上所述的本发明,当对指示残差块的系数的位置的显著性图进行编
码时,根据通过考虑与先前残差块的对应系数的空间相关性而次分割的上下文,
执行二进制算术编码,从而提高基于上下文的二进制算术编码的性能。

[0103]本发明还可以被实现为计算机可读记录介质上的计算机可读代码。计算机
可读记录介质是数据存储设备,其可以存储随后可以由计算机系统读取的数据。
计算机可读记录介质的示例包括只读存储器(ROM)、随机存取存储器(RAM)、
CD-ROM、磁带、软盘和光学数据存储设备。计算机可读记录介质也可以分布在
联网的计算机系统上,以便存储并以分布式方式执行计算机可读代码。

[0104]尽管已经参照本发明的示例性实施例对本发明进行了具体示出和描述,但
是本领域一般技术人员能够理解,在不脱离权利要求书限定的本发明的精神和范
围的情况下,可以在形式和细节上进行各种改变。应仅从描述性意义而非限制性
的目的来考虑示例性实施例。因此,本发明的范围不是由发明的详细描述而是由
所附的权利要求书来限定,并且该范围内的所有差异将被解释为包括在本发明中。

14 
 
说 明 书 附 图 译 文  

图 1 

  15
说 明 书 附 图 译 文  

图2

图 3A
A 图 3B
B

  16
说 明 书 附 图 译 文  

图4

图5

  17
说 明 书 附 图 译 文  

图6

  18
说 明 书 附 图 译 文  

图7

  19
说 明 书 附 图 译 文  

图8

  20
说 明 书 附 图 译 文  

图9

  21
说 明 书 附 图 译 文  

图 10

  22
说 明 书 附 图 译 文  

图 11

  23
说 明 书 附 图 译 文  

图 12

  24
说 明 书 附 图 译 文  

图 13 
13

  25
说 明 书 附 图 译 文  

图 14

图 15

  26
说 明 书 附 图 译 文  

图 16

图 17

  27
证据2
涉案专利
(19)中华人民共和国国家知识产权局

(12)发明专利
(10)授权公告号 &1%
(45)授权公告日 
(21)申请号 201180029192 .3 (74)专利代理机构 北京康信知识产权代理有限
(22)申请日 2011 .04 .11 责任公司 11240
代理人 余刚 吴孟秋
(65)同一申请的已公布的文献号
申请公布号 CN 102939755 A (51)Int .Cl .
H04N 19/50(2014 .01)
(43)申请公布日 2013 .02 .20
H04N 19/176(2014 .01)
(30)优先权数据 H04N 19/70(2014 .01)
10159766 .4 2010 .04 .13 EP H04N 19/46(2014 .01)
PCT/EP2010/054822 2010 .04 .13 WO H04N 19/13(2014 .01)
(85)PCT国际申请进入国家阶段日 H04N 19/129(2014 .01)
2012 .12 .13 H04N 19/61(2014 .01)
H04N 19/91(2014 .01)
(86)PCT国际申请的申请数据
H04N 19/136(2014 .01)
PCT/EP2011/055644 2011 .04 .11
H04N 19/18(2014 .01)
(87)PCT国际申请的公布数据
(56)对比文件
WO2011/128303 EN 2011 .10 .20
EP 1487113 A2 ,2004 .12 .15 ,
(73)专利权人 GE视频压缩有限责任公司 EP 1768415 A1 ,2007 .03 .28 ,
地址 美国纽约 GB 2264605 A ,1993 .09 .01 ,
(72)发明人 托马斯·维甘徳  US 2003/0128753 A1 ,2003 .07 .10 ,
海纳·基希霍弗尔 海科·施瓦茨  CN 101521645 A ,2009 .09 .02 ,
通·恩固因 德特勒夫·马佩  审查员 崔皓
ᵳ࡙㾱≲Җ亥䈤᰾Җ亥䱴മ亥

(54)发明名称 可选地,值以子块方式被扫描,
并且上下文基于
显著性图和变换系数块的编码 子块统计数据被选择。
(57)摘要
一种用于编码指示在变换系数块内的显著
变换系数的位置的显著性图的较高编码效率藉
由扫描次序达成,借助于该结果,
被顺序地抽取
的语法元素,其指示对于在变换系数块内的关联
位置,关于显著变换系数还是非显著变换系数位
于相应的位置,根据利用先前关联的语法元素所
指示的显著变换系数位置,
被顺序地关联至在变
&1%

换系数块位置中的变换系数块位置。可选地,

一类型元素可使用上下文通过上下文自适应熵
解码,显著变换系数根据先前被抽取的并被关联
的第一类型语法元素而位于的若干位置,而对于
每个所述第一类型语法元素被各自地选择。甚至
&1% 权 利 要 求 书 1/2 页

1 .一种用于解码来自数据流的指示变换系数块内的显著变换系数的位置的显著性图
的装置, 所述装置包括:
解码器, 被配置为从所述数据流抽取指示所述变换系数块内的显著变换系数的位置的
显著性图, 然后抽取所述变换系数块内的所述显著变换系数的值, 在抽取所述显著性图时,
通过上下文自适应熵解码从所述数据流顺序地抽取第一类型语法元素; 以及
关联器, 被配置为在所述变换系数块的位置中以预定扫描次序, 将顺序抽取的第一类
型语法元素顺序地关联至所述变换系数块的位置,
其中, 所述解码器被配置为, 在对所述第一类型语法元素进行上下文自适应熵解码时,
使用上下文, 其中,依据显著变换系数根据先前被抽取并被关联的第一类型语法元素而位
于的若干位置, 对于每个所述第一类型语法元素, 各自地选择所述上下文, 所述若干位置在
与当前第一类型语法元素关联的位置的邻近区域内。
2 .根据权利要求1所述的装置, 其中,所述解码器进一步被配置为, 在以与相应的第一
类型语法元素关联的位置的邻近区域中的若干可用位置加权的情况下, 在与相应的第一类
型语法元素关联的位置的邻近区域内, 将显著变换系数根据先前被抽取的且被关联的第一
类型语法元素而位于的位置的数目, 映射至预定的一组可能的上下文索引中的一个上下文
索引。
3 .一种基于变换的解码器, 所述解码器被配置为使用根据权利要求1或2所述的对来自
数据流的指示变换系数块内的显著变换系数的位置的显著性图进行解码的装置对所述变
换系数块解码, 并对所述变换系数块执行从频谱域到空间域的变换。
4 .一种预测性解码器, 包括:
基于变换的解码器, 被配置为使用根据权利要求1或2所述的对来自数据流的指示变换
系数块内的显著变换系数的位置的显著性图进行解码的装置对所述变换系数块解码, 并对
所述变换系数块执行从频谱域到空间域的变换以获得残差块;
预测器, 被配置为为表示空间取样信息信号的信息取样阵列的块提供预测; 以及
组合器, 被配置为组合所述块的所述预测和所述残差块以重建信息取样阵列。
5 .一种用以将指示变换系数块内的显著变换系数的位置的显著性图编码为数据流的
装置, 所述装置包括: 计算机、微处理器或者可编程逻辑设备, 被配置为编码指示所述变换
系数块内的显著变换系数的位置的显著性图, 然后编码所述变换系数块内的所述显著变换
系数的值成为数据流, 在编码所述显著性图时, 通过上下文自适应熵编码将第一类型语法
元素顺序编码为所述数据流, 其中,所述装置进一步被配置为在所述变换系数块的位置中
以预定的扫描次序将所述第一类型语法元素顺序地编码为所述数据流, 其中所述装置被配
置为, 在对每个所述第一类型语法元素进行上下文自适应熵编码时使用上下文, 其中,
依据
显著变换系数位于的并且与先前被编码为数据流的第一类型语法元素关联的若干位置, 对
于所述第一类型语法元素, 各自地选择所述上下文, 所述若干位置在与当前第一类型语法
元素关联的位置的邻近区域内。
6 .一种用于解码来自数据流的指示变换系数块内的显著变换系数的位置的显著性图
的方法, 所述方法包括以下步骤:
从所述数据流抽取指示所述变换系数块内的显著变换系数的位置的显著性图, 然后抽
取所述变换系数块内的所述显著变换系数的值, 在抽取所述显著性图时, 通过上下文自适

2
&1% 权 利 要 求 书 2/2 页

应熵解码从所述数据流顺序地抽取第一类型语法元素; 以及
在所述变换系数块的位置中以预定扫描次序将顺序抽取的第一类型语法元素顺序地
关联至所述变换系数块的位置,
其中, 在对所述第一类型语法元素进行上下文自适应熵解码时, 使用上下文,
其中, 依
据显著变换系数根据先前被抽取并被关联的第一类型语法元素而位于的若干位置, 对于每
个所述第一类型语法元素, 各自地选择所述上下文, 所述若干位置在与相应的第一类型语
法元素关联的位置的邻近区域内。
7 .一种用于将指示变换系数块内的显著变换系数的位置的显著性图编码为数据流的
方法, 所述方法包括以下步骤:
编码指示所述变换系数块内的显著变换系数的位置的显著性图, 然后编码所述变换系
数块内的所述显著变换系数的值成为数据流, 在编码所述显著性图时, 通过上下文自适应
熵编码将第一类型语法元素顺序编码为所述数据流, 其中, 将所述第一类型语法元素顺序
地编码为所述数据流在所述变换系数块的位置中以预定的扫描次序执行, 在每个所述第一
类型语法元素进行所述上下文自适应熵编码时使用上下文, 其中,依据显著变换系数位于
的并且与先前被编码为数据流的第一类型语法元素关联的若干位置, 对于所述第一类型语
法元素, 各自地选择所述上下文,所述若干位置在与当前第一类型语法元素关联的位置的
邻近区域内。
8 .计算机可读数字存储介质,具有含程序代码的计算机程序存储在其上, 当在计算机
上运行时, 所述程序代码执行根据权利要求6或7所述的方法。

3
&1% 说 明 书 1/17 页

显著性图和变换系数块的编码

技术领域
[0001] 本申请是针对指示在变换系数块内的显著变换系数位置的显著性图的编码以及
这种变换系数块的编码。例如, 此编码可,
例如,被用于例如图像和视频编码中。

背景技术
[0002] 在传统视频编码中, 视频序列的图像通常被分解成为块。块或块的色彩分量通过
移动补偿预测或图像内部预测预测。块可具有不同的尺寸并且可以是正方形或矩形。块或
块的色彩分量的所有取样使用同一组预测参数被预测, 例如, 参考索引(识别已被编码的图
像组中的参考图像)、 移动参数(指明供用于参考图像以及当前图像之间块的移动的测量)、
用于指明插值过滤、 图像内部预测模型等等的参数。移动参数可通过水平和垂直分量的位
移向量或通过例如, 由6个分量组成的仿射移动参数的较高阶移动参数被表示。也可能一组
以上的预测参数(例如, 参考索引以及移动参数)与单独的块相关联。该情况下, 对于每组预
测参数, 产生用于块或块的色彩分量的单一中间预测信号, 并且最后的预测信号利用这些
中间预测信号的加权和建立。加权参数以及可能有一固定偏移量(其被加至该加权和), 可
以对于图像、 或参考图像、或一组参考图像为固定的, 或它们可被包含在对应的块的预测参
组中。 同样地,静止影像也经常被分解成为块, 并且块利用图像内部预测方法(其可以是空
间图像内部预测方法或预测块的DC分量的简易图像内部预测方法)被预测。在角落的情况
中, 该预测信号也可以是零。
[0003] 在原始块或原始块的色彩分量与对应的预测信号之间的差, 也被称为残差信号,
其通常被变换和量化。一个二维变换被应用于残差信号并且所产生的变换系数被量化。对
于该变换编码, 对于一组特定预测参数被使用于其中的块或块的色彩分量, 可在应用变换
之前进一步被分割。变换块可以是等于或小于被用于预测的块。也有可能变换块包含多于
一个被用于预测的块。在静止影像或视频序列的图像中不同变换块可具有不同的尺寸, 并
且变换块可被表示为正方形或矩形块。
[0004] 产生的量化变换系数, 同时也被称为变换系数水平, 接着使用熵编码技术被传送。
因此, 变换系数水平的块通常使用扫描而被映射至变换系数值的向量(即, 有序组)上,
其中
不同的扫描可被用于不同的块。通常, 使用曲折扫描。对于仅含有交错帧的像场取样的块
(这些块可以是在编码像场中的块或编码帧中的像场块), 其通常也使用特别地设计用于像
场块的不同扫描。通常被使用编码所产生的变换系数有序序列的熵编码算法是游程水平编
码。通常, 大量的变换系数水平是零, 并且等于零的一组连续的变换系数水平可通过编码等
于零(游程)的连续变换系数水平的数目而有效地被表示。对于剩余(非零)的变换系数, 对
实际的水平编码。有各种不同的游程水平码。在非零系数之前的游程以及该非零变换系数
的水平可使用单一符号或代码字一起被编码。通常, 包含在最后非零值变换系数之后被传
送之块末端之特殊符号。 或可能先编码非零值变换系数水平数目, 并且根据这数目,水平以
及游程被编码。
[0005] 稍不同的方法被使用于H .264中的高效率的CABAC熵编码中。在此,变换系数水平

4
&1% 说 明 书 2/17 页

的 编码被分为三个步骤。在第一步骤中 ,用于各变换块的一个二进制语法元素coded_
block_flag被发送, 其以信号告知变换块是否包含显著变换系数水平(即, 为非零值的变换
系数)。如果该语法元素指示, 显著变换系数水平呈现, 则一个二进制评估显著性图被编码,
其指明哪个变换系数水平具有非零数值。 并且接着, 以逆向扫描次序, 非零变换系数水平的
值被编码。如下所述对显著性图 编码。对于扫描次序中的各系数 ,一个二进制语法元素
significant_coeff_flag被编码 ,其指明对应的 变换 系数水平是否等于零值。如果
significant_coeff_flag二进制值等于一, 即, 如果非零值变换系数水平存在于这扫描位
置, 则进一步的二进制语法元素last_significant_coeff_flag被编码。该二进制值指示目
前显著变换系数水平是否为块内部的最后显著变换系数水平或在扫描次序中是否紧随着
进一步的显著变换系数水平。如果last_significant_coeff_flag指示无进一步的显著变
换系数紧随着, 则无进一步语法元素被编码用于指明块的显著性图。在接着的步骤中, 显著
变换系数水平的值被编码, 其在块内部的位置已利用显著性图决定。显著变换系数水平的
数值通过使用下面的三个语法元素以反向扫描次序被编码。二进制语法元素coeff_abs_
greater_one指示, 显著变换系数水平绝对值是否大于一。如果二进制语法元素  coeff_
abs_greater_one指示绝对值大于一, 则进一步的语法元素  coeff_abs_level_minus_one
被传送, 其指明变换系数水平减一的绝对值。最后, 二进制语法元素coeff_sign_flag, 其指
明变换系数数值的符号, 对于各显著变换系数水平被编码。此外应注意到, 有关于显著性图
的语法元素以扫描次序被编码, 而有关于变换系数水平的实际数值的语法元素以反向扫描
次序被编码而允许更合适的上下文模型的使用。
[0006] 在H .264中的CABAC熵编码中, 所有用于变换系数水平的语法元素使用一个二进制
概率模型被编码。 非二进制语法元素  coeff_abs_level_minus_one首先被二进制化, 即, 其
被映射至序列的二进制决定(二进制值)上, 并且这些二进制值被顺序地编码。二进制语法
元素significant_coeff_flag、 last_significant_coeff_flag、
coeff_abs_greater_one、
以及coeff_sign_flag直接地被编码。各被编码的二进制值(包含二进制语法元素)被关联
到上下文。上下文表示对于一类编码二进制值的概率模型。有关对于两个可能的二进制数
值之一的概率的测量根据先前地通过对应的上下文被编码的二进制数值对于各上下文被
估计。对于有关变换编码的数个二进制值, 被使用于编码的上下文根据已被发送的语法元
素或根据一块内部的位置被选择。
[0007] 显著性图指示有关对于扫描位置的显著性(变换系数水平不是零值)的信息。 在
H .264的CABAC熵编码中, 对于一个4x4的块尺寸, 分别的上下文被用于各扫描位置以供编码
二进制语法元素significant_coeff_flag  以及last_significant_coeff_flag, 其中不同
的上下文被用于扫描位置的  significant_coeff_flag以及last_significant_coeff_
f l a g 。对 于 8 x 8 块 ,相 同 的 上 下 文 模 型 被 使 用 于 四 个 连 续 的 扫 描 位 置 ,导 致 对 于
significant_coeff_flag  的16个上下文模型以及对于last_significant_coeff_flag的
另外的16个上下文模型。用于significant_coeff_flag及last_significant_coeff_flag
的这上下文模型方法, 对于大的块尺寸具有一些缺点。另一方面, 如果各扫描位置被关联于
分别的上下文模型, 当大于8x8的块被编码时, 则上下文模型数目显著地增加。此增大的上
下文模型数目导致慢的概率估计自适应和通常有不精确的概率估计, 这两方面在编码效率
上都具有负面影响。另一方面, 由于非零变换系数通常被集中在变换块的特定区域中(区域

5
&1% 说 明 书 3/17 页

是取决于残差信号对应的块内部的主要结构), 对于一些连续扫描位置的上下文模型的指
定(如H .264中对于8x8块的指定), 对于较大的块尺寸, 同时也不是最理想的。
[0008] 在编码显著性图之后, 块以逆向扫描次序被处理。如果扫描位置是显著的, 即, 系
数不同于零, 则二进制语法元素coeff_abs_greater_one被发送。起初,
对于coeff_abs_
greater_one语法元素, 对应的上下文模型组的第二上下文模型被选择。如果在块内部的任
何coeff_abs_greater_one语法元素被编码的数值等于一(即, 绝对系数大于2),
则上下文
模型切换回至该组的第一上下文模型并且使用这上下文模型高至块末端。否则(在块内部
的coeff_abs_greater_one的所有被编码值是零并且对应的绝对系数水平等于一), 上下文
模型根据在所考虑块的反向扫描次序先前被编码/被解码的等于零的coeff_abs_greater_
one语法元素数目被选择。对于语法元素  coeff_abs_greater_one的上下文模型选择可藉
由下列的方程式被概述, 其中目前之上下文模型索引Ct+1根据先前的上下文模型索引Ct以
及先前被编码的语法元素coeff_abs_greater_one之数值(在方程式中利用bint被表示)被
挑选。对于在块内部的第一语法元素coeff_abs_greater_one, 上下文模型索引被设定等于
Ct=1。

[0009]

[0010] 用于编码绝对变换系数水平的第二语法元素 , 当对于相同扫描位置的  coeff_


abs_greater_one语法元素是等于一时, 则仅  coeff_abs_level_minus_one被编码。 非二进
制语法元素  coeff_abs_level_minus_one被二进制化成为序列的二进制值并且用于二进
制化的第一二进制值; 上下文模型索引如后所述地被选择。二进制化的其余二进制值利用
固定的上下文被编码。用于二进制化的第一二进制值的上下文如下文所述地被选择。对于
第一coeff_abs_level_minus_one语法元素, 用于coeff_abs_level_minus_one语法元素的
第一二进制值的上下文模型组的第一上下文模型被挑选, 对应的上下文模型索引被设定为
Ct=0。对于  coeff_abs_level_minus_one语法元素的各进一步的第一二进制值, 上下文模
型切换至该组集中的下一个上下文模型, 其中组中的上下文模型数目被限定为5。上下文模
型挑选可利用下面的公式被表示, 其中当前的上下文模型索引Ct+1根据先前的上下文模型
索引C t 被选择。如在上面所提到的 ,对于在块内部的 第一语法元素coeff_abs_level_
minus_one可利用上下文模型索引被设定为Ct=0。应注意, 不同的上下文模型组被使用于语
法元素  coeff_abs_greater_one以及coeff_abs_level_minus_one。
[0011] Ct+1 (Ct)=min(Ct+1 ,4)
[0012] 对于大块, 这方法具有一些缺点。对于coeff_abs_greater_one的第一上下文模型
的选择(如果等于1的coeff_abs_greater_one的值已对于块被编码, 则其被使用)通常过早
地被完成并且对于coeff_abs_level_minus_one  的最后的上下文模型却又因为显著系数
的数目大于小块中的数目而过快地被完成。 因此, coeff_abs_greater_one以及coeff_abs_
level_minus_one的大多数二进制值利用单一上下文模型编码。但这些二进制值通常具有
不同的可能性, 并且因此对于大量的二进制值的单一上下文模型的使用在编码效率上具有
负面影响。
[0013] 虽然, 一般而言, 大块增加用以进行频谱分解变换的计算性经常消耗, 有效编码小
块和大块的能力将可实现较高的编码效率, 例如, 在编码如图像的取样阵列或表示其它空

6
&1% 说 明 书 4/17 页

间取样信息信号, 例如,
深度图的取样阵列等。其理由是,当变换块内的取样阵列时,对于在
空间以及频谱分辨率之间的依赖度, 块愈大则变换的频谱分辨率愈高。大体上,最好可能局
域性地应用对应的变换于取样阵列上, 因而在此一各别的变换区域内,取样阵列的频谱构
成并不大范围地变化。小的块保证在块内的内容是相对一致的。另一方面, 如果块太小,则
频谱分辨率低, 且在非显著以及显著变换系数之间的比率将降低。
[0014] 因此,
最好具有一编码结构,即使当块大时,该结构也能使得变换系数块并且它们
的显著性图可高效地编码。

发明内容
[0015] 因而,本发明的目标是提供一种编码结构以用于分别地编码变换系数块以及指示
在变换系数块内的显著变换系数位置的显著性图, 以便提高编码效率。
[0016] 该目标将通过独立的权利要求书内容实现。
[0017] 根据本申请的第一方面, 本申请的基本思路是,如果扫描次序(通过该扫描次序被
顺序抽取的语法元素指示, 对于在变换系数块内的关联位置, 关于是显著变换系数还是非
显著的变换系数位于相应的位置)根据通过先前关联的语法元素被指示的显著变换系数位
置, 被顺序地关联至在变换系数块位置中的变换系数块位置 ,可实现用于编码指示在变换
系数块内的显著变换系数的位置的显著性图的较高编码效率。尤其, 本发明人发现,在典型
的取样阵列内容, 例如,图像、视频或深度图内容中,显著变换系数主要在对应于垂直方向
的非零的频率和在水平方向的低频率的变换系数块的某一侧形成群组, 或反之亦然,以至
于考虑通过先前关联的语法元素被指示的显著变换系数位置可控制扫描的进一步起因, 因
而较早达到在变换系数块内的最后显著变换系数的概率, 相对于根据扫描次序无关于目前
为止通过先前关联的语法元素被指示的显著变换系数位置的预定程序被增大。这对于较大
的块尤其是真实的, 虽然上面所述对于小块其同时也是真实的。
[0018] 根据本申请的实施方式, 熵解码器被配置为从数据流抽取信息, 该信息能够识别
关于目前通过当前关联的语法元素被指示的显著变换系数是否为最后的显著变换系数, 而
无关于其在变换系数块内的确切的位置, 其中该熵解码器被配置为使得如果关于此最后的
显著变换系数的当前语法元素发生, 则将预期无进一步的语法元素。该信息可包括块内的
显著变换系数的数目。可选择地, 第二语法元素被插入第一语法元素中, 第二语法元素指
示, 对于显著变换系数被置放的关联位置, 关于该变换系数是否是变换系数块中的最后变
换系数。
[0019] 根据本申请的实施方式, 关联器根据到目前为止仅在变换系数块内的预定位置被
指示的显著变换系数位置, 而调整扫描次序。例如,数个子路线, 其通过在变换系数块内的
位置互相脱连的子集合, 大体上对角地分别地自对应至沿着第一方向的最小频率以及沿着
另一方向的最高频率的变换系数块的一对侧边, 而分别地延伸至对应至沿着第二方向的零
频率以及沿着第一方向的最大频率的变换系数块的一对侧边。在该情况下, 关联器被配置
为选择扫描次序, 因而该等子路线以在该等子路线中, 以子路线至变换系数块内的DC位置
的距离单调性增加的顺序被遍历, 各子路线被遍历而无需沿着行进方向中断, 并且对于各
子路线的该子路线沿其通过的方向根据在先前子路线的期间被遍历的显著变换系数位置,
利用关联器被选择。通过该措施, 最后的显著变换系数被位于最后子路线在一个方向被遍

7
&1% 说 明 书 5/17 页

历的概率被增加, 因而,相比于位于最后子路线的第二半内, 最后的显著变换系数更有可能


位于最后的子路线的第一半内, 因而可能减少指示关于显著变换系数还是非显著变换系数
位于相应位置的语法元素的数目。在大变换系数块的情况下, 其效果特别显著。
[0020] 根据本申请的另一方面, 本申请基于以下发现: 如果之前提及的语法元素(其指
示, 对于在变换系数块内的关联位置, 关于是显著变换系数还是非显著变换系数位于相应
的位置)使用上下文被上下文自适应熵解码, 则在变换系数块内指示显著变换系数的位置
的显著性图可更有效地被编码, 其中上下文依据在利用任何先前的语法元素被指示为显著
的各别的语法元素的邻近区域中的一些显著变换系数, 而对于各语法元素分别地被选择。
尤其, 本发明者发现,由于变换系数块的增大尺寸, 显著变换系数在变换系数块内的某些区
域以某种方式被聚集, 因此上下文自适应, 其不仅仅是对于以当前预定的扫描次序被遍历
的显著变换系数数目敏感同时也考虑显著变换系数的邻近区域, 使得上下文的较佳自适应
并且因此增大熵编码的编码效率。
[0021] 当然,上面概述的两个方面可以有利的方式被结合。
[0022] 进一步地,根据本申请的又一方面, 本申请基于以下发现:其中在下列情况时用以
编码变换系数块的编码效率可被提高, 例如:当指示在变换系数块内的显著变换系数的位
置的显著性图优于在变换系数块内的显著变换系数的实际数值的编码时, 并且如果遵循在
变换系数块位置中的预定扫描次序(其被使用以顺序地关联显著变换系数的值序列与显著
变换系数的位置)使用在子块中的子块扫描次序而扫描子块中的变换系数块, 且辅助地以
系数扫描次序扫描在子块内的变换系数位置时, 并且如果自一些上下文的多个组中所选择
的一些上下文的组被使用以用于顺序地上下文调适熵解码显著变换系数数值的值时, 选择
组的选择是基于在以子块扫描次序已被遍历的变换系数块子块内的变换系数的数值或已
被解码的变换系数块中在同一地点的子块的变换系数的数值时。 以这方式,上下文自适应
是非常适合于上面概述的被聚集在变换系数块内的某些区域的显著变换系数性质, 尤其
是, 当考虑大变换系数块时。另一方面, 子块中的数值可被扫描, 并且上下文可基于子块统
计数据选择。
[0023] 再者,甚至后面的方面可与本申请的先前确认的任何一个或两方面相结合。

附图说明
[0024] 本申请的优选实施方式将参照下面相关图说明, 其中:
[0025] 图1示出根据实施方式的编码器的块图;
[0026] 图2A  -2C  示意性地示出将取样阵列(例如,
图像)以不同的次分割成为块的图示;
[0027] 图3示出根据实施方式的解码器的块图;
[0028] 图4更详细地示出根据本申请实施方式的编码器的块图;
[0029] 图5更详细地示出根据本申请实施方式的解码器的块图;
[0030] 图6是示意性地示出自空间域变换成为频谱域的块变换图形;
[0031] 图7示出依照实施例的用以解码显著性图以及变换系数块的显著变换系数的装置
的块图;
[0032] 图8示意性地示出将扫描次序次分割成为子路线的扫描次序的次分割以及它们不
同的遍历方向;

8
&1% 说 明 书 6/17 页

[0033] 图9示意性地示出依照实施方式的对于变换块内某些扫描位置的邻近区域限定;
[0034] 图10示意性地示出对于变换块边界的变换块内的一些扫描位置的可能的邻近区
域限定;
[0035] 图11示出依照本申请的进一步实施例的可能的变换块扫描。

具体实施方式
[0036] 值得注意的是, 在图的说明中, 出现在几个这些图中的组件在这些图的每个钟利
用同样的参考符号指示, 并且就功能性而言, 避免对这些组件的重复说明, 以便避免不必要
的重复。然而, 对于图所提供的功能以及说明, 除非其对立者明确地被指示, 否则同时也可
适用用于其它图。
[0037] 图1示出编码器10的实例, 在该编码器中,对于本申请的方面可实施。编码器将信
息取样阵列20编码为数据流。信息取样阵列可表示任何类型的空间取样信息信号。例如, 取
样阵列20可以是静态图像或视频图像。 因此,信息取样可对应于亮度值、 色值、 明度值、 色度
值等。然而, 例如, 在取样阵列20是由例如光时间感应器等所产生的深度图的情况下, 信息
取样也可以是深度值。
[0038] 编码器10是基于块的编码器。即, 编码器10以块40为单位将取样阵列20编码为数
据流30。 以块40为单位的编码不是必须地意味着编码器  10完全彼此无关地编码这些块40。
反之, 编码器10可使用先前编码块的重建以外插或内测其余的块, 并且可使用块间隔尺寸
(granularity)设定编码参数, 即,用以设定对对应于各个块的各取样阵列区域编码的方
式。
[0039] 进一步地, 编码器10是变换编码器。即, 编码器10通过使用变换编码块40, 以便将
各块40内的信息取样从空间域变换到频谱域。可以使用二维变换, 例如,
FFT的DCT等。优选
地, 块40是正方形或矩形。
[0040] 在图1中示出的被次分割成为块40的取样阵列20的次分割仅用于说明的目的。 图1
示出取样阵列20被次分割为以非重迭方式彼此紧邻的正方形或矩形块40的规则性二维排
列。块40尺寸可预定。 即,编码器10  可不需在数据流30内传送块40的块尺寸信息至解码侧。
例如, 解码器可预期预定的块尺寸。
[0041] 然而, 数个选择是可能的。例如, 块可彼此重迭。然而, 重迭可被限定为各块具有不
与任何邻近的块重迭的部分的程度, 或使各块取样,以最大方式, 与沿着预定方向并列于目
前块的邻近块中的块重迭。后者可表示, 左方的与右方的邻近块可与当前的块重迭以便完
全地覆盖当前的块, 但是它们可不彼此覆盖, 并且同样情况适用于垂直以及对角线方向邻
近者。
[0042] 如进一步的选择, 被次分割为块40的取样阵列20的次分割通过编码器10利用经由
比特流30被传至解码器侧的次分割上的次分割信息而被调适于取样阵列20的内容。
[0043] 图2a至图2c示出被次分割成为块40的取样阵列20的次分割的不同实例。 图2a示出
被次分割为不同尺寸的块40的取样阵列20的基于四叉树的次分割, 其具有增大尺寸的40a、
40b、 40c以及40d指示的表示块。依照图2a的次分割, 取样阵列20首先被分割为树形块40d的
规则性二维排列, 依次地,具有与之关联的各次分割信息, 根据该信息, 某树形块40d  可根
据四叉树结构进一步被次分割或没有。块40d的左方的树形块示例性地依照四叉树结构被

9
&1% 说 明 书 7/17 页

次分割成为较小的块。编码器10可对于在图2a中以实线以及虚线示出的各块进行一个二维
变换。 换句话说,编码器10可依块次分割单位来变换阵列20。
[0044] 替代基于四叉树的次分割, 更通用的基于多个树的次分割可被使用并且在不同层
级之间, 每个层级的子节点数目可不同。
[0045] 图2b示出用于次分割的另一实例。 依照图2b,取样阵列20首先被分割成为以非重
迭互相紧邻方式的规则性二维排列排列的宏块40b, 在其中各宏块40b具有与其相关联的次
分割信息(根据该次分割信息, 宏块不被次分割, 或者,如果被次分割, 以规则性二维方式被
次分割成为相等尺寸的子块), 以便对于不同宏块得到不同的次分割间隔尺寸。其结果是在
不同尺寸块40中的取样阵列20的次分割具有以40a、 40b以及40a’指示的不同尺寸表示。如
在图2a中, 编码器10对在图2b中以实线与虚线示出的各块进行二维变换。 图2c稍后将被详
述。
[0046] 图3示出解码器50,其可解码通过编码器10产生的数据流30, 以重建取样阵列20的
重建版本60。解码器50自数据流30抽取每个块40的变换系数块, 并且通过对各变换系数块
进行逆变换而重建该重建版本60。
[0047] 编码器10和解码器50可被配置为进行熵编码/解码, 以便分别将关于变换系数块
的信息插入数据流, 以及从数据流分提取该信息。这方面的细节稍后将说明。应注意到, 数
据流30不必定得包含取样阵列20的所有块  40的关于变换系数块的信息。 反之,块40的子集
可以另外的方式被编码为比特流30。例如, 编码器10可决定, 将不同编码参数插入比特流30 
中以避免插入对于块40的某块的变换系数块, 因而使解码器50可预测或以别的方法将各个
块填入重建版本60中。例如, 编码器10可进行纹理分析, 以便将块置放在取样阵列20内, 取
样阵列可经由纹理合成利用解码器在解码器侧中被填充并且因此在比特流内指示这结果。
[0048] 如在下图的讨论中, 变换系数块不必定得是表示取样阵列20的各个块40的原始信
息取样的频谱域表示。反之, 此变换系数块可表示各个块  40的预测残差的频谱域表示。 图4
示出这样的编码器的实施方式。 图4  的编码器包括变换级100、 熵编码器102、逆变换级104、
预测器106以及减法器108和加法器110。减法器108、 变换级100以及熵编码器102在图4编码
器的输入112和输出114之间以所提到的顺序被串联连接。逆变换级104、加法器110以及预
测器106以在变换级100的输出和减法器108  逆向输入之间以所提到的顺序被连接, 预测器
106的输出同时也被连接至加法器110的进一步输入。
[0049] 图4的编码器是基于预测性变换的块编码器。 即,进入输入112的取样阵列20的块
由相同取样阵列20的先前编码以及重建部分或先前编码以及重建的其它取样阵列, 其可在
当前的取样阵列20之前或及时地接续于当前取样阵列20之后, 被预测。预测通过预测器106
执行。减法器108  从原块减去预测值并且变换级100对预测残差进行二维变换。二维变换本
身或变换级100内部的后续措施可导致在变换系数块内的变换系数的量化。量化的变换系
数块通过例如在熵编码器102内的熵编码被无损地编码, 而在输出114输出所产生的数据
流。逆变换级104重建量化的残差, 加法器110,依次地,结合重建的残差与对应的预测, 以便
取得重建信息取样, 使预测器106可基于重建信息取样预测在之前提到的当前编码预测块。
预测器106可使用不同的预测模型, 例如,图像内部预测模型以及图像间预测模型以便预测
块, 并且预测参数被转发至熵编码器102以供插入到数据流。
[0050] 即,依照图4的实施方式, 变换系数块表示取样阵列残差的频谱表示而不是其实际

10

&1% 说 明 书 8/17 页

的信息取样。
[0051] 应注意到, 对于图4实施方式有数个选择存在, 它们中的一些已在说明书的前面部
分描述, 该描述被结合到图4的描述。例如, 由预测器106  产生的预测值可以不被熵编码。 反
之, 侧部信息可通过另外的编码方案被传至解码侧。
[0052] 图5示出能够对由图4的编码器所产生的数据流进行解码的解码器。 图5的解码器
包括熵解码器150、 逆变换级152、加法器154以及预测器  156。熵解码器150、 逆变换级152以
及加法器154以所提到的顺序串联连接在图5的解码器的输入158以及输出160之间。熵解码
器150的进一步的输出被连接至预测器156, 预测器156又被连接在加法器154的输出以及其
进一步的输入之间。熵解码器150, 从在输入158进入图5的解码器的数据流中抽取变换系数
块, 在其中逆变换在级152被应用于变换系数块, 以便获得残差信号。残差信号在加法器154
与来自预测器156的预测值结合, 以便在输出160得到取样阵列的重建版本的重建块。根据
该等重建版本, 预测器156产生预测值, 从而重建在编码器侧通过预测器106执行的预测。为
了获得如那些被使用在编码器侧的相同预测值, 预测器156使用熵解码器150也在输入158
从数据流获得的预测参数。
[0053] 应注意到, 在上面说明的实施方式中, 进行残差预测以及变换的空间间隔尺寸不
需要彼此相等。这被示出在图2c中。该图示出具有实线的预测间隔尺寸以及具有虚线的残
差间隔尺寸的预测块的次分割。如所见地, 次分割可彼此无关地由编码器选择。更准确地,
数据流语法可允许无关于预测次分割而对残差次分割的限定。可选地, 残差次分割可以是
预测次分割的延伸, 以至于各残差块等于预测块或是预测块的适当子集。这被示出在图2a
以及图2b上, 例如,再次地, 预测间隔尺寸以实线被示出并且残差间隔尺寸以虚线被示出。
在此, 在图2a至图2c中,具有与参考符号相关联的所有块是将被进行一个二维变换的残差
块, 而围绕虚线块40a的较大的实线块, 例如, 将是预测参数设定可分别地被进行的预测块。
[0054] 上面的实施方式共同点为(残差或原始)取样的块将在编码器侧被变换成为变换
系数块, 依次地, 其将在解码器侧被逆变换为取样的重建块。这将在图6中说明。 图6示出取
样块200。在图6情况下, 该块200是示例性正方形以及具有4x4取样202的尺寸。 取样202沿着
水平方向x以及垂直方向y被规则排列。通过上面提到的二维变换T, 块200被变换到频谱域,
即成为变换系数206的块204, 变换块204具有相同于块200的尺寸。即, 变换块204在水平方
向以及垂直方向, 具有如同块200的取样一般多的变换系数206。然而, 由于变换T是频谱变
换, 在变换块204内的变换系数206的位置并不对应于空间位置, 而是对应于块200内容的频
谱分量。具体地, 变换块204的水平轴对应于一个轴, 沿着该轴水平方向的频谱频率单调增
大, 垂直轴对应于一个轴, 沿着该轴垂直方向的空间频率单调增大, 在其中DC分量变换系数
被置于角落中, 在这里, 示例性地置于块204的左上角, 使得在右下角, 放置对应于水平以及
垂直方向的最高频率的变换系数206。忽略空间方向, 某变换系数206所属的空间频率, 大体
-1
上自左上角增加至右下角。通过逆变换T , 变换块204自频谱域再被变换至空间域, 以便再
获得块200的复制块208。在变换期间无量化/  损失介入的情况下, 重建将是完美的。
[0055] 已如在上面所提到的, 从图6可看到, 块200的较大的块尺寸增加产生的频谱表示
204的频谱分辨率。另一方面, 量化噪声趋于在整个块208  延伸, 因此, 在块200内的突发的
以及非常小范围的事物, 由于量化噪声, 则趋于导致再变换块的相对于原块200的误差。然
而, 使用较大的块的主要优点是, 一方面的显著, 即,非零(量化)变换系数的数目与另一方

11

&1% 说 明 书 9/17 页

面的非显著的变换系数的数目之间的比率, 相较于较小的块, 在较大的块之内可能被减少,


从而能够获得较好的编码效率。换句话说, 通常地,显著变换系数, 即,不被量化为零值之变
换系数, 稀疏地被分配在变换块204  上。 由于这点,依照将在下面更详细被说明之实施例,
显著变换系数的位置经由显著性图被以信号告知在数据流内。此外, 显著变换系数的数值,
即, 变换系数被量化的情况下的变换系数水平, 在数据流内传送。
[0056] 因此,根据本申请的实施方式,用于解码数据流的显著性图或用于解码数据流的
显著性图和对应的显著变换系数值的装置可如图7中所示出地被实施, 并且在上面所提到
的各熵解码器, 即,解码器50以及熵解码器  150, 可包括图7中所示出的装置。
[0057] 图7的装置包括图/系数熵解码器250以及关联器252。 图/系数熵解码器250被连接
至输入254, 表示显著性图的语法元素和显著变换系数值在输入254进入。如下面更详细地
描述的, 有关于其中描述一方面的显著性图的语法元素以及另一方面的显著变换系数值进
入图/系数熵解码器  250的顺序存在着不同的可能性。显著性图语法元素可置于对应的水
平之前, 或两者可交叉。然而, 初步地, 假设表示显著性图的语法元素在显著变换系数值(水
平)之前, 以至于映射图/系数熵解码器250首先解码显著性图, 接着解码显著变换系数的变
换系数水平。
[0058] 由于图/系数熵解码器250顺序解码表示显著性图的语法元素和显著变换系数值,
所以关联器(associator)252被配置为将这些顺序解码的语法元素/数值关联至变换块256
内的位置。其中, 关联器252将依次解码的表示显著性图的语法元素和显著变换系数水平关
联至变换块256的位置的扫描次序, 遵循在变换块256位置中的一维扫描次序, 其是相同于
在编码侧使用以引导这些元素进入数据流的顺序。下面将更详细地叙述, 对于显著性图语
法元素的扫描次序也可以等于用于显著系数值的顺序, 或不等于。
[0059] 图/系数熵解码器250可访问变换块256上到目前为止可供使用的信息(如由关联
器252产生的达到目前将被解码的语法元素/水平), 以便设定对如由虚线258指示的目前将
被解码的语法元素/水平进行熵解码的概率估计上下文(context)。例如, 关联器252可登录
到目前为止从顺序关联的语法元素收集的信息, 例如,水平本身或关于下列的信息, 如关于
是否显著变换系数位于相应位置, 或关于是否并不知道其中图/系数熵解码器  250访问该
内存的变换块256的相应位置。刚提及的内存没有示出于图7  中, 但是参考符号256也可以
指示该内存, 只要内存或登录缓冲器将用于存储到目前为止利用关联器252以及熵解码器
250所获得的初步信息。因此, 图7通过叉号示出由先前解码的表示显著性图的语法元素获
得的显著变换系数的位置, “1”将指示在相应位置的显著变换系数的显著变换系数水平已
被解码, 并且是1。在显著性图语法元素在数据流中在显著值之前的情况下, 在解码相应值
时, 在输入“1”之前,叉号应当已经被记录在内存256内“1”的位置(这情况将表示整个显著
性图)。
[0060] 下面的描述集中在编码变换系数块或显著性图的特定实施方式, 这些实施方式是
可容易地变换至上面说明的实施方式。在这些实施方式中, 可以针对每个变换块发送二进
制语法元素coded_block_flag,其以信号告知该变换块是否包含任何显著变换系数水平
(即, 为非零的变换系数)。如果该语法元素指示这些显著变换系数水平存在, 则这些显著性
图被编码, 即,接着进行。显著性图指明, 如在上面所指示的 , 哪个变换系数水平具有非零
值。显著性图编码涉及二进制语法元素significant_coeff_flag的编码,其中各二进制语

12

&1% 说 明 书 10/17 页

法元素significant_coeff_flag指明对于各个关联系数位置对应的变换系数水平是否不
等于零值。 以某扫描次序进行编码, 其可根据到目前为止被确认为显著的显著系数位置而
在显著性图编码期间改变, 如在下面更详细的描述的。进一步地, 显著性图编码涉及二进制
语 法 元 素 la s t_s ig n if i ca n t_ c o ef f _f la g的 编码 ,其中 ,二 进 制语法 元 素  la s t_
significant_coeff_flag将significant_coeff_flag序列散布在其位置上 ,其中
significant_coeff_flag以信号告知显著系数。如果significant_coeff_flag  二进制值
等于1, 即, 如果非零值变换系数水平存在于该扫描位置中, 则编码进一步的二进制语法元
素last_significant_coeff_flag。该二进制值指示目前的显著变换系数水平是否为在块
内部的最后的显著变换系数水平或进一步的显著变换系数水平是否依扫描次序跟随在其
后。如果  last_significant_coeff_flag指示出无进一步的显著变换系数跟随, 则对于指
定用于块的显著性图, 无进一步的语法元素被编码。可选地, 显著系数位置的数目可在序列
significant_coeff_flag编码之前在数据流内用信号表明。在下一个步骤中, 编码显著变
换系数水平值。如上面所描述的, 可选地, 水平的传送可与显著性图的传送交错进行。显著
变换系数水平值以进一步的扫描次序被编码, 其实例在下面描述。使用下面的三个语法元
素。二进制语法元素coeff_abs_greater_one指示显著变换系数水平的绝对值是否大于1。
如果二进制语法元素coeff_abs_greater_one指示绝对值大于1, 则发送进一步的语法元素
coeff_abs_level_minus_one, 语法元素  coeff_abs_level_minus_one指明变换系数水平
减1的绝对值。最后, 对于各显著变换系数水平, 编码指明变换系数数值的符号的二进制语
法元素  coeff_sign_flag。
[0061] 下面描述的实施方式可进一步降低位率并且因此增大编码效率。 为了达成这点,
这些实施方式对于有关变换系数的语法元素的上下文模型使用特定方法。具体地, 对于语
法元素significant_coeff_flag、   last_significant_coeff_flag  、coeff_abs_greater_
one以及  coeff_abs_level_minus_one, 可以使用新的上下文模型选择。更进一步地, 描述
在显著性图(指定非零变换系数水平的位置)的编码/解码期间的扫描的自适应切换。关于
必须提到的语法元素的含义, 可参考本申请的上述部分。
[0062] 说明显著性图的significant_coeff_flag以及last_significant_coeff_flag 
语法元素的编码, 基于已经编码的扫描位置的限定的邻近区域的新的上下文模型以及自适
应扫描而被改进。这些新的概念使得显著性图的编码更高效(即, 对应的位率降低), 尤其对
于大的块尺寸而言。
[0063] 下面概述的实施方式的一个方面是, 在显著性图编码/解码期间, 扫描次序(即, 变
换系数值的块到变换系数水平的有序集合(向量)上的映射)基于显著性图的已经被编码/
被解码的语法元素的值而被调整。
[0064] 在优选实施方式中 , 扫描次序在二个或更多个预定扫描模式之间被自适应地切
换。在优选实施方式中, 切换可仅仅在某些预定扫描位置发生。在本发明的进一步的优选实
施方式中, 扫描次序在二个预定扫描模式之间自适应地被切换。在优选实施方式中, 在二个
预定扫描模式之间的切换可仅仅发生在某些预定扫描位置。
[0065] 在扫描模式之间切换的优点是降低位率, 降低位率是由于有较少的编码语法元素
数目的结果。作为直观实例并参照图6, 因为残差块主要包含水平或垂直结构, 通常的情况
是显著变换系数的值——特别是对于大的变换块——被集中在块边沿270、272之一。利用

13

&1% 说 明 书 11/17 页

最常用的曲折扫描274, 其存在大约为0 .5的概率, 其中最后显著系数被遇到的曲折扫描的


最后对角线次扫描从显著系数不被集中侧开始。该情况下, 对于等于零的变换系数水平的
大量语法元素必须在到达最后非零变换系数值之前被编码。如果对角线次扫描经常在显著
变换系数水平被集中的侧开始, 则这可被避免。
[0066] 下面更详细说明本发明优选实施方式。
[0067] 如在上面所提及的, 也是对于大的块尺寸, 优选其保有适度小的上下文模型数目,
以便使上下文模型能够快速自适应并且能够提供高的编码效率。因此, 特定上下文应被使
用于一个以上的扫描位置。但是由于显著变换系数水平通常被集中在变换块的某些区域中
(这集中情况可能是因通常出现在, 例如, 残差块中的某些主要结构的结果), 分配相同上下
文至一些连续的扫描位置的设想, 如对于H .264中的8x8块的处理, 通常是不适合的。对于设
计上下文的选择, 可使用上面提到的显著变换系数水平往往被集中在变换块某些区域中的
观察结果。在下面, 将说明这观察结果可被利用的设想。
[0068] 在一个优选实施方式中 , 大的变换块(例如, 大于8x8)被分割成为一些矩形子块
(例如, 分成16个子块)并且这些子块的每个被关联至用以编码significant_coeff_flag以
及last_significant_coeff_flag的分别的上下文模型(其中不同的上下文模型被用于
significant_coeff_flag以及  last_significant_coeff_flag)。对于significant_
coeff_flag以及  last_significant_coeff_flag, 分割成为子块可以不同。相同的上下文
模型可被用于位于特定子块中的所有扫描位置。
[0069] 在进一步的优选实施方式中, 大的变换块(例如, 大于8x8)可被分割成为一些矩形
及/或非矩形子区域并且这些子区域中的每个被关联至用以编码significant_coeff_flag
和/或last_significant_coeff_flag的分别的上下文模型。对于significant_coeff_flag
和last_significant_coeff_flag,分割成为子区域可以不同。相同的上下文模型可被用于
位于特定子区域中的所有扫描位置。
[0070] 在进一步的优选实施方式中 , 用以编码significant_coeff_flag和/或  last_
significant_coeff_flag的上下文模型, 基于在目前扫描位置的预定空间邻近区域中已被
编码的符号而被选择。对于不同的扫描位置, 预定邻近区域可以是不同的。在优选实施方式
中, 基于仅计算已被编码的显著性指示的目前扫描位置的预定空间邻近区域中的显著变换
系数水平的数目, 上下文模型被选择。
[0071] 下面将更详细地说明本发明的优选实施方式。
[0072] 如上面所提及的 , 对于大的块尺寸, 常见的上下文模型 , 通过对于  coeff_abs_
greater_one和coeff_abs_level_minus_one语法元素的单一上下文模型而编码大量的二
进制值(其通常具有不同的概率)。为了避免大块尺寸的缺点, 依照一实施方式, 大块可被分
割为特定尺寸的小正方形或矩形子块, 并且分别的上下文模型被应用于各个子块。此外, 可
使用多组上下文模型, 其中对于各个子块, 这些上下文模型中的一个基于先前被编码的子
块的统计数据的分析被选择。在本发明优选实施方式中, 使用在先前被编码的相同块的子
块中大于2的变换系数的数(即,   coeff_abs_level_minus_1>1),
以得到当前子块的上下文
模型组。对于  coeff_abs_greater_one以及coeff_abs_level_minus_one语法元素的上下
文模型的这些增强, 特别对于大的块尺寸而言, 使得对两语法元素的编码更高效。在优选实
施方式中, 子块的块尺寸是2x2。在另外的优选实施方式中, 子块的块尺寸是4x4。

14

&1% 说 明 书 12/17 页

[0073] 在第一步骤中, 大于预定尺寸的块可被分割为特定尺寸的较小的子块。绝对变换


系数水平的编码处理程序, 使用扫描(其中不同的扫描可被用于不同的块)以将正方形或矩
形块的子块映射至有序子块组(向量)上。在优选实施方式中, 子块使用曲折扫描处理; 子块
内部的变换系数水平以逆向曲折扫描处理, 即,
自属于垂直以及水平方向的最高频率的变
换系数装载至有关两方向的最低频率系数的扫描。在本发明另外的优选实施方式中, 逆向
曲折扫描被用于编码子块并且被用于编码子块内部的变换系数水平。在本发明另外的优选
实施方式中, 使用被用于编码显著性图(参看上述)的相同的自适应扫描处理变换系数水平
的整个块。
[0074] 大的变换块到子块的分割避免对于大的变换块的多数二进制值只使用一个上下
文模型的问题。子块的内部, 目前技术的上下文模型(如于H .264中所指明)或固定的上下文
可根据子块实际尺寸来使用。此外, 对于这些子块的统计数据(根据概率模型)是不同于具
有相同尺寸的变换块的统计数据。通过扩展coeff_abs_greaterone以及  coeff_abs_
level_minus_one语法元素的上下文模型组可揭示这些性质。可提供多组上下文模型, 并且
对于各个子块, 可基于目前变换块的先前被编码的子块或在先前被编码的变换块中的统计
数据而选择这些上下文模型组中的一个。在本发明的优选实施方式中, 基于相同块的先前
被编码的子块统计数据得到所选择的上下文模型组。在本发明另外的优选实施方式中, 基
于先前被编码的块的相同子块统计数据得到所选择的上下文模型组。在优选实施方式中,
上下文模型组数目被设定为等于4, 而在另外的优选实施方式中, 上下文模型组数目被设定
为等于16。在优选实施方式中, 被用于得到上下文模型组的统计数据是在先前被编码的子
块中大于2的绝对变换系数水平的数目。在另一优选实施方式中, 在显著系数的数目以及具
有绝对值大于2的变换系数水平的数目之间, 被用于得到上下文模型组的统计数据是不同。
[0075] 显著性图的编码可如下面所述地进行, 即,
通过扫描次序的自适应切换。
[0076] 在优选实施方式中, 用以编码显著性图的扫描次序通过二个预定扫描模式之间的
切换被调适。扫描模式之间的切换可仅仅在某些预定扫描位置被完成。扫描模式是否被切
换的决定取决于已被编码/被解码的显著性图语法元素值。在优选实施方式中, 两预定扫描
模式指定具有对角线次扫描的扫描模式, 相似于曲折扫描的扫描模式。这些扫描模式被示
出在图8中。两扫描模式300和302由对于从左下方到右上方的对角线或反之亦然的一些对
角线次扫描所组成。对于两预定扫描模式的从左上方到右下方的对角线次扫描的扫描(未
在图形中被示出)被完成。但是对角线次扫描内部的扫描不同(如图中所示)。对于第一扫描
模式300, 对角线次扫描被从左下方到右上方扫描(图8的左方图示), 并且对于第二扫描模
式302, 对角线次扫描被从右上方到左下方扫描(图8的右方图示)。在实施方式中, 显著性图
的编码以第二扫描模式开始。在编码/解码语法元素的同时, 显著变换系数值的数目利用两
个计数器c1 和c 2计算。第一计数器c1 对位于变换块左下部分的显著变换系数的数目计数;
即, 当对于变换块内部的水平坐标x小于垂直坐标y显著变换系数水平被编码/解码时, 计数
器增加1。第二计数器c2对位于变换块右上部分的显著变换系数计数; 即,当对于变换块内
的水平坐标x大于垂直坐标y显著变换系数水平被编码/解码时, 计数器增加1。计数器的自
适应可利用图7的关联器252执行并且可利用下列公式描述, 其中t表示扫描位置索引并且
两计数器以零初始化:

15

&1% 说 明 书 13/17 页

[0077]

[0078]

[0079]
在各个对角线次扫描的末端, 利用关联器252决定第一预定扫描模式  300还是第
二预定扫描模式302被用于下一个对角线次扫描。该决定取决于计数器c1 和c2的值。当对于
变换块的左下部分的计数器值大于对于左下部分的计数器值时, 使用扫描从左下方到顶右
上方的对角线次扫描的扫描模式; 否则(对于变换块的左下部分的计数器值小于或等于对
于左下部分的计数器值),使用扫描从右上方到左上方扫描的对角线次扫描的扫描模式。该
决定可利用下列公式表示:

[0080]

[0081] 应注意到, 上面描述的本发明实施方式可容易地被应用至其它扫描模式。作为一


实例, 被使用于H .264中的像场宏块的扫描模式也可被分解成为次扫描。在进一步的优选实
施方式中, 所给定但却是任意的扫描模式被分解成为次扫描。对于各个次扫描, 定义两个扫
描模式: 一个是从左下方到右上方, 一个是从右上到到左下方(基本扫描方向)。此外, 两个
计数器被引入, 其对次扫描内部的第一部分(接近于变换块的左下方边界)以及第二部分
(接近于变换块的右上方边界)的显著系数的数目计数。最后, 在各个次扫描的结束, 决定
(根据计数器数值)下一个次扫描是从左下方到右上方还是从右上方到做下方地扫描。
[0082] 在下面, 将描述关于熵解码器250如何建立上下文模型的实施例。
[0083] 在优选实施方式中, 对于significant_coeff_flag的上下文模型将如下所述地被
处理。对于4x4块, 上下文模型如在H .264中所说明地被处理。对于8x8块, 变换块被分解成为
16个2x2取样的子块, 并且这些子块中的每个被关联至分别的上下文。注意到, 这思路同时
也可被扩展到较大的块尺寸、 不同的子块数目、 以及如上面所描述的非矩形子区域。
[0084] 在进一步的优选实施方式中, 对于较大的变换块(例如, 对于大于8x8  之块)的上
下文模型选择基于预定邻近区域(变换块内部)中已被编码的显著变换系数的数目。对应于
本发明优选实方式的邻近区域的限定的实例将在图9中描述。有圆圈围绕的叉号是可供使
用的邻近区, 其通常被考虑用于评估, 有三角形围绕的十字形记号是邻近区, 其可基于当前
扫描位置和当前扫描方向被评估:
[0085] ·如果当前扫描位置位于2x2的左方角落304的内部, 则分别的上下文模型被用于
各个扫描位置(图9, 左方图示)。
[0086] ·如果当前扫描位置不是位于2x2的左方角落内部并且不在变换块第一列或第一
行上, 则在图9右方所示出的邻近区被用于评估无任何东西围绕着它的当前扫描位置“x”的
邻近区域中的显著变换系数的数目。
[0087] ·如果无任何东西围绕着它的当前扫描位置“x”落在变换块第一列内, 则使用图
10右方图示中所指明的邻近区。
[0088] ·如果当前扫描位置“x”落在块的第一行中, 则使用图10左方图示中所指明的邻
近区。
[0089] 换句话说, 解码器250可被配置为通过利用上下文通过上下文自适应熵解码顺序

16

&1% 说 明 书 14/17 页

地抽取显著性图语法元素, 其中这些上下文依据显著变换系数根据先前被抽取的且别关联
的显著性图语法元素所在的若干位置而各自被选择, 这些位置被限定为位于相应的当前显
著性图语法元素被关联的位置(图9右手侧与图10两侧中的“x”、 以及图9左手侧的任何记号
位置)的邻近区域中的位置。如所示出, 与相应的当前语法元素关联的位置的邻近区域, 可
仅包含下列的位置: 与相应的显著性图语法元素关联的位置以最大在垂直方向上的一个位
置和/或在水平方向上的一个位置分开的或直接邻接的位置。可选地, 仅与相应的当前语法
元素直接邻接的位置可被考虑。 同时地,变换系数块尺寸可等于或大于8x8位置。
[0090] 在优选实施方式中, 用于编码的特定significant_coeff_flag的上下文模型基于
限定的邻近区域中已被编码的显著变换系数水平数目而选择。在此, 可供使用上下文模型
的数目可以小于在限定的邻近区域中的显著变换系数水平数目的可能值。编码器和解码器
可包含用以将限定的邻近区域中的显著变换系数水平数目映射至上下文模型索引上的列
表(或不同的映射图机制)。
[0091] 在进一步的优选实施方式中, 所选择的上下文模型索引取决于限定的邻近区域中
的显著变换系数水平数目, 并且取决于作为被使用的邻近区域类型或扫描位置或对于扫描
位置的量化值的一个或多个附加参数。
[0092] 对于last_significant_coeff_flag的编码, 可以使用如对于  significant_
coeff_flag的相似的上下文模型。然而, 对于  last_significant_coeff_flag的概率测量
主要取决于变换块的当前扫描位置至左上方角落的距离。在优选实施方式中 ,用于编码 
last_significant_coeff_flag的上下文模型基于当前扫描位置所在的扫描对角线而选择
(即, 在上面图8的实施方式的情况下, 其基于x+y选择, 其中x以及y各别表示变换块内部的
扫描位置的水平和垂直位置, 或基于在当前的次扫描和左上方DC位置之间有多少的次扫描
(例如, 次扫描索引(index)减去1))。在本发明的优选实施方式中, 相同的上下文被用于不
同的x+y值。距离量测, 即, x+y或次扫描索引以某一方式(例如, 通过量化x+y或次扫描索引)
被映 射到上下 文模型组 上 ,其中 对于 距离量 测的 可能 值之 数目 大 于 用于 编码la s t_
significant_coeff_flag的可用上下文模型的数目。
[0093] 在优选实施方式中, 不同的上下文模型结构被用于不同尺寸的变换块。
[0094] 下面将说明绝对变换系数水平的编码。
[0095] 在优选实施方式中, 子块尺寸是2x2并且子块内部的上下文模型不可用, 即,单一
上下文模型被用于2x2子块内部的所有变换系数。仅大于2x2  的块可通过次分割处理发生
作用。在本发明进一步的优选实施方式中, 子块尺寸是4x4并且子块内部的上下文模型如在
H .264中地被完成; 仅大于  4x4的块通过次分割处理发生作用。
[0096] 关于扫描次序, 在优选实施方式中, 曲折扫描320被用于扫描变换块  256的子块
322, 即,沿着大体上增大频率的方向, 而子块内部的变换系数则以逆向曲折扫描324被扫描
(图11)。在本发明进一步的优选实施方式中, 子块322以及子块322内部的变换系数水平都
使用逆向曲折扫描方式被扫描(如图11中的图示, 其中箭头320是反向的)。在另外的优选实
施方式中, 与用于编码显著性图相同的自适应扫描被用于处理变换系数水平, 其中自适应
决定是同样的, 以至于完全地相同的扫描被使用于显著性图的编码以及变换系数水平数值
的编码。应注意到, 扫描其本身通常不取决于所选择的统计数据或上下文模型组数目, 也不
取决于使子块内部的上下文模型成为动作或成为不动作的决定。

17

&1% 说 明 书 15/17 页

[0097] 接着将说明对于用于系数水平的上下文模型的实施方式。
[0098] 在优选实施方式中 , 子块的上下文模型相似于已在上面描述的对于  H .264中的
4x4块的上下文模型。被用于编码coeff_abs_greater_one语法元素和coeff_abs_level_
minus_one语法元素的第一二进制值的上下文模型数目等于五, 例如, 对于二个语法元素使
用不同的上下文模型组。在进一步的优选实施方式中, 子块内部的上下文模型不动作并且
在各个子块的内部仅一个预定上下文模型被使用。对于这两实施方式, 用于子块322的上下
文模型组在预定数目的上下文模型组中选择。对于子块322的上下文模型组的选择基于一
个或多个已被编码的子块的某些统计数据。在优选实施方式中,用于选择对于子块的上下
文模型组的统计数据是从相同块256中一个或多个已被编码的子块获得的。下面将说明统
计数据如何被用于得到所选择的上下文模型组。在进一步的优选实施方式中, 统计数据从
具有相同块尺寸的先前被编码的块中的相同子块(例如, 图2b中块40a和40a’)获得。在本发
明另外的优选实施方式中, 统计数据从相同块中限定的邻近子块获得, 其取决于对于子块
选择的扫描。 同时, 重要地应注意到, 统计数据来源应无关于扫描次序, 以及如何产生统计
数据以得到上下文模型组。
[0099] 在优选实施方式中, 上下文模型组数目等于四, 在另外的优选实施方式中, 上下文
模型组数目等于16。通常, 上下文模型组数目不是固定的并且将依照所选择的统计数据调
整。在优选实施方式中, 用于子块322的上下文模型组基于一个或多个已被编码的子块中大
于2的绝对变换系数水平数目得到。对于上下文模型组的索引(index)通过将参考子块中大
于2  的绝对变换系数水平数目映射至一组预定上下文模型索引上来决定。该映射可通过量
化大于2的绝对变换系数水平数目或通过预定列表实施。在进一步的优选实施方式中, 对于
子块的上下文模型组基于在一个或多个已被编码的子块中的显著变换系数水平数目与大
于2的绝对变换系数水平数目之间的差得到。对于上下文模型组的索引通过将该差值映射
到一组预定上下文模型索引上而被决定。该映射可通过量化在显著变换系数水平数目与大
于2的绝对变换系数水平数目之间的差或通过预定列表而被实施。
[0100] 在另外的优选实施方式中, 当相同的自适应扫描被用于处理绝对变换系数水平和
显著性图时, 相同块中的子块的部分统计数据可被使用以得到对于当前子块的上下文模型
组。 或者, 如果可能的话, 在先前被编码的变换块中的先前被编码的子块的统计数据可被使
用。其表示, 例如, 替代使用用于得到上下文模型的子块中大于2的绝对变换系数水平的绝
对数目, 使用已被编码的大于2的绝对变换系数水平数目乘以子块中的变换系数数目与子
块中已被编码的变换系数数目比的数值; 或替代使用在子块中显著变换系数水平数目与大
于2的绝对变换系数水平数目之间的差, 使用在子块中已被编码的显著变换系数水平数目
与大于2的已被编码的绝对变换系数水平数目乘以子块中变换系数数目与已被编码的变换
系数数目的比之间的差。
[0101] 对于子块内部的上下文模型, 基本上, 可以采用用于H .264的现有技术的上下文模
型的反向(inverse)。这表示, 当相同的自适应扫描被用于处理绝对变换系数水平以及显著
性图时, 变换系数水平基本上以正向扫描次序被编码, 以替代如H .264中的反向的扫描次
序。因此, 上下文模型切换因而必须被调整。根据实施方式 , 变换系数水平的编码以 用于 
coeff_abs_greater_one和coeff_abs_level_minus_one语法元素的第一上下文模型开始,
并且当由于最后的上下文模型切换两个等于零的  coeff_abs_greater_one语法元素已被

18

&1% 说 明 书 16/17 页

编码时, 则其被切换至组中的下一个上下文模型。 换句话说, 上下文选择取决于扫描次序中


大于零的已被编码的coeff_abs_greater_one语法元素数目。对于coeff_abs_greater_one
以及对于coeff_abs_level_minus_one的上下文模型的数目可以与H .264中相同。
[0102] 因此,上面实施方式可被应用于数字信号处理的领域, 具体地, 应用于图像和视频
解码器和编码器。具体地, 上面的实施方式用对于有关采用概率模型的熵编码器被编码的
变换系数的语法元素的改进的上下文模型, 使能有关于基于块的图像和视频编解码器中的
变换系数的语法元素的编码。与现有技术相比 , 尤其对于大的变换块, 可以实现编码效率提
高。
[0103] 虽然一些方面已在装置的上下文中描述, 应明白 , 这些方面同时也表示对应方法
的描述, 其中块或组件对应于方法步骤或方法步骤的特征。相似地, 在方法步骤的上下文中
描述的方面也表示对应的装置的对应块或项或特征的描述。
[0104] 用以分别表示变换块或显著性图的创造性编码信号, 可被储存在数字储存介质上
或可在传输介质(例如, 无线发送介质或有线的发送介质(例如, 因特网))上传输。
[0105] 根据某些实施需求, 本发明的实施方式可以以硬件或软件实施。实施可使用数字
储存介质进行, 例如,软磁盘、 DVD、蓝光盘、 CD、
ROM、
  PROM、
EPROM、EEPROM或FLASH内存,
使电
子可读取控制信号储存在其上, 其与可编程计算机系统合作(或能够合作)使得相应的方法
被执行。 因此,数字储存介质可以是计算机可读取的。
[0106] 根据本发明一些实施方式包括具有电子可读取控制信号的数据载体, 其能够与可
编程计算机系统合作, 从而执行在此处描述的方法。
[0107] 大体上, 本发明实施方式可被实施为具有程序代码的计算机程序产品, 当该计算
机程序产品在计算机上执行时, 程序代码可操作以执行各方法中的一个。该程序代码,例
如, 可被存储在机器可读载体上。
[0108] 其它实施方式包括用以执行在此描述的各种方法之一的计算机程序, 其被存储在
机器可读取载体上。
[0109] 换句话说, 本发明方法的实施方式, 因此, 是具有程序代码的计算机程序, 当该计
算机程序在计算机上执行时, 用以执行本文描述的各种方法之一。
[0110] 本发明方法进一步的实施方式, 因此是数据载体(或数字存储介质、 或计算机可读
取介质), 该数据载体包括被记录在其上而用以执行本文描述的各种方法之一的计算机程
序。
[0111] 本发明方法进一步的实施方式, 因此, 是表示用以执行本文描述的各种方法之一
的计算机程序的数据流或信号序列。该数据流或信号序列, 例如, 可被配置为经由数据通信
连接, 例如,经由因特网, 而被传送。
[0112] 进一步的实施方式包括处理构件, 例如, 计算机, 或可编程逻辑装置, 其被配置为
或适于进行本文中描述的各种方法之一。
[0113] 进一步的实施方式包括计算机, 其具有被安装在其上而用以执行在本文中说明的
各种方法之一的计算机程序。
[0114] 在一些实施方式中, 可编程逻辑装置(例如, 场可程序门阵列), 可用以执行本文描
述的各种方法的一些或所有的功能。在一些实施方式中, 场可程序门阵列可与微处理器配
合, 以便执行于本文描述的各种方法之一。大体上, 这些方法优选地可通过任何硬件装置执

19

&1% 说 明 书 17/17 页

行。
[0115]
上面所描述的实施方式仅作为本发明原理示出。本领域技术人员应了解,本文所
描述的本发明的布置以及细节可具有不同的修改和变化。因此,本发明将仅通过待决的申
请权利要求的范围限定,而不由本文经由实施方式的描述以及说明所呈现的特定细节限
定。

20

&1% 说 明 书 附 图 1/6 页

图1

图2A

图2B

21

&1% 说 明 书 附 图 2/6 页

图2C

图3

22

&1% 说 明 书 附 图 3/6 页

图4

图5

23

&1% 说 明 书 附 图 4/6 页

图6

图7

24

&1% 说 明 书 附 图 5/6 页

图8

图9

25

&1% 说 明 书 附 图 6/6 页

图10

图11

26


También podría gustarte