77百科网
当前位置: 首页 生活百科

工业视觉识别技巧(探索感知编码)

时间:2023-08-21 作者: 小编 阅读量: 1 栏目名: 生活百科

AVS已经成为国际上三大视频编码标准之一,AVS标准在广电总局正式全面推广,率先在广电行业普及。其中冗余信息可分为空域冗余信息和时域冗余信息。运动矢量通过熵编码进行压缩。变换编码将空域信号变换到另一正交矢量空间,使其相关性下降,数据冗余度减小。这一过程导致精度的降低。两个组织也共同制定了一些标准,H.262标准等同于MPEG-2的视频编码标准,而H.264标准则被纳入MPEG-4的第10部分。

一.什么是视频编码

视频编码就是指通过压缩技术,将原始视频格式的文件转换成另一种视频格式文件的方式。视频流传输中最为重要的编解码标准有国际电联的H.261、H.263、H.264、H265,Google公司主推的VP8、VP9,运动静止图像专家组的M-JPEG和国际标准化组织运动图像专家组的MPEG系列标准,此外在互联网上被广泛应用的封装格式还有Real-Networks的RealVideo、谷歌公司的WebM、微软公司的WMV以及Apple公司的QuickTime等。

那么视频编码技术到底是什么呢?首先视频是连续的图像序列,由连续的帧构成,一帧即为一幅图像。人的眼睛是有视觉暂留的,当每个图像帧序列以一定的速率播放时,我们看到的就是动作连续的视频,早年的手绘动画就是这个原理。由于连续的帧之间相似性极高同时每幅图像数据量又非常大,为便于储存传输,我们需要对原始的视频进行编码压缩,以去除空间、时间维度的冗余。

视频压缩技术是计算机处理视频的前提。视频信号数字化后数据带宽很高,通常在20MB/秒以上,因此计算机很难对之进行保存和处理,更不用说对其进行远程传输了。采用压缩技术通常数据带宽降到1-10MB/秒,这样就可以将视频信号保存在计算机中并作相应的处理。常用的算法是由ISO制订的,即JPEG和MPEG算法。JPEG是静态图像压缩标准,适用于连续色调彩色或灰度图像,它包括两部分:一是基于DPCM(空间线性预测)技术的无失真编码,一是基于DCT(离散余弦变换)和哈夫曼编码的有失真算法,前者压缩比很小,主要应用的是后一种算法。在非线性编辑中最常用的是MJPEG算法,即Motion JPEG。它是将视频信号50帧/秒(PAL制式)变为25帧/秒,然后按照25帧/秒的速度使用JPEG算法对每一帧压缩。通常压缩倍数在3.5-5倍时可以达到Betacam的图像质量。MPEG算法是适用于动态视频的压缩算法,它除了对单幅图像进行编码外还利用图像序列中的相关原则,将冗余去掉,这样可以大大提高视频的压缩比。前MPEG-I用于VCD节目中,Mpeg-II用于VOD、DVD节目中。

AVS音视频编码是中国支持制订的新一代编码标准,压缩效率比MPEG-2增加了一倍以上,能够使用更小的带宽传输同样的内容。AVS已经成为国际上三大视频编码标准之一,AVS标准在广电总局正式全面推广,率先在广电行业普及。

二.实现过程及原理1.冗余信息

视频图像数据有很强的相关性,也就是说有大量的冗余信息。其中冗余信息可分为空域冗余信息和时域冗余信息。压缩技术就是将数据中的冗余信息去掉(去除数据之间的相关性),压缩技术包含帧内图像数据压缩技术、帧间图像数据压缩技术和熵编码压缩技术。

2.去时域

使用帧间编码技术可去除时域冗余信息,它包括以下三部分:

1)运动补偿

运动补偿是通过先前的局部图像来预测、补偿当前的局部图像,它是减少帧序列冗余信息的有效方法。

2)运动表示

不同区域的图像需要使用不同的运动矢量来描述运动信息。运动矢量通过熵编码进行压缩。

3)运动估计

运动估计是从视频序列中抽取运动信息的一整套技术。

注:通用的压缩标准都使用基于块的运动估计和运动补偿。

3.去空域

主要使用帧内编码技术和熵编码技术:

1)变换编码

帧内图像和预测差分信号都有很高的空域冗余信息。变换编码将空域信号变换到另一正交矢量空间,使其相关性下降,数据冗余度减小。

2)量化编码

经过变换编码后,产生一批变换系数,对这些系数进行量化,使编码器的输出达到一定的位率。这一过程导致精度的降低。

3)熵编码

熵编码是无损编码。它对变换、量化后得到的系数和运动信息,进行进一步的压缩。

三.感知编码的由来

音频视频编码方案有很多,真可谓是百家争鸣,常见的音频视频编码有以下几类:

1.MPEG系列

我们最常见的图片格式JPEG就是由ISO(国际标准组织机构)下属的MPEG(运动图象专家组)开发 视频编码方面主要是Mpeg1(vcd)、Mpeg2(DVD)、Mpeg4(DVDRIP使用的都是它的变种,如:divx,xvid等)、Mpeg4 AVC;音频编码方面主要是MPEG Audio Layer 1/2、MPEG Audio Layer 3(mp3)、MPEG-2 AAC 、MPEG-4 AAC等。注意:DVD音频没有采用Mpeg的。MPEG是运动图像专家组(Moving Picture Experts Group)的缩写,于1988年成立,是为数字视/音频制定压缩标准的专家组,已拥有300多名成员,包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG组织最初得到的授权是制定用于“活动图像”编码的各种标准,随后扩充为“及其伴随的音频”及其组合编码。后来针对不同的应用需求,解除了“用于数字存储媒体”的限制,成为制定“活动图像和音频编码”标准的组织。MPEG组织制定的各个标准都有不同的目标和应用,已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21标准。

2.H.26X系列

由ITU(国际电传视讯联盟)主导,侧重网络传输,ITU-T 的标准包括 H.261、H.263、H.264,主要应用于实时视频通信领域,如视频会议、视频监控、视频直播;MPEG 系列标准是由ISO/IEC制定的,主要应用于视频存储(DVD)、广播电视、互联网或无线网络的流媒体等。两个组织也共同制定了一些标准,H.262标准等同于 MPEG-2的视频编码标准,而H.264标准则被纳入 MPEG-4的第10部分。

如今广泛使用的 H.264 视频压缩标准可能不能够满足应用需要,应该由另一种更高的分辨率、更高的压缩率以及更高质量的编码标准所替代。ISO/IEC 动态图像专家组和ITU-T视频编码的专家组共同建立了视频编码合作小组,出台了H.265/HEVC标准。H.265的压缩有了显著提高,一样质量的编码视频能节省40%至50%的码流,还提高了并行机制以及网络输入机制。

3.感知编码ROI

随着5G时代的到来,用户对于视频画质体验的要求越来越高,如4K、8K、高帧率、HDR等。广电总局对电视播出的4K超高清视频规范的要求是视频码率大于100兆。互联网视频应用对此还没有规范性的标准,但为了达到合格的播放体验要求,同时编码复杂度、视频码率也将呈现出成倍增长的趋势,这就导致视频运营平台短期内在CDN成本、用户播放卡顿两方面会面临更加严峻的挑战。

面对上述挑战,我们最容易想到的方法就是通过压缩效率更高的下一代视频编码标准,如AV1、VVC等,有效降低成本。但就目前情况来看,这些标准其实还不具备大规模商用的生态环境,真正能够支持硬件解码的设备其实非常的少。另一方面,内容感知编码在国内外各大视频平台已经得到普遍的应用。在这种情况下,我们需要的是挖掘更多的工具或手段,极限压榨编码的码率。

幸运的是随着技术的不断进步,结合AI机器学习人们提出了感兴趣区域的视频编码,他是利用人眼主观存在感兴趣区域和非感兴趣区域的特点,我们对主观感兴趣区域和非感兴趣区域的码率分配做一定的修正,将更多的码率分配到主观感兴趣区域,从而在主观上提升视频质量,同时不需要设计新的编解码标准。这是感兴趣区域视频编码的理论设计,但是传统的编码器H264、H265并没有这样的设计,即对于一个264编码器或者265编码器来说,视频的每个画面中的每个像素都是同等重要。因此我们需要对编码器做一个工程化的开发,来实现不同像素的权重差异化,目标是达到同等码率提升主观质量或者同等体验降低码率,从而实现更好的效果。

四.总结

感知编码的出现是时代的产物,随着技术的不断更迭,设计者不断的融入了新的技术才有了今天的成果。感知编码已经从初期的中心区域ROI,人脸ROI,字幕ROI等较为简单的模型进化成如今的主观感兴趣区域ROI,这是感知编码的一次重大技术更迭,也为将来进一步落地各种应用场景打下夯实的基础。

    推荐阅读
  • 暗黑破坏神3亡灵法师用什么武器(暗黑破坏神3死灵法师装备)

    暗黑破坏神3亡灵法师用什么武器?死灵目前还是用的那个死疫套装吧,主输出尸矛,带脆裂触碰,,我来为大家讲解一下关于暗黑破坏神3亡灵法师用什么武器?跟着小编一起来看一看吧!暗黑破坏神3亡灵法师用什么武器死灵目前还是用的那个死疫套装吧,主输出尸矛,带脆裂触碰,这套的流派,杀BOSS飞快,清图低层可以一只手操作,高层对减CD要求比较高,需要等技能,具体的配装和技能搭配。

  • 潮汕生鱼粥的做法(潮汕生鱼粥怎么做)

    跟着小编一起来看一看吧!潮汕生鱼粥的做法食材:生鱼500克、香菇100克、萝卜干50克、姜5克、食盐5克、葱5克、鸡精5克、香油2克;生鱼骨清洗干净放入煲汤袋中。锅中加入适量清水,将煲汤袋放入,大火煮开。香菇、萝卜干提前用水浸泡,并将其切丝,姜切片。放入锅中,转中小火煲20分钟左右,期间注意搅拌,以防糊锅。待粥变浓稠,加入生鱼片,大火煮开,加入适量盐,煮2分钟后熄火。

  • 推荐苹果能玩的像素风格游戏(十款苹果推荐的治愈系游戏)

    如果上天只允许我拥有一件乐器,我想我会选择钢琴,就像孤独的音乐家Deemo那样,用黑白键盘演绎自己悲伤的故事。Deemo还是和往常一样弹着自己的钢琴,但这一次他的音乐有了生命,那些音符如同催熟的肥料,树屋在乐曲声中慢慢成长茁壮。Deemo和少女都知道,当这里变成参天大树的时候,离别就是他们之间的最后一曲共鸣。

  • 最近很火的有关江西的歌曲(本土原创歌曲我在永新等你隆重推出)

    今天要给大家推荐一首永新本土原创歌曲《我在永新等你》。之后又和谢老师一起合作创作了《永新姑娘》。有幸由永新籍歌手阿森老师演唱。“永新无数佳儿女”“烈士八千磊落才”。在2020年疫情肆虐的时候,他还自己出资购买大批防疫物质运送到自己家乡,用实际行动诠释了一个爱心企业的家乡情怀。先后被评为“中国好人”,“道德模范”,全国第“十四、十五届”群星奖,第“三、四届”汤显祖戏剧奖,国家和省艺术基金三项资助获得者。

  • 生煎包热量(生煎包的热量高吗)

    下面希望有你要的答案,我们一起来看看吧!生煎包热量生煎包的热量是350大卡,单位热量较高。每100克生煎的热量约占中国营养学会推荐的普通成年人保持健康每天所需摄入总热量的15%。生煎包脂肪量比营养师建议的量高出很多,而且早餐前空腹的时间很长,不适合立即就吃太油腻的食物,容易造成肠胃负担。肉馅的食物多汁又美味,但其内馅通常使用的是猪后腿肉、五花肉,含油量较高,且经油煎烹调后,其油脂含量也是不容小觑的。

  • 怎样形容(?上海外滩不夜城(形容上海外滩不夜城的句子)

    怎样形容上海的外滩就是这样美丽,要是想说得面面俱到恐怕一天一夜都说不全;这次上海的外滩游给我长了不少见识,等我长大了,我一定会努力发展青阳,发展安徽,使它们变得与大都市一样发达,甩掉贫穷落后的破帽子,让我的家乡成为祖国全新的一面!这些钻石中最耀眼的就数东方明珠电视塔了,塔呈圆锥形,由上下两个球体组成,中间由钢架支撑着。晚风习习在外滩散步,欣赏这美丽的夜景,真是一种美妙的享受。

  • 闺蜜嫉妒你的7种表现 往往会有这3种表现

    “朋友”本身就是一个很美的词,是人与人之间关系好的代名词。但是当“好的关系”加上“嫉妒”时,就会产生严重的化学反应,对双方朋友都会造成很大的心理创伤。黄啸和小李在同一家公司工作。除了同事,他们还是很好的朋友。黄啸毕业于一所名校,工作能力很强,经常受到老板的表扬。不久前刚升到主管的位置,和小李成了上下级关系。朋友吃醋的时候,经过比较几乎承受不了失败的压力。如果发现身边有这样的朋友,现在断交还来得及。

  • 关于水仙花的真实故事(水仙花的传说民间传说)

    土地爷接了玉皇的圣旨,遂驾云上天庭面见玉皇细细道来。玉皇听后,点头微笑说:“好一个诚实忠厚的人!”玉皇思索了一会儿道:“把水仙花交他种植好吧?”土地爷领了玉皇的圣旨后,带了水仙花,驾云回凡。“不要担心,这是经玉皇大帝念过咒的,谁人移种都无效。谁要种时,每年都要向你购种。”老二一转眼,土地爷已经不见了。

  • 含苞待放的意思(词语含苞待放的意思)

    接下来我们就一起去了解一下吧!含苞待放的意思含苞待放,汉语成语,拼音是hánbāodàifàng,意思是形容花朵将要开放时的形态。也比喻将成年的少女。

  • 干玉米储存方法(干玉米如何长期储存)

    接下来我们就一起去研究一下吧!干玉米储存方法干玉米粒储存时可以放入干燥的仓库中,并将防虫磷与玉米粒混合搅拌,或者磷化铝进行熏蒸,能防治害虫。温度控制在18℃以下为佳,不能高于30℃,同时还需保持温度稳定,尽量缩短温差,但还是尽快用完,若出现了长虫现象,可以放在50℃的高温下晾晒,利用高温将害虫杀灭。