当前位置：文档之家› GPU加速的基于增量式聚类的视频拷贝检测方法

GPU加速的基于增量式聚类的视频拷贝检测方法

　万方数据

第３期任化敏，等：ＧＰＵ加速的基于增量式聚类的视频拷贝检测方法４５５

提高约８倍、３１倍、１６倍和２６倍，整体性能提高约２２倍．

虽然速度得到了提升，但这个提升倍数远没有达到我们预期的加速比，其原因是我们的视频分辨率较低，每帧产生的ＳＩＦＴ特征较少，没能让ＧＰＵ满负荷运行，所以加速比较低．

４）Ｋ—ｍｅａｎｓ聚类．图４所示为ＧＰＵ方法相对

于ＣＰＵ的速度提高比较．实验显示，本文基于流式

缩减的ＧＰＵ实现方法在聚类５１２００个数据点时，

相比ＣＰＵ方法达到７３倍的加速比，比ＧＰＵ的原始实现也有近６倍的加速比．实验中也发现，在数据

量达到１０２４００之后，加速比有轻微的下降，这可能

是由于线程块内的线程数目增加带来了每线程可分配资源的减少，从而影响了ＧＰＵ方法性能的提高．

流处理器数目比值基本一致．图６所示为Ｇｅｆｏｒｃｅ

ＧＴＸ

２６０＋在不同运行频率下的执行时间，图中模式

１～４的流处理器和显示内存频率分别为１

２９６ＭＨｚ

和８３０ＭＨｚ，１２９６ＭＨｚ和ｌ１０７ＭＨｚ，ｌ４０３ＭＨｚ和

１１０７ＭＨｚ，１５０４ＭＨｚ和１１０７ＭＨｚ．可以看出，随

着流处理器频率的提升，执行时间相应减少，二者几乎成正比关系，但显示内存频率改变对执行速度几

乎无影响．

图６

ＧＰＵ在不同运行频率下执行时同

通过以上２个项实验可以认为，本文方法在流处理器数目和运行频率方面具备稳定的可扩展性，

易于扩展到未来更高规格的ＧＰＵ上．５。６实验结果对比分析

图４

Ｋ—ｍｅａｎｓ速度比较（纵坐标为对数刻度）

系统各部分方法在ＣＰＵ和ＧＰＵ上的执行时

５）前缀和法生成索引．实验显示，对于１０２

４００

间分别如图７ａ和７ｂ所示，可以看出，增量聚类与

个数据点，使用前缀和法生成特征点索引需要２．８ｍｓ，

生成视觉关键词词频向量占用的时间比重比较大?

而ＧＰＵ的原始循环方式需要１２．３ｍｓ，前者比后者

以５ｓ为例，在ＣＰＵ上分别为２２２８?８ｓ和１９５９?５

ｓ，

快４倍以上．

在ＧＰＵ上执行时间分别为３０．５ｓ和２６．８ｓ．我们在５．５

可扩展性实验

ＧＰＵ上的基．于增量式聚类的视频拷贝检测方法整体

除比较了本文方法的基础性能，我们也以Ｋ—

ｍｅａｎｓ聚类为例进行了可扩展性实验．实验中使用

ＧｅｆｏｒｅｅＧＴＸ２６０＋和Ｇｅｆｏｒｃｅ

９５００ＧＴ分别执行相

同的计算，比较执行时间；再使用ＧＰＵ频率修改工

具改变ＧｅｆｏｒｃｅＧＴＸ２６０＋的流处理器频率和显示

设备内存执行频率，并进行比较．

图５所示为ＧｅｆｏｒｃｅＧＴＸ２６０＋与Ｇｅｆｏｒｃｅ

９５００ＧＴ的执行时间比值．可以看出，该比值在４～７之间随数据量增大而不断增加，且与２块ＧＰＵ的

８７

丑６瑙５景４

３２

／

。。／

．．．／ｒ。

８

１６

３２

６４

１２８

２５６

５１２

１０２４

１０’２×数据点

图５

ＧＴＸ２６０＋９５００ＧＴ的执行时间比值

图７

系统各部分方法在ＣＰＵ和ＧＰＵ上的时间分配

万方数据

GPU加速的基于增量式聚类的视频拷贝检测方法

作者：任化敏，张勇东，林守勋

作者单位：任化敏(中国科学院计算技术研究所前瞻研究实验室,北京,100190;中国科学院研究生院,北京,100049;北京中医药大学信息中心,北京,100029)，张勇东,林守勋(中国科学院计算技术

研究所前瞻研究实验室,北京,100190)

刊名：

计算机辅助设计与图形学学报

英文刊名：JOURNAL OF COMPUTER-AIDED DESIGN & COMPUTER GRAPHICS

年，卷(期)：2010,22(3)

参考文献(18条)

1.Lowe D G Object recognition from local scale-invariant features 1999

2.吴恩华图形处理器用于通用计算的技术、现状及其挑战[期刊论文]-软件学报 2004(10)

3.Hillis W D;Steele G L Data parallel algorithms 1986(12)

4.Fang W B;Lau K K;Lu M Parallel data mining on graphics processors 2008

5.Che S;Boyer M;Meng J A performance study of general-purpose applications on graphics processors using CUDA 2008(10)

6.曹锋;周傲英基于图形处理器的数据流快速聚类[期刊论文]-软件学报 2007(02)

7.MacQueen J B Some methods for classification and analysis of multivariate observations 1967

8.Chariot A;Keriven R GPU-boosted online image matching 2008

9.Heymann S;Müller K;Smolic A SIFT implementation and optimization for general-purpose GPU 2007

10.Hao F;Li E;Chen Y Parallelization and characterization of SIFT on multi-core systems 2008

11.Berker B;Cebe M;I ·smet Z Y Very-large scale incremental clustering 2007

12.Ren H M;Lin S X;Zhang D M Visual words based spatiotemporal sequence matching in video copy detection 2009

https://www.doczj.com/doc/549447705.html,w-To J;Buisson O;Gouet-Brunet V Robust voting algorithm based on labels of behavior for video copy detection 2006

14.Joly A;Frelicot C;Buisson O Feature statistical retrieval applied to content based copy identification 2004

15.Hampapur A;Hyun K -H;Bolle R Comparison of sequence matching techniques for video copy detection 2002

16.Hampapur A;Bolle R Feature based indexing for media tracking 2000

17.Sanchez J M;Binefa X;Vitria J Local color analysis for scene break detection applied to tv commercials recognition 1999

https://www.doczj.com/doc/549447705.html,w-To J;Chen L;Joly A Video copy detection:a comparative study 2007

本文链接：https://www.doczj.com/doc/549447705.html,/Periodical_jsjfzsjytxxxb201003013.aspx