当前位置:文档之家› GPU加速的基于增量式聚类的视频拷贝检测方法

GPU加速的基于增量式聚类的视频拷贝检测方法

 万方数据

 万方数据

 万方数据

 万方数据

 万方数据

 万方数据

第3期任化敏,等:GPU加速的基于增量式聚类的视频拷贝检测方法455

提高约8倍、31倍、16倍和26倍,整体性能提高约22倍.

虽然速度得到了提升,但这个提升倍数远没有达到我们预期的加速比,其原因是我们的视频分辨率较低,每帧产生的SIFT特征较少,没能让GPU满负荷运行,所以加速比较低.

4)K—means聚类.图4所示为GPU方法相对

于CPU的速度提高比较.实验显示,本文基于流式

缩减的GPU实现方法在聚类51200个数据点时,

相比CPU方法达到73倍的加速比,比GPU的原始实现也有近6倍的加速比.实验中也发现,在数据

量达到102400之后,加速比有轻微的下降,这可能

是由于线程块内的线程数目增加带来了每线程可分配资源的减少,从而影响了GPU方法性能的提高.

流处理器数目比值基本一致.图6所示为Geforce

GTX

260+在不同运行频率下的执行时间,图中模式

1~4的流处理器和显示内存频率分别为1

296MHz

和830MHz,1296MHz和l107MHz,l403MHz和

1107MHz,1504MHz和1107MHz.可以看出,随

着流处理器频率的提升,执行时间相应减少,二者几乎成正比关系,但显示内存频率改变对执行速度几

乎无影响.

图6

GPU在不同运行频率下执行时同

通过以上2个项实验可以认为,本文方法在流处理器数目和运行频率方面具备稳定的可扩展性,

易于扩展到未来更高规格的GPU上.5。6实验结果对比分析

图4

K—means速度比较(纵坐标为对数刻度)

系统各部分方法在CPU和GPU上的执行时

5)前缀和法生成索引.实验显示,对于102

400

间分别如图7a和7b所示,可以看出,增量聚类与

个数据点,使用前缀和法生成特征点索引需要2.8ms,

生成视觉关键词词频向量占用的时间比重比较大?

而GPU的原始循环方式需要12.3ms,前者比后者

以5s为例,在CPU上分别为2228?8s和1959?5

s,

快4倍以上.

在GPU上执行时间分别为30.5s和26.8s.我们在5.5

可扩展性实验

GPU上的基.于增量式聚类的视频拷贝检测方法整体

除比较了本文方法的基础性能,我们也以K—

means聚类为例进行了可扩展性实验.实验中使用

GeforeeGTX260+和Geforce

9500GT分别执行相

同的计算,比较执行时间;再使用GPU频率修改工

具改变GeforceGTX260+的流处理器频率和显示

设备内存执行频率,并进行比较.

图5所示为GeforceGTX260+与Geforce

9500GT的执行时间比值.可以看出,该比值在4~7之间随数据量增大而不断增加,且与2块GPU的

87

丑6瑙5景4

32

。。/

.../r。

16

32

64

128

256

512

1024

10’2×数据点

图5

GTX260+9500GT的执行时间比值

图7

系统各部分方法在CPU和GPU上的时间分配

 

万方数据

 万方数据

GPU加速的基于增量式聚类的视频拷贝检测方法

作者:任化敏, 张勇东, 林守勋

作者单位:任化敏(中国科学院计算技术研究所前瞻研究实验室,北京,100190;中国科学院研究生院,北京,100049;北京中医药大学信息中心,北京,100029), 张勇东,林守勋(中国科学院计算技术

研究所前瞻研究实验室,北京,100190)

刊名:

计算机辅助设计与图形学学报

英文刊名:JOURNAL OF COMPUTER-AIDED DESIGN & COMPUTER GRAPHICS

年,卷(期):2010,22(3)

参考文献(18条)

1.Lowe D G Object recognition from local scale-invariant features 1999

2.吴恩华图形处理器用于通用计算的技术、现状及其挑战[期刊论文]-软件学报 2004(10)

3.Hillis W D;Steele G L Data parallel algorithms 1986(12)

4.Fang W B;Lau K K;Lu M Parallel data mining on graphics processors 2008

5.Che S;Boyer M;Meng J A performance study of general-purpose applications on graphics processors using CUDA 2008(10)

6.曹锋;周傲英基于图形处理器的数据流快速聚类[期刊论文]-软件学报 2007(02)

7.MacQueen J B Some methods for classification and analysis of multivariate observations 1967

8.Chariot A;Keriven R GPU-boosted online image matching 2008

9.Heymann S;Müller K;Smolic A SIFT implementation and optimization for general-purpose GPU 2007

10.Hao F;Li E;Chen Y Parallelization and characterization of SIFT on multi-core systems 2008

11.Berker B;Cebe M;I ·smet Z Y Very-large scale incremental clustering 2007

12.Ren H M;Lin S X;Zhang D M Visual words based spatiotemporal sequence matching in video copy detection 2009

https://www.doczj.com/doc/549447705.html,w-To J;Buisson O;Gouet-Brunet V Robust voting algorithm based on labels of behavior for video copy detection 2006

14.Joly A;Frelicot C;Buisson O Feature statistical retrieval applied to content based copy identification 2004

15.Hampapur A;Hyun K -H;Bolle R Comparison of sequence matching techniques for video copy detection 2002

16.Hampapur A;Bolle R Feature based indexing for media tracking 2000

17.Sanchez J M;Binefa X;Vitria J Local color analysis for scene break detection applied to tv commercials recognition 1999

https://www.doczj.com/doc/549447705.html,w-To J;Chen L;Joly A Video copy detection:a comparative study 2007

本文链接:https://www.doczj.com/doc/549447705.html,/Periodical_jsjfzsjytxxxb201003013.aspx

相关主题
文本预览
相关文档 最新文档