当前位置:文档之家› 《数据采集规则》

《数据采集规则》

《数据采集规则》
《数据采集规则》

――――――――――――――――――――――――――――――――――――――――――――――――――

数据采集规范与管理制度

1、采集范围:XXX目前所定的采集数据的地理范围与城市交通旅游图大致相同。

2、采集对象

?地标

1)道路:道路、路口、隧道信息、大桥等

2)建筑:大厦、小区、公寓、标志性建筑等

3)设施:火车站、长途汽车站、飞机场、停车场、加油站、收费站、大型绿化带、广场、公园、

厕所、景点等

4)其它重要地标:开发区、河流、湖泊、特色街区等

?企业、商家、机构和组织

1)企业和商家:包括市区范围内所有具备独立的、正式的、固定的营业场地的企业、商家,无论

沿街还是非沿街的。但仅采正规店面,只摆个柜台在外面的不用采。专业市场、广场、商厦(服

装市场、陶瓷品市场、五金建材市场、百货大楼等)内的一般店铺不单独采集,但品牌专卖店、

休闲场所、特色餐饮店和金融服务机构要单独采集。

2)政府机关

3)其它机构和组织

3、采集信息的类型

1)基本信息:包括采集对象的名称、地址和照片。

2)详细信息:包括采集对象的名称、地址、联系方式、经营特色和照片。

4、详细信息的采集标准

?基本采集标准

1)采集对象的名称不少于2个字;地址不少于3个字,格式为路名+门牌号;联系方式包括电话

号码、网址(非必填)和电子邮箱(非必填),经营特色不少于12个字。

2)采集对象的名称、地址、联系方式、经营特色和照片中任何一项缺少,或字数不达标,该信息

都不能作为“详细信息”统计。但加油站、停车场等无电话号码和门牌号的对象无须填写联系

方式和地址。

3)对只有经营特色一项未按行业分类采集标准填写的,或虽然填写了,但描述不清晰的,该条信

息按半条“详细信息”计。每20条基本信息抵算1条详细信息。(??) 行业分类采集标准:采集对象按下文中的表格分为13大类和182小类。

5、采集规则

?采集步聚

1)区块划分:将城市划分成若干采集区块,区块的大小以放大打印成A3纸“导图”后,能让记事

员完整清楚地填写标注内容为准。

2)采集方式:记事员采集时,应按“导图”所划线路,先采集沿街商家信息。规定线路采集完毕

后再采集非沿街商家信息。

3)记事员必须按照“采集规则”进行采集,并对自己所采集信息的真实性和完整性负责。记事员

记录信息、标注导图时,必须做到字迹清晰,保证能被迅速识别。

?采集工具

2)采集表

3)导图:一式五份

4)蓝红两色圆珠笔

5)自行车

6)数码相机及配件

7)城市地图

8)带无线上网卡笔记本电脑

?

?采集表填写规则

XXX公司信息采集表

?

?

1)信息编码

a)信息编码的含义:信息编码的长度为10位,每条信息编码对应本城市一条唯一的数据信息。

其中前面1-2位代表记事员编号,3-5位为采集区域编号,6-7位为采集线路号,8-10位

代表采集的信息号。

b)信息编码的填写:在每条线路开始的第一条信息,一定要写明完整的10位信息编号。此后

该线路的其它信息可以只填写最后三位“信息号“,并按线路从头至尾从001依顺序开始

编号。

2)道路

a)在多数情况下该商家的门牌上的路名与实际所在街道名是一致的,因此道路名称填的就是

门牌上的道路名,如门牌上写:XX路XX号。

b)有个别地方,商家门牌上的路名可能与实际路名不一致, 有门牌的按照门牌填写;无门牌

的,则按该商家所在的实际街道名称填写(要确认该街道名称无误)。

c)如果一条道路有2个道路名称或没有标路牌,应向当地人打听清楚后再填写。如属于新路

未命名的,则如实填写“未命名”。

3)门牌号

a)一般情况下一个商家有一个门牌号,则按此填写。

b)有时一个商家同时有新旧门牌号,则向商家打听后按常用门牌号填写。

c)出现无门牌号商家时,不填写。

d)两个商家共用一个门牌号:则两个商家填写相同的门牌号。

e)写字楼内的商家,其门牌号均填写字楼门牌号。

f)一个商家有多个门牌号:写明所有门牌号,并用“/”隔开。

4)所在建筑物名称/楼层/房间

a)该商家营业房如果属于小区的,则填写该小区名称,如该小区无名称只有文三路53号,直

接以商铺代替。

b)该商家营业房如属于某大厦或公寓的,则填写该大厦或公寓名称。

c)该商家营业房如属于某广场的,则填写该广场名称。

d)该商家营业房如是一排单独的商业店铺的,则所在位置填写“商铺”

e)该商家营业房如属其它有名字的某建筑的,则参照以上方式填写。

f)商家不在一楼的,注明楼层,如果有房间号,注明房间号。

5)路口:是指该商家是否属于路口、河口,即统称为路口信息。

6)商家名称填写

a)有名称的商家必须采集,无名称的商家无须采集。

b)商家名称必须记录完整,对于银行、连锁店等商家在不同的路段应加以区分,如“话机世

界文晖店”、“话机世界延安店”,“中国工商银行高新支行文三路分理处”、“福建沙县小吃

NO2008”等。

c)遇有商家名称用商标图案代替的,如李宁专卖店,则要填写“李宁XX路专卖店”,如果不

清楚商标图案所代表的商家名称的,可向店内工作人员打听清楚后再填写。

d)遇有商家名称用篆书、草书等字体看不清楚的,记事员需向商家打听注册名称或从其营业

执照上查看后再填写。

e)遇有商家名称用外文的,记事员需打听其中文名后在商家名称内写明中外文名称,如仅有

外文的可只填写外文名称。

f)遇有商家名称错字的,记事员需向商家打听清楚后方可填写,并对错字使用下划线,使录

入人员在录入时能明白,而不至于误认为记事员写错别字。

g)在遇到有商家故意使用歧异字来取名的,记事员填写时需在歧异字下标下划线,以使录入

人员清楚歧异。如,商家名称:“长青虅”,正常情况下是“藤”,此时记事员应在采集表注

明:“长青虅”

7)经营特色:参照采集内容标准填写

?填写示例

?

?

? 如有宣传册填写示例: ?

8) 特殊情况下的采集

a) 广场商城:有道路名及路牌的与沿街商家一样采,没有道路名的或商城楼上的,“详细信息”

商家要采,简单信息商家不采。

b) 地铁商城:只采重要商家,如连锁店、特色有名气店。

c) 景区商城:有道路名及路牌的与沿街商家一样采,没有道路名的或商城楼上的,“详细信息”

商家要采,简单信息商家不采。

d) 宾馆酒店:要将宾馆酒店内的各项服务设施分开采集,如:中餐厅(如果有不同地方口味

010*********-1、要取商家有效信息(宣传册)注意事项

1、如写字楼的一些物业收费,每平方米租金等等信息,记事员应采取相应的方法,如到物管那,以想要租写字楼的公司身份与他交谈,得到的效果比介绍我们自己产品的的效果要好的多

2、如小酒店等一些特殊商家,我们应采取以上相同的方法得到商家的有效信息,否者效忙的商家不太理会你们对产品的一些介绍

3、如果企业单位,老板或经理对我们的产品有一种模糊的概念的,我们就可以向他们介绍我们的产品,这样基本上他们比较容易接受耶。

好几个中餐厅,则要分开采)、西餐厅、会展场馆、保龄球馆、卡拉OK厅、酒吧等对外开

放的设施分开采。

9)建筑物编号

a)建筑物编号以建筑代号+区域号+线路号+建筑流水号(注明楼层)

b)建筑物代号示例

?大厦=AB+区域号+线路号+建筑流水号

?小区=AC+区域号+线路号+建筑流水号

?商铺=AR+区域号+线路号+建筑流水号

c)单独建筑物代号示例

?学校= AS+区域号+线路号+建筑流水号

?医院= AH+区域号+线路号+建筑流水号

?工厂(公司、农贸市场)= AF+区域号+线路号+建筑流水号

d)标识区代号示例

所谓“标识区”,是指不是商铺、大厦、新村或小区、企业、学校等的,分散的几家店+空地,

或很小的企业厂址等比较乱的区域,就划在一起用“标识区”来命名它。标识区= ID+区域号+

线路号+建筑流水号

?照片的采集规则

1)“详细信息”,必须附带一张照片,照片的拍摄要求参照“采集内容标准”。

2)记事员完成当天采集工作后,必须对照片进行整理,将照片的文件名改写成与信息编码一致。

?信息采集标准作业流程

?在接到任务内,要在三天内做好准备,如填写出差申请,出差费用申请等等事物。

?采集部主管到美工部领取记事员信息采集所需导图

a)核查导图区域划分是否合理

b)核查导图方向箭头指向是否合理

3)按工作量分配记事员个人所要采集的区域

4)记事员领取导图与采集信息所需物品,如:数码相机、本地交通图、信息采集表、笔、本子等。

5)核查导图与本地交通图,如导图与本地交通图不符合,用铅笔修改导图

6)查看导图与本地交通图的方位,方便记事员直接到达采集区域

7)记事员在采集过程中,主要工作内容:拍→对所有建筑、商铺、大厦、风景区进行拍摄,记→

记录所拍照片的地址、名称、电话、特色等,画→遇到路口、河口时,将离路口或河口最接近

的商家门牌号画入导图,详细请看“采集规则”

8)记事员在采集过程中,如遇到与采集规则无关的情况,如:数码相机被扣留、天气变化较大等,

请及时与领队反映。

9)按信息采集小组工作时间表回到集合点集中,进行数据交接,与领队将当日所拍商家图片导入

电脑,填写记事员登记表,记事员对导入电脑的商家图片与采集信息表逐一进行核对,确认无

误后,将图片存入文件夹名为 / 记事员姓名 /。为了避免记事员在采集表里换路名时,忘记填

写,特别提醒在画导图时,希望照着采集表画,这样如果遇到忘填写的路名时自己就容易发现,

为了能让标注人员清楚的看懂导图,希望记事员在画导图时,最好以一条路为一条线,如为了

节省时间,可以考虑绕4-5条路。

10)上交导图与集息采集表,导图对应的采集表要装订为一叠,并在本叠采集表首页顶端依次写上

1、信息员完整编号,信息编码的长度为10位,每条信息编码对应本城市一条唯一的数据信息。

其中前面1-2位代表记事员编号,3-5位为采集区域编号,6-7位为采集线路号,8-10位代表

采集的信息号,再用导图包在一起。

11)领队统计当天所采集信息的数据量,对每一个记事员当天信息采集的质量进行检查,把握记事

员采集回来采集表、导图、图片整理的规范性,如出现导图红蓝笔用的不规范,如出现无名小

区,中国银行高新支行写成中国银行等等不规范采集,都必须及时纠正错误,但是当日出错的

记事员所采集的数据,要全部核查,以免出现其它未发现错误。如发现无法修改信息的错误,

当天的数据需要重新进入采集。如抽查无误后,将当天数据传给数据部进行处理。

12)领队要将当日记事员采集的错误信息进行统计,并且汇报上级领导上交当日工作总结。由于城

市建设的不同,在采集过程中也会遇到不同的情况,如遇无法解决的,马上打电话与领导反映

情况,等领导商议后决定新规则。

6、导图标识规则

“导图”示例:

?

?

?

?

?导图标识内容

1)路口商家信息的标识:路口商家信息是指交叉路口两边最靠近交叉路口的商家,如图所示:红

点代表13区要采的所有路口商家信息。

a)所有商家信息均用“红色圆点”标识,并注明“信息号”。

b)每个十字路口要采集8个路口商家信息

c)遇到丁字路口时,要加采一个与道路正对的路口信息。(如图所示:2线加采了一个丁字路

口信息)

2)河口商家信息的标识:道路与河流交汇的河口,记事员必须在导图上标识这条路上距离路口/

河口最近的2个商家信息(如13区1线所示)。

?

?

?

?

?

?

?

?

?

?

?

?

?

?

3)沿街商家信息的标识:一般沿街商家信息不用标识,但沿街特殊设施的两边位置,最靠近的商

家信息却是要标识的,如13区2线所示:九莲新村两边的32-60商家,离围墙最近的两边商家。

如此标识的目的是为了使标注环节更准确地在电子地图上标注商家的具体位置,而不至于现把32商家标注到了60边上。

4)区块内非沿街商家信息的标识:用红点标注商家具体位置,并注明“信息号”。如13区“导图”

中所示信息号为“52或53”的详细信息。

5)采集线路的标识:记事员按分配到的区域“导图”进行采集,采集前记事员要规划好行进线路

以方便采集,并对线路进行编号(如图所示:1线),线路和线路号一律用蓝色圆珠笔划写。一

条线路的末端一定要用箭头符号作为终点符,记事员规划线路时尽可能将起点、终点设在路口。

6)其它内容标识参照以下符号,并且要注明名称。

7、信息更新管理制度

?信息更新的范围

1)频繁变更信息:公交线路信息

2)较少变更信息:商家信息

3)基本固定信息:道路信息、河流信息、建筑物信息

?信息更新周期

1)频繁变更信息:每月一次

2)较少变更信息:每三个月一次

3)基本固定信息:每一年一次

?信息更新管理制度

1)公交线路更新,根据当地公交公司在网站,报纸和电视等媒体上发布的变更线路消息,由专人

对这些变更的线路进行调查,并采集最新的信息;定期到各条线路的始发和终点站了解线路的

变化情况,对变更线路进行采集记录;把更新的数据定期发给数据处理部门进行更新。

2)每个城市划分为若干个区域,作为记事员更新数据的工作任务区块,设计好每天的行进路线,

将以前采集回来已录入数据库的数据信息打印出来,到该区域现场对所有采集过的信息进行逐

一核查,发现有变更的,则在图上标识,并在采集表上填写更改内容,定期汇总发给数据处理

部门进行更新。

3)在数据采集更新的过程中,也要随时注意道路名称和建筑物是否有变化,如果有变化也要对这

些信息进行记录和核实。

4)每年对所有的道路、水系等进行一次全面的调查,发现有变更的及时采集和更新;同时也要随

时关注当地媒体和政府相关部门网站的信息,有道路、水系等更新的,及时实地调查、采集和

更新。

附件一:公交数据采集规范

1、采集内容

1)站点编号:前面7位与商家信息号一样,最后三位(信息编号),用B01—B99

2)站点名称

3)站点别名

4)经过线路

5)其它内容

a)线路名称(上行、下行)

b)起点

c)终点

d)普通票价

e)空调票价

f)首班时间

g)末班时间

h)可用公交卡

i)线路经过站名(直接在线路表里打√)

j)服务时间(公交车服务时间如星期一到星期五或双休日)

2、采集格式

1)站点

站点编号:站点名称:别名:

经过线路:

2)线路

线路名称起点终点

经过站点:(按线路表,采过的站点打勾。不同线路同一站名也要打勾。线路表上缺失的站点要按统一格式补采。)

首班时间末班时间

普通票价空调票价

可用公交卡

3、问题处理:

1)重复站名:不是供同一车次使用的同一站名,要用站名+字母来区分,如九莲新村A,九莲新村B。

2)往返线路一致:如果线路上下行都是经过同样的站名,只采集单程线路即可。

3)往返线路不一致:如果线路上下行经过站点不同,须采集往返程线路。如159路A,159路B。

4)任务分派:分派采集区块时应将须采集的公交线路一同分派好,负责采集某区域的人员同时应采集

该区域内的公交线路。

4、画公交与地图导图的规则:

1、在导图中把当天采集的公交站以实心三角形点在导图上,在实心点上写出信息号如B01。

2、遇到地铁时,只需在导图上画圆心点确定位置即可。

相关主题
文本预览
相关文档 最新文档