当前位置:文档之家› 聚类分析在任务定价规律中的应用

聚类分析在任务定价规律中的应用

聚类分析在任务定价规律中的应用
聚类分析在任务定价规律中的应用

聚类分析在任务定价规律中的应用

摘要针对“众包”形势下的任务定价问题,主要通过数据分析,选取任务地点研究任务的定价规律。首先将任务定价分区,根据所作散点图可知数据存在辐射圈,利用K 均值聚类算法解出三个聚类中心点。进而,拟合求得三点对应的任务位置和定价的关系式,检验得到三个关系式的平均偏差比,即可以反映任务定价的规律。

关键词定价;聚类分析;定价分区;辐射圈

前言

聚类问题实际上是将一组数据分成若干个组,每个组里的对象具有很大的相似性,不同的组之间存在尽量大的差异性。在这些组之间寻找数据之间内在的联系。这个过程实际上是一中在无监督状态下寻找最优划分的过程[1]。聚类算法一般有五种方法,最主要的是划分方法和层次方法两种。其中层次聚类由不同层次的分割聚类组成,层次之间的分割具有嵌套的关系。本文主要应用K-means 算法解决任务定价规律问题。

1 数据的获取与假设

本文数据均来源于2017 年全国大学生数学建模竞赛题B题[2]。为方便求解,提出以下两点假设:①将经纬度坐标系下的两点间的距离公式看作直角坐标系下的两点间距离公式;②假设不考虑天气等自然因素的影响。

2 任务定价规律

2.1 任务定价分区

首先,将数据中的任务定价按照从高到低的顺序分为五个区域,其中的第一、第二、第三、第四、第五区间为定价分别85~75、74.5~72.5、72~70、69.5~67.5、67~65;数据中任务地点主要涉及的地区自西向东依次为广东的佛山市、广州市、东莞市以及深圳市。

2.2 运用K均值聚类法求解辐射圈中心点

以全部定价和定价为85的数据作散点图,可知数据存在点聚集现象,说明数据存在辐射圈。K均值聚类算法能实现类内相似度最高和类间相似度最低且能达到局部最优。利用SPSS求得4种聚类结果,最终分析选择聚类中心点数为3的情况,结果如下表1所示:

2.3 利用拟合求解任务位置和定价的关系式

相关主题
文本预览
相关文档 最新文档