本发明涉及时空数据挖掘技术领域,尤其是涉及一种基于空间相似性的海量轨迹层次化并行聚类方法及系统,包括根据获取的轨迹数据进行轨迹区域的网格单元划分;基于划分的网格单元将轨迹数据转化为集合数据;根据集合数据的集合形式,计算每条轨迹对应的MinHash签名并将所有轨迹的MinHash签名组成签名矩阵;将得到的签名矩阵划分为若干个带,并将带中的轨迹映射到桶中;将至少在一个带中被映射到同一个桶中的轨迹划分到同一类;本发明在不需要提前知道轨迹数据集中的类的数量以及无需对轨迹数据集进行训练的情况下,自适应的将轨迹依据其空间相似性快速地划分为若干个类。 |