登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 地理科学类 > 地理信息科学 > 正文

基于时间地理的游记地名消歧文献综述

 2020-04-14 08:04  

1.目的及意义

时间地理学和GIS空间分析方法的结合研究,梳理了从地理属性数据到可视化结果的过程,反映了属性特征在时间背景下的状态变化。具体表现为某个地理单元位置的变化趋势。GIS让时空路径、时空棱镜等时间地理工具的构建变得更加便捷,增强了可视化效果。通过数据可视化分析,人们可以简单明了的理解数据,分析数据,挖掘数据中存在的潜在规律,缩短人们对数据的加工处理时间,同时位置是最能反映出一个地理单元特征的属性信息,也是GIS空间分析方法的必要保障。

在时间维度的层面上进行GIS空间分析,不仅可以用来预测未来可能变化的趋势,还可以反映在该时间段内地理实体的位置分布概率。由于一个地理命名实体可以映射为多个地理实体单元,因此对于某个地理命名实体到地理实体单元的指代关系具有一定的不确定性,而这种不确定性可以通过时间背景下地理单元可能存在的空间位置而减小,即缩短在空间上的地理位置搜索范围,从多个歧义地名中确定一个或多个候选地理实体单元,消除地名歧义。这种基于GIS技术和时间地理学进行时空节点规划和优化的方法可应用于应急救灾、物流配送、旅游规划等领域,从而提高时间利用率,节约成本,使得时间地理学与现实生活有机结合,丰富了GIS空间分析的理论研究内涵。

在web背景下展开研究,有利于在海量的网络数据中对地理信息的提取和web地理数据的挖掘。Web挖掘是利用各种数据挖掘方法、文本挖掘、机器学习等技术从Web页面数据、日志数据、超链接关系中发现感兴趣的、潜在的、有用的规则、模式、领域知识等。网络丰富着人们的生活,地理数据是GIS空间分析的基础,如何在浩如烟海的网络数据中抽取出我们感兴趣的地理数据并定位到某个地理实体单元是一项十分重要的工作,它不但涉及web技术,还涉及地理学,信息学,程序设计等多个学科技术。这项工作也是大数据时代的驱动,让数据帮助我们界定web文本中我们所需要研究的空间区域,对于空间决策,辅助分析具有十分重要的意义。

国外对于地名消歧的研究方法主要可以分为三个类型,基于地图的方法、基于外部资源的方法和数据驱动的监督方法,前两者是基于启发式规则的方法,后一种方法是居于语料库的方法。

国内也有许多的学者研究中文地名消歧问题,并取得了一定的成果。唐旭日等人提出基于条件随机场和篇章地名关系的地名识别方法、基于局部模糊匹配的地名标准化方法和基于认知显著度的地理编码方法。张毅等人提出了一个基于语义的自动提取文本地理位置的方法,认为只有起到地理参考作用的地理实体才能用于文本的地理参照,并结合语义关系和地理命名实体在文本中出现的次数来确定所对应的地理实体单元。朱少楠等人通过构建歧义地名行政隶属关系的树状图,从子节点的茁壮程度对地名进行消歧。马雷雷等人提出了一种基于地名知识辅助的中文地名消歧方法,从语义关系、拓扑关系、距离关系和地名密度4个维度计算地名实体之间的地理关联度进行地名消歧。

{title}

2. 研究的基本内容与方案

{title}

在web网络的背景下,将地理信息系统技术的分析方法与时间地理学的框架结合起来,研究web文本中的地理命名实体与地理实体单元的对应关系,消除地名歧义。

首先,在web网络背景下,通过web文本爬虫,从大数据中抓取出研究的web文本,此时的文本是非结构化的 ,即由一个个"字"组成,通过相关的算法将文本进行分词,探索出文本的名词词性,结合地名知识库提取出候选地名集,地理译码后获得候选地名集中各个点的经纬度坐标,形成地名空间数据库,此时,便可以通过地图的映射关系在二维平面上展开,地名点数据集形成空间点图层。空间点图层中各个点的空间位置不同,不同位置的点可能具有相同的地名属性,即一个地理命名单元可能指向不同的地理空间实体。
其次,确定移动个体的起始地理位置和最终定向移动的终止地理位置,在先验知识下,起始点和终止点所表示的地名不具有地名歧义,同时,时空移动的个体具有一定的时空约束条件,即能力约束、组合约束和权威约束,三者作为移动对象的约束因子,可以确定移动个体的最大速度。将起始地名点和终止地名点结合约束因子,在时间维的基础上展开,以O为原点,建立三维空间,X轴和Y轴表示移动个体地理维度和地理经度,XOY平面表示移动个体的空间位置,Z轴为时间轴,绘制出空间棱柱体,并将空间棱柱体投影在XOY平面上,投影面称为潜在路径区域(PPA)。
最后,将在潜在路径区域(PPA)与地名点数据集形成的点图层做空间布尔运算,如果地名点位于PPA区域内,则保留地名点,此时的地名点为无歧义且具有空间对应关系的地名点;如果地名点位于PPA区域外,则该地名点为歧义地名点,从而达到地名消歧的目的。



3. 参考文献
[1]唐旭日,陈小荷,张雪英.中文文本的地名解析方法研究[J].武汉大学学报:信息科学版,2010,(8):930-935.
[2]钟翔,高勇,邬伦.基于链接分析的网页文本核心地名提取方法[J].地球信息科学学报,2016,18(04):435-442.
[3]张毅,王星光,陈敏, 等.基于语义的文本地理范围提取方法[J].高技术通讯,2012,(2):165-170.
[4]李照航,郭风华,李仁杰,傅学庆,严正峰.大量网络游记文本中热度地名提取方法与实证研究[J].地理与地理信息科学,2015,31(01):68-73.
[5]宋子辉.自然语言理解的中文地址匹配算法[J].遥感学报,2013,17(04):788-801.

[6]朱少楠,张雪英,李明, 等.基于行政隶属关系树状图的地名消歧方法[J].地理与地理信息科学,2013,(3):39-42.

[7]马雷雷,李宏伟,连世伟, 等.地名知识辅助的中文地名消歧方法[J].地理与地理信息科学,2016,(4):5-10.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图