一、地址匹配技术
地理信息系统技术的应用已经从专业领域走到社会生活和工作的方方面面,从城市的规划管理,到投递员最经济的投递线路,凡是与地理位置相关的信息,都可以利用地理信息系统技术来管理。没有地图,就无从谈及地理信息系统。由此,引申了这样一个问题——这些地图从哪里来?
我们通常说的地图,是由国家专业的职能部门来完成各种比例尺地图的生产和制作,这些地图表现了基本的地理面貌——山川河流的分布,城市道路、街区分布等等。但是,仅仅是这样地图信息是远远不能适应我们的需求,很多人文、经济信息都与地理位置相关,而这些信息是无法在基础地图中得到的。这些信息的原始载体都是地址——学校、医院、各类工商企业、居住地址等等,这些地址信息都在相关的专业部门管理,但这些载有地理位置的地址仅仅是文字描述,并没有转化成地理空间位置,这些信息的空间地理位置图该怎样得到?
传统的方法,我们称之为“扫街”,就是通过人工的方法,到实地去采集地址的坐标(如利用手持GPS定位仪等等),然后再将这些采集的坐标点制作成图。“扫街”的方法有很多弊端,最明显的就是生产周期长,人力资源成本高。而且,对于每个单位来说,扫街采集地址位置还存在实施的难度,对于大数据量的点位分布图,几乎无法满足实际应用的需要
地址匹配技术就是用来解决这个问题的。地址匹配是将文字性的描述地址与其空间的地理位置坐标建立起对应关系的过程。地址匹配服务按照特定的步骤为地址查找匹配对象。首先要将地址标准化;然后服务器搜索地址匹配参考数据,查找潜在的位置;根据与地址的接近程度为每个候选位置指定分值,最后用分值最高的来匹配这个地址。
很显然,地址匹配最重要的是将地址标准化,建立地址编码数据库。
虽然国外有不少商业化的地址匹配引擎服务,但这些技术都是建立在国外地址模型基础上,完全不适合使用象形文字中国。因为地址匹配服务必须本地化,必须建立不同地区的地址编码数据库。