地理编码
n地理编码指将基于文件的邮政地址数据转换为数字地理坐标(如,成对的经度和纬度)。
n地理编码最常见的形式是地址地理编码,也称为地址匹配。它将街道地址用点要素表示在地图上。
n地址地理编码通过比较地址与参照数据库中的数据来确定街道地址的位置。
地理编码参照数据库
n地理编码参照数据库由街道地图和街道属性组成,街道属性包括每个街段的街道名称、街道两侧的起始地址号码,以及每一侧的邮政编码。
n过去,美国大多数GIS用户从TIGER/Line文件生成地理编码参照数据库。
n地理编码参照数据库可以从商业公司购买。
图 16.1
记录名称、地址和邮政编码的地址表举例。
图16.2
TIGER/Line文件所包括的属性:FEDIRP、 FENAME、FETYPE、FRADDL、TOADDL、FRADDR、TOADDR、ZIPL和ZIPR, 这些属性对地理编码十分重要。
地址匹配过程
通常,地理编码过程包括三个阶段:预处理、匹配和标绘。
n预处理阶段包括解析和地址标准化。
n匹配阶段 ,在参照数据库下将地理编码引擎和地址相匹配。
n如果已经判定地址匹配,最后一步是把它作为点要素标注在图上,然后在该地址所在的范围内进行插值。
n线性内插的另一个方法是使用“地址位置”数据库,已在一些国家开发。在这样的数据库中,地址的位置由一对x、y坐标值表示,与建筑基底或“踪迹” (footprint)的质心一致。
图 16.3
地址地理编码的线性内插定位。
图 16.4
地理编码将街道地址以点的形式标示在地图上。
地址匹配选项
n通常,地理编码引擎能够放宽匹配条件,但使用一个评分系统来量化在同一时间的匹配。
n鉴于匹配选项众多,我们可能需要多次运行地理编码程序。
偏移标注选项
GIS 软件包有旁向偏移和端点偏移两个选项。
图 16.5
端点偏移使地理编码的点偏离街段的端点,侧向偏移使地理编码的点置于街段一侧。
地理编码的质量
n地理编码的结果由匹配率或命中率来表达。
n对犯罪制图和分析而言,有研究者声称60%命中率不可接受,而另一研究者由统计得出最低可接受的命中率为85%。
n因为定位服务竞争的要求,为使匹配率达到95%或更好, 需要当前的和准确的参考数据库和验证街道地址的额外努力。
n除了匹配率,定位准确度也被用于评估地理编码质量。