新聞中心
但由于公司的多名員工處理、操作和使用聯(lián)系人數(shù)據(jù)集,很快會(huì)出現(xiàn)諸多不一致和不準(zhǔn)確的地方。然后,需要公司的IT人員構(gòu)建內(nèi)部解決方案,神奇地消除數(shù)據(jù)庫中存在的所有錯(cuò)誤。

從頭開始編寫每個(gè)解決方案
雖然可以編寫用于清理和規(guī)范數(shù)據(jù)集的代碼,但考慮到實(shí)施所需的資源量(時(shí)間、人員和資金),這絕對(duì)是一種低效的解決方案。算上年度維護(hù)和升級(jí)成本后,它比采用現(xiàn)有解決方案的成本高出兩三倍。
這讓我想起了一位程序員朋友最近告訴我的話:在每個(gè)開發(fā)人員一生中的某個(gè)時(shí)刻,他們意識(shí)到手工編寫每個(gè)解決方案多么低效。有時(shí),改寫市面上現(xiàn)有的解決方案(開源庫或商業(yè)產(chǎn)品)比從頭開始編寫解決方案更有效。
我在該博文中解釋一些常見的術(shù)語和步驟,以清理和驗(yàn)證客戶數(shù)據(jù)庫中的地址。這肯定會(huì)幫助您了解在選擇市面上現(xiàn)有的解決方案時(shí)要尋找什么。
涉及的常用術(shù)語
在我們?cè)敿?xì)介紹該過程之前,先了解該領(lǐng)域使用的一些常用術(shù)語及其含義。
- 地址標(biāo)準(zhǔn)化
地址標(biāo)準(zhǔn)化(又叫地址規(guī)范)是根據(jù)權(quán)威標(biāo)準(zhǔn)(比如美國(guó)的USPS地址標(biāo)準(zhǔn))更新地址的格式。
這個(gè)過程確保地址以可接受的格式存在——包括正確的拼寫、縮寫、地理編碼以及附以ZIP+4值。
- 地址驗(yàn)證
地址驗(yàn)證是針對(duì)權(quán)威數(shù)據(jù)庫(比如美國(guó)的USPS)運(yùn)行標(biāo)準(zhǔn)化地址的過程,并確保這些地址是真實(shí)有效的——這意味著它們是國(guó)內(nèi)可郵寄的有效地點(diǎn)。
兩者之間的區(qū)別
有時(shí)這兩個(gè)術(shù)語可以互換使用,但兩者之間存在差異。地址應(yīng)先標(biāo)準(zhǔn)化,以遵循可接受的格式。一旦完成標(biāo)準(zhǔn)化,它們現(xiàn)在可以進(jìn)行驗(yàn)證,以核查這些地址是否真實(shí)有效。
標(biāo)準(zhǔn)化和驗(yàn)證地址的過程
這個(gè)過程涉及以下步驟:
1. 分析地址
在針對(duì)地址數(shù)據(jù)庫執(zhí)行任何活動(dòng)之前,評(píng)估當(dāng)前狀態(tài)很重要。
這時(shí)候地址分析非常有用。它識(shí)別含有不完整或缺失地址信息的記錄,以及不遵循標(biāo)準(zhǔn)化模式的記錄。
地址分析突出顯示了數(shù)據(jù)集可能存在的清理和標(biāo)準(zhǔn)化機(jī)會(huì)。此外,該配置文件報(bào)告通常在流程結(jié)束時(shí)再次生成,以便比較初始報(bào)告和結(jié)束報(bào)告,以查看數(shù)據(jù)集是否仍存在錯(cuò)誤。
2. 解析地址
USPS地址標(biāo)準(zhǔn)化始于將每個(gè)地址解析成子組件。這很重要,因?yàn)榈刂反蠖嘧鳛閿?shù)據(jù)集中的單個(gè)字段來予以存儲(chǔ)。針對(duì)整個(gè)字段運(yùn)行驗(yàn)證檢查不如針對(duì)子部分運(yùn)行檢查來得準(zhǔn)確。因此,通常將單個(gè)地址解析成街道號(hào)碼、街道名稱、郵政編碼、城市、州和國(guó)家。
3. 地理編碼
在這個(gè)步驟中,為所有地址計(jì)算緯度和經(jīng)度地理編碼。除此之外,根據(jù)計(jì)算出的地理編碼,您還可以找出5位數(shù)的郵政編碼和4位數(shù)的送貨區(qū)域路線。
4. 重構(gòu)地址
一旦所有這些信息被計(jì)算和標(biāo)準(zhǔn)化,現(xiàn)在不是以所需的格式重新格式化和重建地址的時(shí)候。這步完成后可以保存在數(shù)據(jù)庫中,或者如果需要,可以隨時(shí)隨地實(shí)時(shí)計(jì)算。
這種格式的一個(gè)例子是USPS地址標(biāo)準(zhǔn),該標(biāo)準(zhǔn)要求送貨地址有三行——第一行含有收件人姓名,第二行含有街道地址,第三行含有城市、州和郵政編碼。
5. 驗(yàn)證地址
當(dāng)?shù)刂酚兴斜匾M件時(shí),您現(xiàn)在可以對(duì)照任何權(quán)威數(shù)據(jù)庫驗(yàn)證其有效性,以查明該地址是不是真實(shí)的、可郵寄的位置。
除了驗(yàn)證外,這類數(shù)據(jù)庫還可以告訴地址類型——住宅或商業(yè),以及其他一些次要細(xì)節(jié)。
結(jié)論
現(xiàn)在你已有了清理和驗(yàn)證地址數(shù)據(jù)的5步無代碼流程。從頭開始實(shí)施這樣的解決方案可能非常具有挑戰(zhàn)性,可能需要數(shù)年時(shí)間才能提高結(jié)果的準(zhǔn)確性。
如今業(yè)界有許多地址驗(yàn)證工具,包括一些經(jīng)過CASS認(rèn)證的工具,這是USPS分配給提供準(zhǔn)確地址標(biāo)準(zhǔn)化和驗(yàn)證服務(wù)的軟件供應(yīng)商的認(rèn)證頭銜。
這類工具絕對(duì)可以提高您團(tuán)隊(duì)的運(yùn)營(yíng)效率,并使他們能夠通過使用正確、準(zhǔn)確的位置信息,為客戶設(shè)計(jì)卓越的體驗(yàn)。
原文標(biāo)題:??How to Clean and Verify Address Data 'Without Using Code'??,作者:Data Ladder
網(wǎng)頁題目:如何不使用代碼就能清理和驗(yàn)證地址數(shù)據(jù)?
URL地址:http://m.fisionsoft.com.cn/article/cdcsccs.html


咨詢
建站咨詢
