關于土地信息系統(tǒng)建立過程中的數(shù)據質量問題的探討論文
關于土地信息系統(tǒng)建立過程中的數(shù)據質量問題的探討論文
土地信息系統(tǒng)能系統(tǒng)地獲取一個區(qū)域內所有與土地有關的重要特征數(shù)據,并作為法律、管理和經濟的基礎。也就是說,土地信息系統(tǒng)就是把土地資源各要素的特性、權屬及其空間分布等數(shù)據信息,存儲在計算機中,在計算機軟、硬件支持下,實現(xiàn)土地信息的采集、修改、更新、刪除、統(tǒng)計、評價、分析研究、預測和其他應用的技術系統(tǒng)。以下學習啦小編今天要與大家分享的:關于土地信息系統(tǒng)建立過程中的數(shù)據質量問題的探討相關論文。內容僅供參考,歡迎閱讀!
關于土地信息系統(tǒng)建立過程中的數(shù)據質量問題的探討全文如下:
摘要:數(shù)據對土地信息系統(tǒng)(LIS)來說是至關重要的,數(shù)據質量的好壞是土地信息系統(tǒng)建設成敗的關鍵。本文將對土地信息系統(tǒng)建立過程中有關數(shù)據質量問題進行探討。
關鍵詞:土地信息系統(tǒng)、數(shù)據質量、誤差、分辨率、坐標變換、矢量數(shù)據、柵格數(shù)據、拓撲
一、前言
土地是人類的寶貴財富,是人類社會進行物質生產所必需的基本條件和自然基礎。如何科學、合理地利用有限的土地資源,如何及時了解與掌握土地利用變化數(shù)量和空間特點,對于保持耕地總量動態(tài)平衡和土地持續(xù)利用具有十分重要的意義。
隨著社會經濟的日趨多樣化,土地部門的業(yè)務工作及范圍也在不斷擴大,原有的靠手工操作,圖紙管理的模式已經越來越不能滿足高效率的需求。為強化土地管理,滿足社會對土地資源信息更多、更細、更完善的服務要求,各土地管理部門紛紛加入信息化、數(shù)字化的改革大潮。特別是在市場經濟條件下,因土地管理部門工作的嚴肅性、準確性、科學性和規(guī)范化要求,管理中任何規(guī)定的確定和變更都需要完成大量的信息收集、分析、綜合、決策和評估等工作,土地管理也只有強有力的信息技術(IT)的支持下,才能做到真正的科學決策和管理。
土地信息系統(tǒng)(LIS)是地理信息系統(tǒng)的一個分支,是一種基于宗地[以宗地(地塊)為單位]的計算機管理信息系統(tǒng)。是一種利用計算機技術及其屬性數(shù)據進行采集、處理、管理、查詢、分析、應用和維護更新的空間信息系統(tǒng),是土地管理的現(xiàn)代化工具,是土地規(guī)劃和管理定量化、科學化的方法、手段。但是,在土地信息系統(tǒng)的建設過程中,還存在許多問題,給土地信息系統(tǒng)的建設及發(fā)揮帶來一定困難。這里僅對土地信息系統(tǒng)建設中的數(shù)據質量問題進行探討。
二、對LIS數(shù)據質量的認識
數(shù)據是一種未經加工的原始資料,是客觀對象的表示,它可以是數(shù)字、文字、符號、圖像,數(shù)據是信息的具體表達形式。一個LIS系統(tǒng)包括空間數(shù)據、屬性數(shù)據、空間數(shù)據之間的關系以及空間數(shù)據與屬性數(shù)據之間的關聯(lián)。
人們往往以為計算機為基礎的信息系統(tǒng)的數(shù)據質量是可靠的,很少懷疑利用信息系統(tǒng)產生的分析結果在數(shù)據質量方面會有問題,但事實遠非如此。在某些情況下,由于多種原因,計算機分析的結果甚至會比手工分析的誤差更大。這里除軟件、硬件的質量問題,計算方法上的問題,以及分類、編碼、輸入、操作的明顯疏忽外,數(shù)據本身的質量是重要的原因。
眾所周知,數(shù)據是LIS的“血液”,是組成系統(tǒng)的重要元素。數(shù)據質量的好壞是土地信息系統(tǒng)成功與否的關鍵所在;數(shù)據質量的高低優(yōu)劣,都直接影響到土地信息系統(tǒng)的經濟效益和社會效益,決定了系統(tǒng)應用價值的大小;數(shù)據的可靠,質量的好壞將直接影響到整個系統(tǒng)的成敗。系統(tǒng)如果不能提供正確、可靠的信息,這個系統(tǒng)也就失去了存在的價值。
數(shù)據質量的好壞是一個相對概念,并具有一定的針對性。衡量其好壞主要有以下幾個指標:誤差、數(shù)據的準確度、數(shù)據的精度和不確定性[1]。數(shù)據質量是數(shù)據整體性能的綜合體現(xiàn)。
統(tǒng)而言之,數(shù)據的質量問題主要表現(xiàn)在兩個方面:一是數(shù)據是否及時反映了現(xiàn)實世界;二是數(shù)據是否保持了一致性和完整性。
土地信息系統(tǒng)的數(shù)據量大,數(shù)據來源廣,數(shù)據采集的任務重,在數(shù)據庫建立過程中會出現(xiàn)許多人為和系統(tǒng)的誤差,甚至還有可能產生數(shù)據錯誤,最后采集的數(shù)據無法準確反映規(guī)劃和管理的實際狀況,建立在此數(shù)據庫基礎上的系統(tǒng)往往也就達不到管理自動化輔助決策的目的,而只不過是“看看而已”的一種“擺設”罷了。
數(shù)據庫(包括空間數(shù)據庫和非空間數(shù)據庫)是土地信息系統(tǒng)最基本、最重要的組成部分,也是投資比重最大的部分。數(shù)據質量的好壞,直接影響系統(tǒng)的功能和應用。不僅要根據技術規(guī)程衡量數(shù)據質量,還要從數(shù)據使用角度分析數(shù)據質量問題。數(shù)據質量通常是指數(shù)據的可靠性和精度,它主要用數(shù)據的誤差來度量的?,F(xiàn)就土地信息系統(tǒng)建立過程中的數(shù)據質量問題作進一步的探討。
三、數(shù)據源質量的問題
土地信息系統(tǒng)的數(shù)據源指建庫中所需要的各種數(shù)據類型的來源。它是土地信息系統(tǒng)最基本、最重要的組成部份。土地信息系統(tǒng)的數(shù)據源多種多樣,主要包括有:地圖,地圖是系統(tǒng)最主要的數(shù)據源,因為地圖是地理數(shù)據的傳統(tǒng)描述形式,是具有共同參考坐標系統(tǒng)的點、線、面的二維平面形式的表示,內容豐富,圖上實體間的空間關系直觀,而且實體的類別和屬性可以用各種不同的符號加以識別和表示。土地信息系統(tǒng)其圖形數(shù)據大部分都來自地圖,土地信息系統(tǒng)的屬性數(shù)據主要有地籍圖、宗地圖、土地詳查圖、土地利用現(xiàn)狀圖、行政區(qū)劃圖、專題圖、乃至地形圖等各種圖件的矢量化地圖數(shù)據。二是遙感影像數(shù)據,遙感影像數(shù)據是一個極其重要的信息源。通過遙感影像可以快速、準確地獲得大面積的、綜合的各種專題信息,航天遙感影像還可以取得周期性的資料,這些都為土地信息系統(tǒng)提供了豐富的信息。三是統(tǒng)計數(shù)據,包括土地的分類、面積、權屬、分布及質量、等級狀況、利用狀況、非法占地等統(tǒng)計資料。四是實測數(shù)據,包括GPS點位數(shù)據、地籍測量數(shù)據等。五是數(shù)字數(shù)據,包括數(shù)字圖形數(shù)據和屬性數(shù)據。數(shù)字數(shù)據主要有地籍號、檔案卷宗號、地類號、圖號、手簿號、宗地界址點點號及坐標控制點坐標,宗地面積,面積中誤差、年代、日期等等。屬性數(shù)據包括圖形、圖像以外的各種文字、數(shù)字信息。其中文字信息主要是與宗地檔案,文件檔案組成相關的各種檢索和查詢信息(如:土地權利人姓名或單位各稱、土地座落,文件檔案的標題、發(fā)文機關、公文字號等等),以及土地登記、地籍調查、權屬審核、登記發(fā)證各辦公流程中的各種鍵盤輸入信息。六是各種立法文件和文字檔案,主要有地籍檔案、文件檔案等具有法律效力或需要經常查閱的原始文件材料,它們是土地信息的重要組成部分,在土地的規(guī)劃管理中起著很大的作用。
數(shù)據源質量問題指數(shù)據的采集和錄入中可能產生的誤差,建庫所需的各種類型的數(shù)據的可靠性和精度。
從土地信息系統(tǒng)建立的過程來看,它的主要因素有:各種測量數(shù)據,地圖和遙感數(shù)據等的誤差;調查和統(tǒng)計造成的屬性數(shù)據誤差,以及文檔數(shù)據的錯誤等,數(shù)字化前的預處理、手扶踀自動化的分辨率和矢量化精度。
1、遙感數(shù)據
地理信息系統(tǒng)、遙感和計算機輔助制圖是現(xiàn)代地理學的重要技術手段。遙感作為一種獲取和更新空間數(shù)據的強有力手段,能及時地提供準確、綜合和大范圍進行動態(tài)監(jiān)測的各種資源與環(huán)境的信息,因此遙感數(shù)據是土地信息系統(tǒng)的一個重要數(shù)據源。
所謂遙感(Remote Sensing)就是遙遠感知的意思,也就是不直接接觸目標物和現(xiàn)象,在距離地物幾公里到幾百里、甚至上千里的飛機、飛船、衛(wèi)星上,使用光學或電子儀器接受地面物體或發(fā)射的電磁波信號,并從圖像膠片或數(shù)據磁帶形式記錄下來,傳送到地面,經過信息處理,判讀分析和野外實地驗證,最終服務于有關部門的規(guī)劃決策 [2]。土地管理部門可以運用遙感技術快速獲取現(xiàn)狀空間的信息。
盡管遙感技術有很多好處,但因其自身特性,獲取的遙感數(shù)據可能存在一些誤差。如:不同的高度引起的問題,由于傳感器的結構及穩(wěn)定性產生的問題,對信號進行數(shù)字化產生的誤差。傳感器在航線、航向上出現(xiàn)的誤差,大氣輻射產生的誤差,地形和地貌等因素產生的誤差等等。在遙感資料的獲取時,有些誤差是可以控制的,有些則不可控。因此必須對原始數(shù)據進行預處理,包括利用地面控制對原始數(shù)據進行幾何校正,圖像增強和分類。對獲取的遙感數(shù)據進行光譜校正,特征提取,自動識別分類、自動成圖等處理[3]。
2、測量數(shù)據
各種原始的測量數(shù)據是土地信息系統(tǒng)的主要來源之一。包括宗地的權屬界線、位置、形狀、數(shù)量、面積、各級行政界線、地形圖測量等。由于人和環(huán)境的因素,測量數(shù)據不可避免地受到人為誤差(對中、讀數(shù)、平分等誤差)、儀器、環(huán)境的影響。來源于地面測量的數(shù)字數(shù)據中含有控制測量和碎部測量誤差。其中控制點誤差又受控制網的參考基準、網形和觀測精度以及觀測費用等因素的影響。碎部點誤差除了繼承了控制點的誤差外,還受自身觀測方法,觀測精度和地界的人為判斷,以及地物地貌的取舍等因素的影響。當然原始數(shù)據誤差受觀測儀器、觀測者和外界環(huán)境三種因素影響。除此之外,還有測量數(shù)據的實時性以及數(shù)據老化,采集數(shù)據的密度不合理,或概括取舍不合理,選取測量規(guī)范標準不一致或精度等級不一致造成測量數(shù)據的不一致的影響。
地籍要素是構建土地信息系統(tǒng)極為關鍵的一步,其測量數(shù)據的精度高低決定了系統(tǒng)功能能否得到正確和充分發(fā)揮。
從地籍測量成果的有效性和土地管理的可能性來考慮,為了保證各權屬單元之間的界線清晰,邊界無爭議,并且雙方都能接受而不損害他人和國家的利益,地籍測量要達到一定精度。因此,必須要有相應的數(shù)據采集方法作為保證。地籍要素的采集方法目前主要有兩種,一種是傳統(tǒng)的模擬式外業(yè)測圖方法,另一種是野外全數(shù)字化數(shù)據采集方法。傳統(tǒng)方法的主要作法是在地籍控制測量的基礎上,用解析法測量出權屬界址點坐標,以控制點或以界址點為基礎施測成地籍圖,要形成入庫數(shù)據信息,則要通過對原圖數(shù)字化來實現(xiàn)。用傳統(tǒng)數(shù)據采集方法形成地籍要素數(shù)字信息其誤差影響因素較多,主要誤差來源為:測站點誤差m1,量距誤差m2,在測圖板上描繪方向線誤差為m3,刺點誤差m4,數(shù)字化儀采點誤差m5等。按有關專著論述,一般情況下,m1≈±0.12mm,m2≈±0.2,m3≈±0.1mm,m4≈±0.14mm,這四項誤差為野外采集誤差。數(shù)字化m5的影響因素比較復雜,誤差產生首先與圖形要素有關,要素本身的復雜程度對數(shù)字化精度有顯著影響,數(shù)字化儀本身的精度更應引起重視。正常情況下,用常規(guī)數(shù)字化儀進行數(shù)字化時,精度一般可達到±0.13mm。綜合上述得,地籍要素采集精度m采 為:
m采 =±
=±
=±0.02mm
按1:500比例尺來考慮,實地誤差將達到±10cm,由此可見,按傳統(tǒng)方法施測,則擬入庫的地籍要素信息很難達到規(guī)定的±5cm的精度標準[4]。
采用野外全數(shù)字化方法,界址點野外數(shù)據采集一般采用直接測定坐標法,即將全站儀或測距儀置于測站點上,對界址點上的移動棱鏡進行水平角和距離測定,電子手薄記錄計算。此種方法的主要誤差來源為水平角測角誤差mβ和測距誤差mD,測角中誤差角保守為±5″,測距誤差主要來自移動棱鏡偏離界址點位置誤差,其偏離值按2cm考慮。測距平均邊長取100m,按點位誤差精度估算公式m2= 來計算,則m≈±2cm,即便考慮測站誤差和其他偶然的聯(lián)合影響,點位精度也肯定在規(guī)定范圍內,所以地籍要素信息數(shù)據的野外全數(shù)字化有利于提高界址點精度,從而保證地籍數(shù)據的質量。
3、調查、統(tǒng)計、文檔數(shù)據問題
土地信息系統(tǒng)的建設過程中,涉及大量的調查統(tǒng)計數(shù)據,這些資料尚存在許多不足之處,為土地信息系統(tǒng)的建設帶來了一定困難。
建立土地信息系統(tǒng),必須首先進行土地基本信息的搜集,開展地籍調查工作,核實宗地權屬,掌握土地利用狀況,獲得宗地位置、形狀及其面積的準確數(shù)據,為建庫奠定基礎。
現(xiàn)就地籍調查工作加以探討,眾所周知,權屬調查的工作之一是填寫地籍調查表。由于權屬調查技術性強,工作量大,參與人員多且水平不同等原因,填寫后的地籍調查表或多或少會出現(xiàn)下面一些問題。在填土地使用者名稱時,單位本應填寫全稱,可出現(xiàn)了類似這樣的情況:某林業(yè)局有3宗地,而在3份地籍調查表上出現(xiàn)了xx林業(yè)局、縣林業(yè)局、林業(yè)局等名稱。按這樣的名稱錄入建立信息系統(tǒng),將導致不能正確地自動的歸戶。在填寫土地使用者性質時,本應該寫“全民”或“集體”或“個體”或“個人”,而出現(xiàn)了“國營”或“國有”或“私營”這樣的名詞。在填寫宗地四至時應說明權屬界線所經地物名稱及歸屬、位置、與誰接壤。但出現(xiàn)了東(南、西、北)至xx,而未填出接xx。且有的四至填寫錯誤,如兩宗地共用一堵墻時,則只能出現(xiàn)兩宗都至墻中,或一宗至墻內另一宗至墻外,但填出了兩宗都至墻外或墻內等情況。在填寫界址標示處的界址線位置時也有類似錯誤,有的表填寫字跡潦草,或使用簡化字,讓人難以辨認。有的內容還可以猜出,但戶主的姓名、調查員、勘丈員的簽名等內容實在難辯;有的表中該填的內容而未填,任意涂改。
共用宗的處理,一個地塊被幾個權屬單位共同使用,而其間又難以劃清權屬界線,這樣的地塊稱為共用宗[5]。不少縣(市)是這樣處理的:有多少土地使用者就填多少份地籍調查表,表上的內容按各分宗填寫。這樣做的好處是所填的內容詳細,調查表和土地登記申請書、審批表形成一一對應的關系。但其弊端也是顯而易見的,其一較大地增大了填表的工作量,其二增大了復雜程度,在填寫四至時,如遇一個土地使用者使用幾個地塊則不得不寫清幾個地塊的四至;為填清界址指標,又得設置內部界址點,增加了宗地草圖和地籍圖的負荷量,填表時如不小心還會造成表與表之間的相互矛盾。為了和地調表統(tǒng)一,有的在形成宗地界址點成果表時,除了有宗地界址點成果表外,還有分宗的界址點成果表。如果內部界址點是在紙圖上圖解的,則將該宗地的宗地界址點和內部界址點和計算機展點后,會出現(xiàn)界址線混亂的情況。在土地信息系統(tǒng)建庫時,這些內部點是不能當界址點錄入進庫的。如進庫則在面積統(tǒng)計時,這種內部界址點所圍成的區(qū)域的面積就被多統(tǒng)計了一次。
建立完備的信息系統(tǒng),必須具備這樣的條件:大比例的地形圖或地籍圖;野外測量的界址點數(shù)據;宗地的屬性數(shù)據(土地登記申請書、地籍調查表、審批表等)。全省在進行大大規(guī)模的城鎮(zhèn)地籍時,由于受當時的條件限制,自動化程度低,各作業(yè)單位作業(yè)水平的不同,或多或少出現(xiàn)一些問題。在建庫時所發(fā)現(xiàn)的問題主要是界址點的坐標成果與地籍上的位置不吻合;相鄰宗的同一界址點坐標不同;界址邊長、宗地面積計算有誤。某些縣(市)為了進行土地登記,由于多方面的原因,在進行初始地籍調查時,只作權屬調查,不作規(guī)范的地籍測量。為了計算面積,用皮尺或鋼尺丈量界址邊長及相關尺寸,用幾何圖形法計算出宗地面積,而不測址點坐標和地籍圖。這樣做不利于信息化的管理。
4、圖形數(shù)字化
影響數(shù)據質量的因素是多方面的,有相當一部分來自于建庫過程中的數(shù)字化過程。建庫過程中的數(shù)據質量,包括數(shù)字化前的預處理,紙張變形、手扶跟蹤數(shù)字化精度或掃描數(shù)字化的分辨率和矢量化精度。
(1)數(shù)字化前的預處理
用于數(shù)字化作業(yè)的地形圖(工作底圖)一般采用聚酯薄膜圖,其變形一般小于0.2‰。采用紙質圖紙時,圖紙的尺寸隨濕度和溫度的變化而變化,溫度不變的情況下,溫度由0%增至25%,則紙的尺寸可能改變1.6%[6]。因為紙的膨脹率和收縮率不相同,即使溫度回到原來的大小,圖紙也不能恢復原來的尺寸。因此在數(shù)字化時要適當?shù)谋壤蜃?,通過仿射變換進行幾何糾正,以減小工作底圖變形產生的位置誤差,達到相應的精度。
對不同種類和比例的工作底圖進行數(shù)字化時,應注意它的投影方式是否一致,比例是否匹配。對于不同投影方式應在數(shù)字化后及時變換為系統(tǒng)要求的投影方式。對于不同比例應將比例尺和精度記錄到元數(shù)據中,以便估記由此可能產生的誤差。
(2)跟蹤數(shù)字化
手扶跟蹤數(shù)字是一種自動化精度較低的數(shù)字化方式,其數(shù)字化精度也因操作員及其工作的疲勞程度而異,操作員的勞動強度較高。隨著大幅面掃描儀的成本不斷降低,掃描和矢量化技術不斷完善,這種數(shù)字化方式可能成為自動掃描數(shù)字化的一種補充。
手扶數(shù)字化是從地形圖輸入空間數(shù)據的最廣泛采用的輸入方法。把地形圖放置于數(shù)字化桌上,用手持設備,跟蹤每一個地圖特征、數(shù)字化設備精確量測鼠標的位置,產生數(shù)據形式的坐標數(shù)據。
影響跟蹤數(shù)字化數(shù)據質量的因素很多;主要有:數(shù)字化底圖中地理要素的寬度、密度和復雜程度對數(shù)字化結果的質量有著顯著影響。數(shù)字化儀的分辨率和精度對數(shù)字化數(shù)據質量有著直接的決定性的影響?!兜匦螆D數(shù)字化規(guī)范》規(guī)定,數(shù)字化儀的分辨率不能小于每厘米394線(約1000dpi),精度不低于0.127mm(0.005英寸)。常見數(shù)字化儀在分辨率方面通常能滿足要求,而在精度方面卻有相當一部分不能達到要求。在選擇數(shù)字化儀時要特別注意其精度指標,以滿足LIS工程的需要。數(shù)字化操作員的技能與經驗不同而引入的人為因素誤差是不同的,由于操作員視力、操作習慣,熟練程度和疲勞程度的不同,最佳采樣點位值判斷,十字絲與目標點重合程度的判斷會有一定程度的差異,影響數(shù)字化的質量。操作方式(如曲線采點方式和采點數(shù)目)也會影響數(shù)字化數(shù)據的質量。
假定各種誤差影響符合誤差傳播規(guī)律,手扶跟蹤數(shù)字化的綜合精度應按下式求得:[7]
m數(shù)=±
其中:m數(shù) 表示手扶跟蹤數(shù)字化的綜合精度;m定 表示工作底圖定向誤差,m儀 表示數(shù)字化儀精度,m人 表示人為因素誤差。
(3)、掃描數(shù)字化
掃描數(shù)字化用高精度掃描儀將圖像等掃描并形成柵格數(shù)據文件進行處理,將之轉化矢量圖形數(shù)據。規(guī)范規(guī)定:圖形定位控制點掃描誤差不大于0.1mm,相對于工作底圖,矢量化后的掃描點誤差不大于0.15mm,線劃誤差不大于0.2mm。影響掃描數(shù)字化質量的因素除原圖質量外,還包括:掃描精度、定向精度、矢量化精度損失等。
①掃描儀的分辨率和精度
掃描儀的分辨率和精度對掃描數(shù)字化質量的影響是至關重要的。因此,要根據具體情況選擇適當?shù)膾呙鑳x。目前,大幅面掃描儀大致有,滾筒式(drum),平板式(flatebed),直進式(direct feed)3種。這些掃描儀能夠輸出一種或多種形式柵格數(shù)據文件(二值、灰度和彩色)。
滾筒式掃描儀精度較高價格較貴,能以較高的分辨率掃描AO或更大的圖紙。
平板式掃描儀與滾筒式一樣精度高、價格貴、分辨率很高,但一般幅面不會超過A1幅面。由于平板式掃描儀幅面小,掃描后多需進行拼接,從而增加了工作難度,引入了更多的誤差源。LIS工程一般不選用這種掃描儀。
直接式掃描儀精度較低,價格也較便宜。通常能夠滿足一般LIS工程的需要。
目前,需要的大幅面掃描儀品牌有:CONTEX、VIDER、ANATECH等。
在選擇掃描儀時,應注意其是否采用硬件消藍。光學分辨率代表了掃描儀的分辨率能力,而經銷商往往只是給出插值分辨。同時,應注意掃描儀的歪斜失真,歪斜失真的大小與掃描儀的走紙方式有關。
?、跂鸥駭?shù)據矢量化的精度損失
在土地信息系統(tǒng)中,柵格數(shù)據與矢量數(shù)據各具特點與適用性,為了在一個系統(tǒng)中可以兼容這兩種數(shù)據,以便有利于進一步分析處理,常常需要實現(xiàn)兩種結構的轉換。
柵格的矢量轉換處理的目的,是為了將柵格數(shù)據分析的結果,通過矢量繪圖裝置輸出,或者為了數(shù)據壓縮的需要,將大量的面狀柵格數(shù)據轉換為由少量數(shù)據表示的多邊形邊界,但是主要目的是為了能將自動掃描儀獲取的柵格數(shù)據加入矢量形式的數(shù)據庫。
在柵格數(shù)據矢量的過程中的細化、跟蹤等均可能引入一些誤差。復雜圖形全自動化矢量化效果極差,會產生眾多的交叉線,導致多邊形跟蹤錯誤。對此,應采用交互式矢量化方法。因此在選擇矢量化軟件時不應僅僅關心自動化程度(全自動矢量化軟件價格往往很高)。還要特別注意是否具有以下功能:智能去斑,裁剪,扭曲較正,比例控制,水平校正,光柵編輯和交互式矢量化等。
?、蹝呙钄?shù)字化方法誤差
掃描數(shù)字化的幾何分辨率是掃描數(shù)字化方法誤差中最重要的誤差源,減小這種誤差的唯一方法就是提高掃描儀的幾何分辨率。但是,隨著分辨率的提高,柵格數(shù)據量以平方級速度增長。這往往造成計算機存儲資源耗盡,數(shù)據處理時間平方級延長。以300dpi(約每mm12個點)的分辨率掃描時,獨立點間距離的相對精度為1.4/1000左右。全自動矢量化細化過程所產生的點位誤差為1~2個像素點,而交互跟蹤矢量化最大點位誤差可以控制在一個像素點。按300dpi計,每個像素點相當于圖上0.01mm。掃描數(shù)字化綜合精度可按下式計算:
M掃=±
其中:M掃 表示掃描數(shù)字化的綜合精度;M定 表示底圖定向誤差;M儀 表示掃描儀精度;M矢 表示矢量化誤差。這里,M定取±0.12mm,按300dpi計算M儀取±0.09mm,M矢取±0.1mm。則M掃=±0.180[8]。
四、數(shù)據處理質量
土地信息系統(tǒng)的數(shù)據庫建立后,其中已經包含了數(shù)據源和數(shù)據庫建庫所引入的誤差。數(shù)據庫中的多源數(shù)據,經過系統(tǒng)的各種分析處理后,在形成新的數(shù)據和最后產品的過程中還會產生新的數(shù)據質量問題。這些問題包括:幾何改正,坐標變換和比例變換,幾何數(shù)據的編輯、屬性數(shù)據的編輯、空間分析,數(shù)據格式的轉換等。
1、空間分析
空間分析是對分析空間數(shù)據的技術的通稱。從客觀上區(qū)分,可歸納為:空間的圖形數(shù)據的拓撲運算;非空間屬性數(shù)據的運算;空間和非空間屬性的聯(lián)合運算等[9]??臻g分析賴以進行的基礎是空間數(shù)據庫,土地信息系統(tǒng)的空間數(shù)據分析,是實現(xiàn)土地資源信息系統(tǒng)的實際運用的重點途徑。
空間分析中的疊加分析是土地信息系統(tǒng)中十分常用的一種分析方法,是用戶經常用以提取數(shù)據的手段之一。通過同一地區(qū)不同內容的多幅地圖的疊加組合,產生新的圖形和屬性信息。在這個過程中往往產生拓撲匹配、位置和屬性方面的數(shù)據質量問題。由于疊加時多邊形的邊界可能不完全重合,從而產生若干無意義多邊形。對這些無意義多邊形進行處理的結果往往會改變界線的位置,疊加后形成的新的多邊形的屬性值也可能存在由于屬性組合帶來的誤差。
2、坐標變換
土地信息系統(tǒng)數(shù)據來源較多,各種數(shù)據輸入信息系統(tǒng)應便于系統(tǒng)對數(shù)據進行圖形顯示,疊加查詢,統(tǒng)計分析處理。LIS要實現(xiàn)這些功能,一個首要和基本的前提就是各種不同來源的數(shù)據在系統(tǒng)內必須在一致的地形圖坐標系下。但是,在實際的數(shù)據采集過程中,大量的數(shù)據坐標并不一定屬于系統(tǒng)用戶所要求的坐標系,原始數(shù)據為一種坐標系,系統(tǒng)要求的數(shù)據為另一種地圖坐標系,有的數(shù)據坐標根本沒有地理意義,對此情況,必須提供從一種地圖坐標系到另一中坐標系的坐標變換。
在具體的操作過程中,有可能產生新的誤差。在不同比例尺下對坐標數(shù)據的重新設立產生誤差,進行投影變換和/或基準面變換時產生的誤差。生產實踐中為提高數(shù)據質量,確保系統(tǒng)的數(shù)據精度和可靠性,通常用仿射變換和相似變換等模型來進行數(shù)據處理,以減小或消除誤差。
坐標變換的實質是建立兩個平面點之間的一一對應關系,現(xiàn)有一般GIS(LIS是GIS的專題)軟件大都提供了以下兩種模型實現(xiàn)坐標變換。
一是仿射變換:仿射變換也稱六參數(shù)變換,其變換公式為:[10]
x´=Ax+By+C (Ⅰ)
y´=Dx+Ey+F (Ⅱ)
其中,x´、y´為地圖輸出坐標系中的坐標點對;x、y為輸入坐標中的坐標點時;A,B,C,D,E,F為方程參數(shù)。參數(shù)在坐標系空間上的幾何意義為:A和A分別確定點(x,y)在輸出坐標中x方面和y方向上的縮放尺度。B和D確定旋轉角度,C和F分別確定在x方向和y方向上的水平移尺寸。
二是相似變換:當式(Ⅰ)、(Ⅱ)中的參數(shù)滿足條件A=E=Scos@,B=-D=Ssin@時,則得到四參數(shù)的相似變換公式:
x´=Ax+By+B (Ⅲ)
y´=-Bx+Ay+D (Ⅳ)
式中,x´、y´為輸出地圖坐標系中的坐標點對;x、y為輸入地圖坐標中的坐標點對;A、B、C、D為方程參數(shù),相似變換實質上也是坐標系間的平移,旋轉和縮放尺度的變換,式中C和D分別為坐標在x軸和y軸上的平移大小, 為縮放比例,@=arctg(B/A)為旋轉角度。
為了求出以上公式中的參數(shù),建立兩種坐標之間的仿射(或相似)轉換關系,至少需要三個(或兩個)已知的控制點坐標。而實際上,應選擇多于三個(或兩個)控制點,方能按照最小二乘法原理進行平差,得出系數(shù)值,代入上述方程即建立輸入和輸出坐標系之間的仿射(或相似)變換數(shù)學模型。
可以看出,仿射變換和相似變換都為線性函數(shù)變換模型,可實現(xiàn)對原圖形的平移、旋轉和縮放,相比較而言,相似變換不能進行x軸、y軸不均勻縮放的變換,而仿射變換能保證更高的數(shù)據精度。
3、數(shù)據變換
(1)CAD向GIS的轉換
目前我國土地管理中存在一個較為普遍的問題是土地信息系統(tǒng)的構建與圖形數(shù)據采集較少作用一個整體來通盤考慮,地籍測繪大大超前于信息管理系統(tǒng)構建。中小城市這種問題表現(xiàn)得更為突出。為滿足土地確權發(fā)證,土地定級估價等需要,1995年前測繪的地籍圖等圖件因受技術條件的限制絕大部分是采用傳統(tǒng)白紙測圖方法完成的。隨著計算機技術的發(fā)展和在測繪工作中的普及應用,1995年之后數(shù)字地圖逐漸取代傳統(tǒng)測繪。但一個不容忽視的事實是,絕大多數(shù)測繪圖軟件是在AUTOCAD上進行二次開發(fā)完成的。有些甚至是采用低版本的CAD,有些測繪圖軟件雖然測的是數(shù)字圖,但只有非編碼的圖形文件,不保留信息,或者圖形編輯以后,返不成信息。這種數(shù)字圖說到底僅僅是從傳統(tǒng)的白紙圖過渡到計算機驅動繪制的白紙圖。本質上與傳統(tǒng)測繪沒有什么區(qū)別。有些雖然采用了較高版本的CAD基礎軟件二次開發(fā)成數(shù)字測圖軟件并采用了數(shù)字編碼技術,但由于較少考慮CAD與GIS的數(shù)據共享問題(土地信息系統(tǒng)屬于專題GIS)。在著手考慮構建土地信息系統(tǒng)時,遇到的突出問題則是如何充分,有效利用已有數(shù)字信息資料,并確保數(shù)據轉換質量。
對于傳統(tǒng)模擬圖或難以返成信息的所謂數(shù)字圖只能采用原圖數(shù)字化,形成數(shù)字信息后方可加以利用,但其精度丟失是不可避免的。
對于采用了編碼技術,也能返成信息的數(shù)字圖,其數(shù)字信息可以通過數(shù)據轉換來實現(xiàn)數(shù)據共享,但由于 CAD與GIS圖形數(shù)據之間其數(shù)據格式,數(shù)據內容甚至數(shù)據概念都有很大差異,數(shù)據轉換時應注意以下三個方面:[11]①數(shù)據格式轉換。不同的軟件有不同的數(shù)據格式,有些可以通過通用數(shù)據格式如DXF實現(xiàn)轉換,但轉換過程中的數(shù)據丟失也的確令人煩惱。②數(shù)據元素轉換。CAD與GIS兩者之間的圖形元素不是一一對應關系,CAD圖形中的圖形元素種類要比GIS圖形文件中的圖形元素種類多,GIS中只有點、線、面三類基本圖形元素,而CAD中包括有點、線、面、注記、矩形等多種圖形元素,在具體轉換中,CAD的圖形元素哪些轉換成GIS的點,哪些元素轉換面面,什么元素需要轉換成GIS的屬性數(shù)據,什么元素則不需要轉換到GIS中去等。CAD與GIS圖形元素之間的對應關系,都需要認真細致地加以技術處理,使空間數(shù)據和屬性數(shù)據在輸入系統(tǒng)后正確地連接起來。③拓撲關系的形成。因為CAD的圖形元素之間沒有拓撲關系,實現(xiàn)CAD向GIS數(shù)據轉換的一個重要內容就是要將轉換后的圖形數(shù)據按照一定的技術要求經過編輯,在GIS環(huán)境下建立幾何元素的拓撲關系。
在實際轉換中,還會出現(xiàn)許多意想不到的技術問題,會影響數(shù)據轉換質量,有待進一步解決。
(2)矢量數(shù)據結構向柵格數(shù)據結構的轉換
土地信息系統(tǒng)的建設中,許多數(shù)據如行政邊界,交通干線,土地利用類型、土壤類型等都是用矢量數(shù)字化的方法輸入計算機或以矢量的方式存在計算機中,表現(xiàn)為點、線、多邊形數(shù)據。然而,矢量數(shù)據直接用于多種數(shù)據的復合分析等處理將比較復雜,特別是不同數(shù)據要在位置上一一配準,尋找交點并進行分析。相比之下利用柵格數(shù)據模式進行處理則容易得多。加之土地覆蓋的疊置復合分析更需要把其從矢量數(shù)據的形式轉變?yōu)闁鸥駭?shù)據的形式。
矢量數(shù)據的基本坐標是直角坐標(x,y),其坐標原點一般取圖的左下角。網格數(shù)據的基本坐標是行和列(i,j),其坐標原點一般取圖的左上角。兩種數(shù)據變換時,令直角坐標x和y分別與行與列平行。由于矢量數(shù)據的基本要素是點、線、面,因而只要實現(xiàn)點、線、面的轉換,各種線劃圖形的變換問題基本上都可以解決[12]。
矢量數(shù)據變成柵格數(shù)據的原理與方法并不困難,但由于矢量數(shù)據的記錄方式各不相同,也會產生一些問題。如多邊形之間公共邊原來只有一條交界線,轉變成網格后成為有一定寬度的界線,產生了一定的近似性。特別是幾條線交叉處,一個網格元素中包括了相鄰的幾種類別,轉換時只能用其中的一種類別作為交叉點所在的元素的類別,這種誤差應在允許的范圍以內。而減小網格尺寸,雖提高了精度,但大大提高了數(shù)據的冗余量。
柵格數(shù)據結構需要大量的計算機內存來存貯和處理數(shù)據,才能達到與矢量數(shù)據結構相同的空間分辨率,而矢量結構在某些特定形式的處理中,如象多邊形疊置,空間均值處理等尚有大量的技術問題來解決。值得注意的是,無論采用哪種轉換方法,轉換的結果都會不同程度地引起原始信息的損失。
4、空間數(shù)據的編輯
通過矢量數(shù)字化或掃描數(shù)字化所獲取的原始空間數(shù)據,都不能避免地存在錯誤或誤差。屬性數(shù)據在建庫時,也難免會存在錯誤。諸如:空間數(shù)據的不完整或重復,空間點、線、面數(shù)據的丟失或重復,區(qū)域中心點的遺漏,柵格數(shù)據矢量化時引起的斷線等,空間數(shù)據位置的不準確、線段過長或過短,線段的斷裂、相鄰多邊形結點的不重合及空間數(shù)據的變形等。因此,必須對圖形數(shù)據和屬性數(shù)據進行一定的編輯。
土地信息系統(tǒng)數(shù)據編輯是消耗時間的交互處理工作,對空間數(shù)據不完整或位置的誤差,主要是利用LIS圖形編輯功能,如刪除(目標、屬性、坐標),修改(平移、拷貝、連接、分裂、合并、裝飾)、插入等進行處理。對空間數(shù)據比例尺的不準確和變形,可以通過比例尺變換和糾正來處理。
在數(shù)據的編輯過程中,由可能產生一些新的問題。如:線段的相關與延伸出現(xiàn)的問題,圖形的平移與旋轉出現(xiàn)的問題,刪除“細部多邊形”時產生的誤差,數(shù)值計算與變化的誤差;文件的合并以及形成新文件的問題;屬性數(shù)據的重新定義和更新的問題。有的問題時可能避免的,有的問題則無法避免。因此,必須進行檢核。通過耐心細致的檢查,主要誤差都能從數(shù)據中尋找出來,并有效消除誤差。一般采用疊合比較法,目視檢查法和邏輯法。
疊合比較法是空間數(shù)字化正確與否的最佳檢核方法,按與原圖相同的比例尺把數(shù)字化的內容繪在透明材料上,此后與原圖疊合在一起,在透光桌上仔細的觀察和比較。一般。對于空間數(shù)據的比例尺不準確和空間數(shù)據的變形馬上就可以觀察出來,對于空間數(shù)據的位置不完整和不準確則須把遺漏、位置錯誤的地方明顯地標注出來。目視檢查指在屏幕上用目視檢查的方法,檢查一些明顯的數(shù)字化誤差與錯誤,包括線段過長或過短,多邊形的重疊和裂口、線段的斷裂等。
5、由計算機引起的問題
在計算機中,數(shù)據是由一定字長的編輯數(shù)碼表示的,由計算機字長可能引起一種誤差。這種誤差出現(xiàn)在各種數(shù)值運算和模型分析中,由這種誤差引起的問題很多[13],例如LIS空間數(shù)據庫中整數(shù)編碼對面積和周長計算的影響,比例尺變換和旋轉變換對拓撲關系的影響等。削弱誤差影響的主要方法有:改變數(shù)據在計算機中的表示方式,采用合適的算法等。
除了數(shù)據處理精度外,數(shù)據存儲精度也與計算機字長有關。16位的計算機在存儲低分辨率的柵格圖像時不會出現(xiàn)問題,但存儲高精度的控制點坐標或點位精度要求高的地理數(shù)據時,則不能勝任。
五、數(shù)據應用質量
土地信息數(shù)據在使用過程中往往出現(xiàn)一些質量問題,這些問題包括數(shù)據的完備程度,時間的有效性,拓撲關系的正確等。
1、數(shù)據的完備程度
數(shù)據的完備程度指地理數(shù)據在范圍、內容、及結構方面滿足所有要求的完整程度。包括數(shù)據范圍、空間實體類型、空間關系分類、屬性特征分類等方面的完整性。
一般來說,空間范圍越大,數(shù)據的完整性就越差。在土地信息系統(tǒng)的建庫過程中,數(shù)據不完整最簡單的例子是缺少數(shù)據。如計算機從GPS接收機傳輸位置數(shù)據時,由于軟件受干擾或其它因素的緣故,只記錄下經度而丟失緯度,以至造成數(shù)據不完整。另外由于GPS接收機無法收到四顆或更多的衛(wèi)星信號而無法計算高程數(shù)據也會造成數(shù)據的不完整。又如某個應用項目需要1:5000的基礎底圖,但現(xiàn)在的地圖數(shù)據只覆蓋項目區(qū)的一部分,底圖數(shù)據便不完整。
在土地信息系統(tǒng)底建庫中,涉及大量的地籍檔案。地籍檔案來源于土管機關的地籍部門,數(shù)量大、形式多、浩繁、零亂,隨著時間地推移,以及人為和自然的各種因素地影響,有可能遭到損壞。如檔案老化,書寫材料低劣、地籍檔案變到污染,變色、蟲蛀等現(xiàn)象,進而影響到整個系統(tǒng)的質量。
2、數(shù)據的現(xiàn)勢性
數(shù)據的現(xiàn)勢指數(shù)據反映客觀現(xiàn)象目前狀況的程度。數(shù)據的現(xiàn)勢差,反映的客觀現(xiàn)象就可能不準確。不同現(xiàn)象的變化頻率是不同的。如地形的變化一般來說比人類建設要緩慢,地形可能會由于山崩、雪崩、泥石流、人工挖掘及填海等原因而在局部區(qū)域改變。但由于地圖制作周期較長,局部的變化往往不能及時地反映在地形圖上,對那些變化較快的地區(qū),地形圖就失去了現(xiàn)勢性。城市地區(qū)土地覆蓋變化較快,這類地區(qū)土地覆蓋圖的現(xiàn)勢性就比發(fā)展較慢的農村地區(qū)會差些。地形圖上記錄著所用航空像片獲得的年代。若又用其他數(shù)據進行過修改(一般是較新的航空像片),也應記錄于上。
在土地信息系統(tǒng)建庫中,要求地籍信息和地籍圖必須具有現(xiàn)勢性。地籍信息變更比較頻繁,如土地利用類型,權屬或宗地的重劃,合并等。由于受自然因素和人為作用的影響,土地資源的數(shù)量、質量、分布和使用情況都處在經常變化之中?;谶@一特點,土地管理部門提供的數(shù)據很難保證現(xiàn)勢性,這也是影響數(shù)據質量的一個重要方面。
3、拓撲關系
在LIS中,為了真實地反映地理實體,不僅要包括實體的位置、形狀、大小和屬性,還包括必須反映實體之間的相互關系,這些關系就是指它們之間的鄰接關系,關聯(lián)關系和包含關系,拓撲關系。拓撲關系的核心是建立點、線、面的關聯(lián)關系。通常有以下幾種空間關系:點-點關系、點-線關系、點-面關系、線-線關系、線-面關系、面-面關系??臻g數(shù)據的拓撲關系,對數(shù)據處理和空間分析具有非常重要的意義[14]。
利用拓撲關系,可以確定一種空間實體相對于另一種空間實體的位置關系。利用拓撲關系,可以確定某縣有多少耕地,分析土地利用類型及對土地適宜性做出評價等。
在拓撲關系的建立中,拓撲過程中伴隨有數(shù)據所表達的空間特征的位置坐標的變化,拓撲關系的不正確等情況,導致空間分析的結果錯誤,給土地管理決策帶來一定的影響。
六、結論
數(shù)據是LIS最基本和最重要的組成部分,同時也是一個LIS項目中投資比重最大的一個部分。數(shù)據質量的好壞,會直接影響到LIS的系統(tǒng)功能和應用質量問題的三個方面(數(shù)據源的質量問題、數(shù)據處理質量問題、數(shù)據應用質量問題)著手,對LIS的數(shù)據質量問題進行了一定的歸納總結和初步的探討。眾所周知,LIS的數(shù)據質量是影響LIS的一個瓶頸環(huán)節(jié),LIS數(shù)據量大、數(shù)據種類多、數(shù)據結構復雜。因此,在LIS的建設過程中,如何在數(shù)據采集與建庫中實施質量控制,保證數(shù)據質量對土地信息系統(tǒng)建設來說顯得尤為關鍵。
七、總結與體會
畢業(yè)論文的撰寫是一次再學習和鍛煉的機會,是對所學知識的一個融會貫通的過程。通過畢業(yè)論文的撰寫,我對所學的知識有了更深層次領悟和掌握,對自己所學的土地管理專業(yè)有了一個整體認識。畢業(yè)論文不僅是對所學知識的總結,也是運用所學知識探求新知的方法、手段。既是一次再學習的過程,也是一次深入學習的機會。同時,畢業(yè)論文寫作,為今后的學習工作奠定了一定的基礎。通過畢業(yè)論文的寫作,我真正懂得理論聯(lián)系實際的重要性。在撰寫畢業(yè)論文中,我運用所掌握的基本知識、方法和技能,研究探討了土地信息系統(tǒng)建立過程中數(shù)據質量的有關問題。通過畢業(yè)論文的撰寫,我進一步完善了自己的知識結構,學習了更多的知識。不僅如此,我對土地信息系統(tǒng)數(shù)據質量控制措施與方法方面有了更進一步的認識。
通過畢業(yè)論文的寫作,不僅強化了我的學習素質、研究素質和創(chuàng)業(yè)素質,而且培養(yǎng)了我的創(chuàng)新意識,激發(fā)了我探求新知的欲望。認真寫作畢業(yè)論文,不僅能進一步鞏固所學的理論知識,而且還能進一步提高自己的各項基本技能,實踐能力和解決問題的能力。
八、謝辭
在論文的寫作過程中,玉文龍老師給予了很大的支持和幫助,為論文的寫作提出了許多寶貴性的意見和建議;在他的指導下,這篇論文得以順利完成。在資料的搜集過程中,圖書館工作人員為我們提供了很大幫助,本組同學也給予了很多支持,在此表示衷心感謝。
參考文獻:
[1] 錢樂祥,余明全.土地信息系統(tǒng)的幾個基本問題.測繪通報,1999(10).
[2] 張 超等.地理信息系統(tǒng).北京:高等教育出版社,1995.
[3] 閻 正等.城市地理信息系統(tǒng)標準化指南.北京:科學出版社,1998.
[4] 范愛民,景海濤.地圖數(shù)字化質量問題.測繪通報,2000(4).
[5] 嚴 星,林增杰.地籍管理.北京:中國人民大學出版社,1999
[6]-[7]郝向陽等. 地圖掃描數(shù)字化點位精度分析.測繪學報,1995,25(1).
[8] 毛 鋒等.地理信息系統(tǒng)建庫技術及應用.北京:科學出版社,1999.
[9] 湯國安,趙牡丹.地理信息系統(tǒng). 北京:科學出版社,2000.
[10] 徐建剛.城市規(guī)劃信息技術開發(fā)及應用.南京:南京大學出版社,2000.
[11] 司少先.地籍信息系統(tǒng)源數(shù)據質量問題探討.測繪通報,1999(4).
[12] 邊馥苓主編.GIS原理與方法.北京:測繪出版社,1996.
[13] 郭達志.地理信息系統(tǒng)基礎與應用.北京:煤炭工業(yè)出版社,1997.
[14] 朱 光等.地理信息系統(tǒng)基本原理及應用. 北京:測繪出版社,1997.
相關文章推薦: