Tài liệu Giáo trình Hệ thống thông tin địa lý: Hệ thống
thông tin địa lý
GEOGRAPHICAL INFORMATION SYSTEM
PGS.TS Nguyễn Ngọc Thạch
-PGĐ.Trung tâm nghiên cứu ứng dung Viễn thám và Hệ thông tin Địa lý
-Giảng viên chính Khoa Địa lý-ĐHKHTN-ĐHQG Hà Nội
Tel : 0913032680 Email: nnthach@yahoo.com / nnthach@cargis.org
Mục lục
1.1. Các khái niệm cơ bản về HTTĐL 1
1.1.1. Định nghĩa 1
1.1.2. Cấu trúc của HTTĐL 3
1.2. Các chức năng của phần mềm HTTĐL 7
1.2.1. Sử dụng HTTĐL cho phân tích không gian 8
1.2.2. Một số vấn đề cơ bản trong xử lý không gian 9
1.2.3. Các yếu tố cơ bản của thông tin không gian 10
1.2.4. Tổ chức dữ liệu không gian của HTTĐL 11
1.3. Các mô hình cấu trúc cơ sở dữ liệu 14
1.3.1. Khái quát chung 14
1.3.2. Cấu trúc dữ liệu Raster 15
1.3.3. Cấu trúc dữ liệu dạng Vector 18
1.3.4. Mô hình cấu trúc dữ liệu cung và điểm nút (arc-node) 19
1.3.5. Mô hình mạng (network model) 23
1.3.6. Chuyển đổi khuôn dạng dữ liệu 24
1.4. Tính chất định lượng của phân tích không gian 26
1.4.1. hệ thống của toạ độ lưới 2...
141 trang |
Chia sẻ: hunglv | Lượt xem: 1671 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Giáo trình Hệ thống thông tin địa lý, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Hệ thống
thông tin địa lý
GEOGRAPHICAL INFORMATION SYSTEM
PGS.TS Nguyễn Ngọc Thạch
-PGĐ.Trung tâm nghiên cứu ứng dung Viễn thám và Hệ thông tin Địa lý
-Giảng viên chính Khoa Địa lý-ĐHKHTN-ĐHQG Hà Nội
Tel : 0913032680 Email: nnthach@yahoo.com / nnthach@cargis.org
Mục lục
1.1. Các khái niệm cơ bản về HTTĐL 1
1.1.1. Định nghĩa 1
1.1.2. Cấu trúc của HTTĐL 3
1.2. Các chức năng của phần mềm HTTĐL 7
1.2.1. Sử dụng HTTĐL cho phân tích không gian 8
1.2.2. Một số vấn đề cơ bản trong xử lý không gian 9
1.2.3. Các yếu tố cơ bản của thông tin không gian 10
1.2.4. Tổ chức dữ liệu không gian của HTTĐL 11
1.3. Các mô hình cấu trúc cơ sở dữ liệu 14
1.3.1. Khái quát chung 14
1.3.2. Cấu trúc dữ liệu Raster 15
1.3.3. Cấu trúc dữ liệu dạng Vector 18
1.3.4. Mô hình cấu trúc dữ liệu cung và điểm nút (arc-node) 19
1.3.5. Mô hình mạng (network model) 23
1.3.6. Chuyển đổi khuôn dạng dữ liệu 24
1.4. Tính chất định lượng của phân tích không gian 26
1.4.1. hệ thống của toạ độ lưới 27
1.4.2. Các phép đo đạc cơ bản về các đối tượng không gian 35
1.4.3. Đo đạc các tư liệu thuộc tính 37
1.5. Điều khiển các lớp thông tin 42
1.5.1. Điều khiển thông tin một lớp 42
1.5.2. Điều khiển thông tin nhiều lớp (multilayer operation) 56
1.5.3. Phân tích mẫu điểm 64
1.6. phân tích đường 71
1.6.1. Đo mật độ đường 72
1.6.2. Đo đạc khoảng cách đến các đường gần nhất 72
1.6.3. Nghiên cứu hướng của đường và các đối tượng dạng kéo dài 73
1.6.4. Mô hình từng nút (gravity model) 75
1.6.5. Vạch tuyến đi và phân định vị trí (Ronting andallocation) 76
1.7. Các bề mặt thống kê 78
1.7.1. Khái niệm về bề mặt 78
1.7.2. Lập bản đồ bề mặt 79
1.8. Các phép phân tích không gian cơ bản trong HTTĐL 90
1.8.1. Các phép toán logic 90
1.8.2. Các phép xử lý số học 91
1.8.3. Điều hành thông tin bản đồ theo bảng thuộc tính 92
1.8.4. Điều hành thông tin một lớp trong quan hệ lân cận (opertioanal on spatial neighbonrhoods) 94
1.8.5. Các phép lọc để nghiên cứu các yếu tố hình học ủa bề mặt địa hình 94
1.9. Giới thiệu về các thiết bị xuât nhập dữ liệu 96
1.9.1. Các thiết bị nhập dữ liệu 98
1.9.2. Xuất dữ liệu 100
1.10. Thiết kế và triển khai hệ thông tin địa lý 103
Hệ thống thông tin địa lý
GEOGRAPHICAL INFORMATION SYSTEM
Các kỹ thuật phân tích không gian (spatial analytical technicques) có nhiệm vụ phân tích theo trật tự và tổ hợp không gian của các hiện tượng hoặc các yếu tố (tự nhiên - kinh tế - xã hội). Mối liên quan đó được cụ thể bằng trật tự không gian địa lý, nghĩa là mọi hiện tượng và tính chất của các yếu tố cần phải được bản đồ hóa.
Bản đồ là cách trình bày cụ thể nhất trong không gian hai chiều các tính chất, vị trí, mối liên hệ và trật tự trong không gian của các đối tượng hoặc hiện tượng cần nghiên cứu. Tuy nhiên do có nhiều cách trình bày bản đồ khác nhau nên dẫn đến sự khó khăn trong việc xử lý mối quan hệ không gian giữa các lớp thông tin.
Trong hơn một thập kỷ qua, hệ thống thông tin địa lý đã được phát triển mạnh mẽ và ngày càng thêm hoàn thiện. Với những ưu thế của mình, hệ thông tin địa lý- geographical information system ( HTTĐL) là một môi trường có khả năng quản lý hệ thống cơ sở dữ liệu và xử lý chính xác các lớp thông tin trong mối quan hệ không gian giữa chúng. HTTĐL có khả năng bổ sung, đo đạc và tự động tính toán chính xác về mặt định lượng các thông tin trên bản đồ, cùng các thuộc tính của chúng, đồng thời có thể đưa ra các tính toán dự báo.
(antenucci 1991)
I.Các khái niệm cơ bản về HTTĐL
I.1.Định nghĩa
Hệ thông tin địa lý (HTTĐL)- Geographical information system ( GIS) là một tổ chức tổng thể của bốn hợp phần: phần cứng máy tính, phần mềm, tư liệu địa lý và người điều hành được thiết kế hoạt động một cách có hiệu quả nhằm tiếp nhận, lưu trữ, điều khiển, phân tích và hiển thị toàn bộ các dạng dữ liệu địa lý. HTTĐL có mục tiêu đầu tiên là xử lý hệ thống dữ liệu trong môi trường không gian địa lý. (Viện nghiên cứu môi trường Mỹ - 1994).
Một định nghĩa khác có tính chất giải thích, hỗ trợ là: “HTTĐL là một hệ thống máy tính có chức năng lưu trữ và liên kết các dữ liệu địa lý với các đặc tính của bản đồ dạng đồ họa, từ đó cho một khả năng rộng lớn về việc xử lý thông tin, hiển thị thông tin và cho ra các sản phẩm bản đồ, các kết quả xử lý cùng các mô hình”
I.2.Cấu trúc của HTTĐL
HTTĐL bao gồm 4 hợp phần cơ bản như sau : dữ liệu không gian, người điều hành, phần cứng, phần mềm (hình 2).
Hình 2. Mô hình tổ chức của HTTĐL
Dữ liệu không gian: Dữ liệu không gian có thể đến từ nhiều nguồn, có các nguồn tư liệu sau: số liệu tính toán thống kê, báo cáo, các quan trắc thực địa, ảnh vệ tinh, ảnh máy bay, bản đồ giấy (dạng analog). Kỹ thuật hiện đại về viễn thám và HTTĐL có khả năng cung cấp thông tin không gian bao gồm các thuộc tính địa lý, khuôn dạng dữ liệu, tỷ lệ bản đồ và các số liệu đo đạc. Việc tích hợp các tư liệu địa lý từ nhiều nguồn khác nhau là đặc điểm cơ bản của một phần mềm GIS
Thông thường, tư liệu không gian được trình bày dưới dạng các bản đồ giấy với các thông tin chi tiết được tổ chức ở một file riêng. Các tư liệu đó không đáp ứng được các nhu cầu hiện nay về tư liệu không gian là vì những lý do sau:
Đòi hỏi không gian lưu trữ rất lớn, tra cứu khó khăn. Để nhập và khai thác dữ liệu, nhất thiết phải liên kết được với các thông tin địa lý trên bản đồ và các dữ liệu thuộc tính khác được lưu trữ riêng biệt và điều này trở nên rất khó khăn với hình thức lưu trữ dạng kho hoặc thư viện.
Các khuôn dạng lưu trữ truyền thống thường không tương thích với các tiêu chuẩn dữ liệu hiện nay. Thay thế cho các dữ liệu dạng truyền thống, hiện nay tư liệu dạng số với một khối lượng rất lớn có thể được lưu trữ trong các đĩa CD, tương ứng với những khối lượng rất lớn của tư liệu analoge. Tư liệu số còn cho khả năng xử lý tự động trên máy tính.
Như vậy, HTTĐL là sự phát triển đặc biệt để sử dụng công nghệ và nghệ thuật máy tính trong việc xử lý tư liệu không gian dạng số.
Người điều hành
Vì HTTĐL là một hệ thống tổng hợp của nhiều công việc kỹ thuật, do đó đòi hỏi người điều hành phải được đào tạo và có kinh nghiệm trong nhiều lĩnh vực. Người điều hành là một phần không thể thiếu được của HTTĐL. Hơn nữa sự phát triển không ngừng của các kỹ thuật phần cứng và phần mềm đòi hỏi người điều hành phải luôn được đào tạo. Những yêu cầu cơ bản về người điều hành bao gồm các vấn đề sau:
Có kiến thức cơ bản về địa lý, bản đồ, máy tính và công nghệ thông tin:
Việc đào tạo cơ bản về địa lý cung cấp khả năng khai thác các đặc điểm không gian (spatical process) và các quá trình không gian, đồng thời phát hiện được mối quan hệ không gian giữa các hợp phần.
Bản đồ học cung cấp các hiểu biết về thiết kế bản đồ, lập bản đồ (ví dụ: Lưới chiếu bản đồ, hệ thống tọa độ, các mẫu ký tự trên bản đồ và các kỹ thuật in ấn).
Khoa học về máy tính và thông tin cung cấp các kiến thức cơ bản về phần cứng máy tính và vận hành thông thạo các chương trình liên kết phần cứng.
Có kinh nghiệm trong việc sử dụng các phần mềm HTTĐL: việc đào tạo các phần mềm chủ yếu thường tập trung vào việc xử lý HTTĐL, lập trình cơ bản, quản lý cơ sở dữ liệu và một số công việc khác có liên quan đến tích hợp thông tin.
Có hiểu biết nhuần nhuyễn về dữ liệu: hiểu về nguồn dữ liệu, nội dung và độ chính xác của dữ liệu, tỷ lệ bản đồ nguyên thủy và các số liệu đo đạc của tập dữ liệu, cấu trúc của dữ liệu.
Có khả năng phân tích không gian. Yêu cầu được đào tạo về các phương pháp xử lý thống kê và xử lý định tính trong địa lý, việc đào tạo cho người xử lý có thể lựa chọn phương pháp tốt nhất để phân tích và áp dụng nhằm đưa ra kết quả tốt nhất.
Các yêu cầu trên là cần thiết đối với người điều hành HTTĐL. Các huấn luyện chi tiết sẽ tùy thuộc nội dung và mục tiêu cũng như khả năng của máy tính và phần mềm để lực chọn những chương trình đào tạo thích hợp.
Phần cứng (máy tính và thiết bị ngoại vi)
Phần cứng của một HTTĐL bao gồm các hợp phần sau: Bộ xử lý trung tâm (CPU), thiết bị nhập dữ liệu, lưu dữ liệu và thiết bị xuất dữ liệu.
Bộ xử lý trung tâm (central processing unit - CPU): hệ thống điều khiển, bộ nhớ, tốc độ xử lý là những yếu tố quan trọng nhất của CPU. Hiện nay xử lý HTTĐL trên nền unix là hệ thống có đủ các chức năng nhất, trong khi với máy CP thì HTTĐL có những chức năng hạn chế hơn. Các hệ xử lý GIS trước đây, phần lớn đều chạy trong trạm Unix. Trạm Unix cho phép lưu trữ cơ sở dữ liệu lớn và nhiều chức năng xử lý khác nhau. Tất nhiên với sự trợ giúp của window NT thì PC cũng có thể so sánh được với hệ unix. Ví dụ điểm hình về một hệ thống có hiệu quả là một hệ Unix nhỏ có cài đặt phần mềm ARC/INFO để quản lý và vận hành HTTĐL. Hiện nay, các hệ thống xử lý liên tục được nâng cấp và khoảng cách giữa trạm Unix và PC càng hẹp dần.
Nhập, lưu dữ và xuất dữ liệu: các thiết bị ngoại vi phục vụ cho việc nhập dữ liệu là: Bàn số hoá, máy quét để chuyển đổi dữ liệu analoge thành dạng số. Hoặc đọc băng và đĩa CD - ROM có nhiệm vụ lấy thông tin hiện có trong băng và đĩa. Các phương tiện thông dụng là ổ đĩa cứng, ổ đọc băng, ổ đĩa quang có thể ghi và xoá dữ liệu. Thiết bị xuất dữ liệu bao gồm máy in đen trắng và màu, báo cáo, kết quả phân tích, máy in kim (plotter). Hiện nay, với sự phát triển của công nghệ tin học và điện tử, đặc biệt là khi có thiết bị mạng cho phép san sẻ các chức năng và trao đổi giữa những người sử dụng và càng tạo điều kiện cho HTTĐL phát triển.
Phần mềm
Một hệ thống phần mềm xử lý HTTĐL yêu cầu phải có hai chức năng sau: tự động hoá bản đồ và quản lý cơ sở dữ liệu. Sự phát triển kỹ thuật HTTĐL hiện đại liên quan đến sự phát triển của hai hợp phần này.
Tự động hoá bản đồ: bản đồ học là môn khoa học, nghệ thuật và kỹ thuật thành lập bản đồ. Do đó, tự động hoá bản đồ là thành lập bản đồ với sự trợ giúp của máy tính. Một bản đồ là sự thể hiện bằng đồ họa của mối quan hệ không gian và các hình dạng (Pobinson và NNK, 1984) và mỗi một bản đồ là sự mô hình hoá thực tế theo những tỷ lệ nhất định. Mô hình đó yêu cầu biến đổi các số liệu ghi bản đồ thành bản đồ và gồm các công đoạn sau: Lựa chọn, phân loại, làm đơn giản hóa và tạo mẫu ký tự (Den - 1990).
Máy tính trợ giúp cho bản đồ học ở nhiều phương diện như sau:
Trước hết, bản đồ trong máy tính là dạng số nên dễ dàng chỉnh sửa và việc chỉnh lý đó tốn ít công sức hơn so với việc không có sự trợ giúp của máy tính. Mặc dù việc số hóa có thể dẫn đến nhiều lỗi và làm giảm độ chính xác, song các lỗi đó có thể sửa dễ dàng nếu phát hiện được. Khi đó, bản đồ sẽ được hoàn thiện và lượng thông tin sẽ được nâng lên. Đặc biệt, việc bổ sung thông tin cho bản đồ cũng dễ dàng thực hiện được.
Thứ hai, quá trình tạo chú giải và các chỉ dẫn lên bản đồ được thao tác với tốc độ nhanh nên giá thành thấp. Việc lựa chọn, phân loại và làm đơn giản hóa các đặc điểm bản đồ cũng được thực hiện một cách khoa học. Quá trình thiết kế và khái quát hóa bản đồ cũng được lập trình và tạo nên các chức năng cụ thể của phần mềm. Kết quả như mong muốn có thể đạt được bởi nhiều cán bộ bản đồ hoặc do chính một cán bộ bản đồ làm trong nhiều thời gian khác nhau.
Thứ ba, thiết kế bản đồ có thể được hoàn thiện hơn qua việc thử và chỉnh sửa lỗi. Kích thước, hình dạng hoặc vị trí của chữ hoặc ký hiệu trên bản đồ có thể dễ dàng được thay đổi và đưa về vị trí chính xác như mong muốn.
Quản lý dữ liệu: chức năng thứ hai của phần mềm HTTĐL là hệ thống quản lý dữ liệu (data base management system DBMS). Hệ thống TTĐL phải có khả năng điều khiển các dạng khác nhau của dữ liệu địa lý đồng thời có thể quản lý hiệu quả một khối lượng lớn dữ liệu với một trật tự rõ ràng. Một yếu tố rất quan trọng của phần mềm HTTĐL là cho khả năng liên kết hệ thống giữa việc tự động hóa bản đồ và quản lý cơ sở dữ liệu. Các tài liệu mô tả cho một vị trí bất kỳ, có thể liên hệ một cách hệ thống với vị trí không gian của chúng. Sự liên kết đó là một ưu thế nổi bật của việc vận hành HTTĐL:
Thứ nhất: các tài liệu liệu thuộc tính nhất thiết phải được thể hiện trên những chi tiết của bản đồ. Ví dụ số liệu về dân số của một thành phố cũng được gọi ra một cách tự động mà không cần phải có một sự tra cứu nào khác. Đối với bản đồ học thì công việc tra cứu thường phải làm độc lập, không thực hiện tự động được. Ngoài ra việc bổ sung số liệu cũng đòi hỏi phải được cập nhật thường xuyên nên chỉ HTTĐL mới có thể đáp ứng được đầy đủ.
Thứ hai: sự thay đổi về những chi tiết bản đồ nhất thiết phải phù hợp với sự thay đổi về tự nhiên thuộc tính. Ví dụ, sự thay đổi về diện tích đô thị về số liệu phải tương xứng với sự thay đổi về đường ranh giới thành phố. Khi thay đổi ranh giới thì số liệu tính toán về diện tích cũng tự động được thay đổi.
II.Các chức năng của phần mềm HTTĐL
Một phần mềm HTTĐL các các chức năng cơ bản như sau: nhập dữ liệu, lưu trữ dữ liệu, điều khiển dữ liệu, hiển thị dữ liệu theo cơ sở địa lý và đưa ra những quyết định (decision making) (Calkins và Tomlinson 1997). Có thể khái quát về các chức năng đó như sau:
Nhập và bổ sung dữ liệu (entry and updating): Một trong những chức năng quan trọng của HTTĐL là nhập và bổ sung dữ liệu mà công việc đó không tiến hành riêng rẽ. Bất kỳ một hệ thống nào cũng phải cho phép nhập và bổ sung dữ liệu, nếu không có chức năng đó thì không được xem là một HTTĐL vì chức năng đó là một yêu cầu bắt buộc phải có.
Việc nhập và bổ sung dữ liệu phải cho phép sử dụng nguồn tự liệu dưới dạng số hoặc dạng analog. Dạng tư liệu không gian như bản đồ giây hoặc ảnh vệ tinh, ảnh máy bay phải được chuyển thành dạng số và các nguồn tư liệu số khác cũng phải chuyển đổi được để tương thích với cơ sở dữ liệu trong hệ thống đang sử dụng.
Chuyển đổi dữ liệu: chuyển đổi dữ liệu là một chức năng rất gần với việc nhập và bổ sung dữ liệu. Nhiều phần mềm thương mại cố gắng giữ độc quyền bằng cách hạn chế đưa các khuôn dạng dữ liệu theo loại phổ cập. Tuy nhiên người sử dụng phải lựa chọn để hạn chế việc phải số hóa thêm những tài liệu hiện đang có ở dạng số. Trong thực tế, cùng một tư liệu nhưng có thể tồn tại ở nhiều khuôn dạng khác nhau. Vì vậy, đối với tư liệu quốc gia, không thể chỉ lưu giữ ở một dạng thuộc tính riêng biệt mà cần thiết phải lưu giữ ở nhiều khuôn dạng có tích chất phổ biến để sử dụng được trong nhiều ứng dụng khác nhau. Như vậy, một phần mềm HTTĐL cần phải có chức năng nhập và chuyển đổi nhiều khuôn dạng dữ liệu khác nhau.
Lưu giữ tư liệu: Một chức năng quan trọng của HTTĐL là lưu giữ và tổ chức cơ sở dữ liệu do sự đa dạng và với một khối lượng lớn của dữ liệu không gian: đa dạng về thuộc tính, về khuôn dạng, về đơn vị đo, về tỷ lệ bản đồ. Hai yêu cầu cơ bản trong việc lưu trữ dữ liệu là: thứ nhất là phải tổ chức nguồn dữ liệu sao cho đảm bảo độ chính xác và không mất thông tin, thứ hai là các tài liệu cho cùng một khu vực song các dữ liệu lại khác nhau về tỷ lệ, về đơn vị đo... thì phải được định vị chính xác và chuyển đổi một cách hệ thống để có thể xử lý hiệu quả.
Điều khiển dữ liệu (data manipulation): Do nhiều HTTĐL hoạt động đòi hỏi tư liệu không gian phải được lựa chọn với một chỉ tiêu nhất định được phân loại theo một phương thức riêng, tổng hợp thành những đặc điểm riêng của hệ thống, do đó HTTĐL phải đảm nhiệm được chức năng điều khiển thông tin không gian. Khả năng điều khỉển cho phép phân tích, phân loại và tạo lập các đặc điểm bản đồ thông qua các dữ liệu thuộc tính và thuộc tính địa lý được nhập vào hệ thống. Các thuộc tính khác nhau có thể được tổng hợp, nắm bắt một cách riêng biệt và những sự khác biệt có thể được xác định, được tính toán và được can thiệp, biến đổi.
Trình bày và hiển thị: Đây cũng là một chức năng bắt buộc phải có của một HTTĐL. Không gian dưới dạng tài liệu nguyên thủy hay tài liệu được xử lý cần được hiển thị dưới các khuôn dạng như: chữ và số (text), dạng bảng biểu (tabular) hoặc dạng bản đồ. Các tính toán chung và kết quả phân tích được lưu giữ ở dạng chữ và số để dễ dàng in ra hoặc trao đổi giữa các lỗ phần mềm khác nhau. Các dữ liệu thuộc tính có thể được lưu ở dạng bảng biểu hoặc các dạng cố định khác. Bản đồ được thiết kế để hiển thị trên màn hình hoặc lưu dưới dạng điểm (plot file) để in. Như vậy, hiển thị và in ra là những chức năng rất cần thiết của một HTTĐL.
Phân tích không gian: Trước đây, chỉ có 5 chức năng mô tả ở trên là được tập trung, phát triển bởi những người xây dựng HTTĐL. Chức năng thứ sáu là phân tích không gian được phát triển một cách thần kỳ dựa vào sự tiến bộ của công nghệ và nó trở nên thực sự hữu ích cho người ứng dụng. Những định nghĩa về HTTĐL trước đây đã trở thành thực tiễn trên cơ sở ứng dụng trực tiếp chức năng phân tích không gian. Theo quan điểm hiện nay thì chức năng đó cần thiết phải có đối với một hệ thống được gọi là HTTĐL. Tất nhiên các chức năng có thể khác nhau đối với từng hệ thống song đối với một một hệ thống TTĐL sử dụng tư liệu bản đồ thì chức năng đó là băt buộc. Với một hệ thống như vậy thì các mô tả bằng lời có thể tổ chức thành các tham số riêng, các mô hình giải thích, dự báo đều có thẻ thực hiện trong chức năng xử lý không gian.
II.1.Sử dụng HTTĐL cho phân tích không gian
Phân tích không gian HTTĐL Bao gồm ba hoạt động chính: Giải quyết các câu hỏi về thuộc tính, các câu hỏi về phân tích không gian và tạo nên tập dữ liệu mới từ cơ sở dữ liệu ban đầu. Mục tiêu của việc phân tích không gian là từ việc giải quyết các câu hỏi đơn giản về các hiện tượng, các vấn đề trong không gian, đi đến tập hợp thành các thuộc tính của một hay nhiều lớp và phân tích được sự liên quan giữa các dữ liệu ban đầu.
Trong ứng dụng của HTTĐL, các đặc điểm và thuộc tính về không gian là rất phổ biến. Câu hỏi về thuộc tính (attribute query) có chứa đựng cả tích chất thông tin về không gian. Ví dụ: Trong cơ sở dữ liệu của một hành phố, ở đó mỗi mảng bản đồ đều có Code thuộc tính về sử dụng đất, một bảng thuộc tính đơn giản có thể yêu cầu liệt kê toàn bộ các mảng của các loại hình sử dụng đất có trong bản đồ. Bảng thuộc tính đó có thể tạo được mà không hề có sự tham khảo về các mảng trên bản đồ. Vì không có thông tin không gian đòi hỏi trả lời cho câu hỏi này nên bảng đó được xem như là bảng thuộc tính (attribute query). Trong ví dụ này, toàn bộ bảng thuộc tính có các Code của sử dụng đất đã được xác định. Các thông tin khác có thể được tạo nên ví dụ như số mảng đơn vị (parcel) của loại hình sử dụng đất này, hoặc tổng diện tích của loại hình sử dụng đất này ở trong thành phố... Tất nhiên những bài toán xử lý thông tin cho một lớp là cần thiết, song trong ứng dụng, việc xử lý thông tin của nhiều lớp cũng là công việc rất quan trọng và đòi hỏi nhiều công sức trong lập trình. Ví dụ gảii bài toán về 2 lớp không gian về tính toán diện tích của các loại hình sử dụng đất theo các cấp độ dốc khác nhau...Những bài toán đó đặt ra đối với nhiều nội dung ứng dụng khác nhau mà những phần mềm chuyên tự động hóa bản đồ hay quản lý dữ liệu không đáp ứng được. Tất nhiên do mục đích của HTTĐL là tập trung vào xử lý không gian, nên một số chức năng của việc tự động hóa bản đồ hoặc tính toán thống kê chuyên đề thì có thể HTTĐL không đáp ứng được.
II.2.Một số vấn đề cơ bản trong xử lý không gian
Xử lý thông tin trong một lớp: giải quyết các vấn đề về thuộc tính các đơn vị trong một lớp, đo đạc các giá trị, phân tích sự liên quan giữa các đơn vị trong một lớp bản đồ. Ví dụ xác định tên, tính diện tích, chu vi của từng khoanh vi bản đồ, xác định khoảng cách, tạo các vùng ảnh hưởng (buffer zone).
Xử lý thông tin nhiều lớp: chồng xếp hai hoặc nhiều lớp thông tin cho phép tạo ra nhiều đơn vị bản đồ mới trên cơ sở làm chi tiết hoá thông tin của từng phần trong một đơn vị bản đồ. Ví dụ hai lớp thực vật và đất khi chồng xếp sẽ cho bản đồ thực vật phân bố trên các loại đất khác nhau.
Xử lý không gian: có thể có rất nhiều lớp thông tin mà xử lý không gian cần phải tính toán được mối quan hệ giữa chúng.
Phân tích các mẫu điểm: một số đối tượng tự nhiên hoặc hiện tượng tự nhiên có sự phân bố bằng các điểm tập trung theo các quy luật nhất định. Ví dụ: phân bố của các đồng cỏ, hệ thống các điểm bố sụt cactor, phân bố của các loài động vật, thực vật quý hiếm... Trong xử lý không gian, sự phân bố về những điểm đó cần được nhận diện và phân loại.
Phân tích mạng: thiết lập một mạng hữu ích giữa các diện có sự phân bố khác nhau là một trong những chức năng xử lý không gian: ví dụ tạo tuyến xe bus gần nhất nối các điểm đón khách trong thành phố, mở một hệ thống đường nối giữa các khu dân cư, thiết kế một tuyến đường ống dẫn dầu... Tất nhiên khi thiết kế cụ thể lại phải bổ sung bằng một số thông tin khác nhau, ví dụ: địa hình, sử dụng đất…
Phân tích, xử lý theo ô lưới (grid analysis). Bài toán xử lý ô lưới rất phong phú, nó có thể ứng dụng cho nhiều ngành: ví dụ tính toán lan truyền ô nhiễm, lập các đường đẳng trị, dự báo cháy rừng…
Phân tích xử lý nhiều lớp thông tin theo điều kiện. Đây là chức năng phức tạp và đa dạng nhất của xử lý không gian. Nhiều bài toán được áp dụng để biến đổi lớp thông tin ban đầu thành một hay nhiều lớp thông tin mới: ví dụ tính độ dốc, hướng dốc, tính mật độ, bài toán boolean, bài toán logic, các phép phân chia, tính căn... bản đồ, những lớp thông tin mới.
Vùng bên trong là phần không bao gồm đường biên. Polygon là diện tích có vùng bên trong, một đường viền bên ngoài, không có điểm giao cắt ở bên trong và không có khoanh vi nào khác ở phía trong. Polygon phức tạp: là polygon có một hoặc nhiều khoanh vi khác ở bên trong.
Có hai khái niệm được sử dụng bổ sung cho định nghĩa trên đó là pixels và ô lưới đơn vị (grid cells) Pixel là đơn vị hình ảnh có hai kích thước, nó là đơn vị nhỏ nhất của hình ảnh không thể chia nhỏ được. Ô lưới đơn vị là đối tượng có hai kích thước, thể hiện một yếu tố của một bề mặt có cấu trúc đều đặn bởi chúng.
Những khái niệm nêu ở trên là do bản đồ số của Mỹ đưa ra (National comitee for digital colorgaphic data standars - NCDCDS). Các khái niệm đó có thể được gọi khác đi,tùy theo sự thiết kế về tên gọi trong từng hệ thống phần mềm HTTĐL.
II.3.Các yếu tố cơ bản của thông tin không gian
Việc phân tích trật tự và tổ hợp không gian yêu cầu phải có ba thuộc tính cơ bản sau: vị trí (location), dữ liệu thuộc tính (attribute data) và tính chất hình học (topology).
Vị trí: là tính chất quan trọng mà mỗi đối tượng không gian phải có. Vị trí được xác định bởi tọa độ X và Y trên mặt phẳng ngang (caitesian).
Dữ liệu thuộc tính: Cung cấp nhiều thông tin quan trọng về tính chát của đối tượng được nghiên cứu. Ví dụ bản đồ có các đặc điểm thì bảng thuộc tính phải nêu được tích chất các đặc điểm đó, ví dụ: giống cột điện hay hố nước... với các thông tin cụ thể cho từng loại.
Dữ liệu hình học: được định nghĩa là mối quan hệ không gian giữa các yếu tố bản đồ. Trong trường hợp các polygon, có những polygon lại nằm trong ranh giới của một polygon khác. Với các yếu tố đường có, những đường tạo nên bởi hai đoạn thẳng (segment) nối với nhau trực tiếp hoặc nối gián tiếp qua một đoạn thẳng thứ ba, hoặc hai đoạn thẳng hoàn toàn không nối với nhau. Với các điểm, các điểm có thể ở cách nhau những khoảng cách khác nhau.
Nhìn chung, vị trí và dữ liệu thuộc tính là tương đối dễ hiểu, song đặc điểm hình học thì hơi khó hình dung hơn. Có một số khái niệm và thuộc tính như sau:
Tiếp giáp (adjacency): hai polygon ở liền nhau thì được gọi là tiếp giáp với nhau. Khái niệm tiếp giáp được sử dụng khi phân tích sự liên quan của những yếu tố ở liền kề nhau. Ví dụ: giá của một miếng đất sẽ cao hơn giá trung bình của vùng nếu như vùng đất đó nằm liền kề với công viên hoặc khu thương mại...
Chứa đựng (containment): biểu thị một yếu tố nào đó nằm trong rang giới của một polygon. Mối quan hệ này cũng quan trọng khi phân tích mối liên quan giữa hai kiểu đối tượng. Ví dụ: một mảnh đất nằm trong vùng ngập lụt có thể phải mua bảo hiểm với giá cao hơn.
Tiếp nối (connectivity): thể hiện cho hai đoạn thẳng được nối với nhau. Khái niệm tiếp nối được xem xét cho việc phân tích giao thông, tuyến đi để có thể tìm ra phương án mở tuyến tốt nhất.
Giao nhau (intersection): được xem là một dạng phức tạp trong mối quan hệ không gian của các yếu tố polygon. Giao cắt đối với polygon nghĩa là hai polygon có cùng chung một vùng, vùng này có tính chất thuộc về cả hai polygon. Khi xử lý chồng xếp bản đồ thì vùng giao nhau không cần xem xét đến các tính chất hình học. Tuy nhiên thông dụng nhất là các vùng được bố trí tách biệt nhau trong cơ sở dữ liệu.
Tóm lại, 3 yếu tố: vị trí, dữ liệu thuộc tính và đặc điểm của dữ liệu là rất quan trọng trong xử lý không gian. Tự động hóa bản đồ sẽ giúp ích cho việc trình bày và tổ chức dữ liệu không gian. Trong xử lý không gian, tổng hợp các đặc điểm về mối liên hệ không gian giữa các yếu tố bản đồ được xử lý bởi HTTĐL và nó cung cấp khả năng xử lý đồng thời cả ba yếu tố. Các đối tượng không gian được trình bày dưới dạng đặc điểm về đường, điểm, hoặc polygon. Mỗi một đặc điểm lại được thể hiện tập trung vào một số yêu cầu về mặt cơ sở dữ liệu.
II.4.Tổ chức dữ liệu không gian của HTTĐL
Trong một HTTĐL điển hình, các đối tượng không gian được liên kết để nghiên cứu các hiện tượng thì nhất thiết phải được trình bày dưới dạng bản đồ với mục đích thiết lập được mối liên quan không gian giữa chúng. Cả vị trí và thuộc tính được xử lý thông qua một loạt các chương trình trong HTTĐL. Yêu cầu đầu tiên để việc tạo lập dữ liệu một cách có hiệu quả là các đối tượng được thể hiện ở ba yếu tố cơ bản là: điểm (point), đường (line) và vùng (area hay polygon). Theo quan điểm của tổ chức quốc gia Mỹ về dữ liệu bản đồ số thì các yếu tố đó được giải thích như sau. Một con đường hoặc con sông, con suối thường được biểu diễn bằng các yếu tố đường, mặc dù trong thực tế có thể đo được cả độ rộng và chiều dài của chúng trên bản đồ. Các đối tượng tự nhiên thường được thể hiện bằng các đường, cung, vùng, điểm, tuỳ theo các đặc trưng cụ thể mà chúng được thể hiện theo các hình mẫu cụ thể.
Hình 1. Mô tả một số khái niệm vector nguồn: điểm, đường và vùng
Một số khái niệm chính được cụ thể trong định nghĩa này như sau:
Điểm: là đối tượng có kích thước bằng 0 về mặt hình học. Do đó các đối tượng điểm chỉ dùng để xác định vị trí. Điểm không có ý nghĩa trong việc đo về kích thước. Mặc dù trên bản đồ, các điểm được biểu thị bằng kích thước khác nhau nhưng diện tích của các điểm là không có ý nghĩa thực tế. Một số khái niệm về "điểm" như sau:
Điểm thực tế (entity point): dùng để xác định vị trí của các đối tượng dạng điểm như: các toà nhà, các cột. Trường hợp đó, xác định chính xác vị trí của các điểm là điều rất quan trọng.
Điểm chỉ tên (label point) được sử dụng để hiển thị một tập hợp chữ viết cho các đối tượng bản đồ. Đối với những điểm nào thì độ chính xác của vị trí phụ thuộc vào quan niệm bản đồ học. Nghĩa là vị trí các điểm chỉ tên cho các đối tượng trên bản đồ được xác định sao cho không có sự lẫn lộn với nhau.
Điểm có diện tích (area point) dùng để xã định một vị trí có thông tin về diện tích. Ví dụ có thể dùng điểm để thể hiện vị trí một quốc gia và độ lớn của điểm chứa đựng thông tin về đất nước đó.
Điểm giao nhau (node) thể hiện vị trí một diện với các dấu hiệu về hình học, ví dụ: nơi giao nhau hoặc điểm cuối của các yếu tố đường.
Các thông tin về điểm các một kích thước trong phân tích không gian mặc dù chúng thể hiện cho các đối tượng có hai kích thước ở trên bản đồ. Ví dụ: một điểm biểu thị cho 1 giếng, một điểm biểu thị cho một cột. Mặc dù diện tích mà giếng chiếm khác với diện tích của cột chiếm. Trong một bản đồ thì không thể nêu được diện tích mà giếng hoặc cột chiếm trên thực tế - do tỷ lệ bản đó không đáp ứng. Trong phân tích không gian, diện tích giữa các điểm là không tính (trừ trường hợp các điểm có diện tích, lúc đó điểm đã trở thành vùng)
Tính chất của điểm: đây là dạng đơn giản nhất của các đối tượng không gian.
Khi nói về dữ liệu điểm, phải nói đến số lượng điểm tối thiểu cho một cơ sở dữ liệu điểm. Nhìn chung, các yếu tố tối thiểu cho một cơ sở dữ liệu điểm là những thuộc tính về toạ độ,ngoài ra, các tính chất khác của điểm được mô tả trong hàm sau:
Pi: ( X, Y, Z1 Z2 Z3 …Z.m)
ở đây: i là Code xác định của mõi điểm ( identification Code -ID)
X, Y toạ độ của đIểm, được xác định theo toạ độ phẳng (x, y trong mặt phẳng cartesian)
Z 1,Z2… Z m các đặc trưng khác của điểm.
Vì điểm có kích thước bằng không (= 0) nên nó không có khoảng trống ở giữa, song nó phải có thuộc tính về mặt hình học, đó là toạ độ. Thông tin về mối liên quan giữa các điểmcó thể xác định bằng công thức toán học. Trong trường hợp có nhiều điểm thì khoảng cach giữa các đIểm được xác định bởi vị trí của các điểm đó với nhau.
Đường:
Định ghĩa: Đường là các yếu tố có một kích thước và thể hiện cả vị trí và hướng. Độ dài là dấu hiệu đo đạc về kích thước của đối tượng đường. Mặc dù các yếu tố đường thường có không gian hai kích thước trên bản đồ nhưng độ rộng của đường là không được xem xét đến trong tính toán hướng của bản đồ.
Đường (line): là các đối tượng có một kích thước.
Đoạn thẳng (line segment): là đường nối trực tiếp giữa hai điểm.
Đường gấp khúc: là các đọan thẳng nối liên tục, có thể khác hướng song không có điểm nối hoặc có thể điểm nối ở một phía (phải hoặc trái). Đường gấp khúc có thể cắt qua chính nó hoặc cắt các đường khác.
Cung (arc) là một đoạn tập hợp các điểm tạo nên một dạng đường cong mà đường cong đó được xác định bằng một hàm toán.
Đoạn nối (link) là đối tượng có một kích thước nối giữa hai nút. Đoạn nối cũng được hiểu là đường gờ (edges) hay đường viền.
Đoạn nối trực tiếp : là đoạn nối giữa hai nút với một hướng nhất định.
Dây xích (chain): là sự nối liên tục của các đoạn thẳng không cắt nhau hoặc giữa các cung với các nút ở cuối mỗi cung. Các nút có thể nằm ở bên phải hay bên trái là không bắt buộc
Tính chất của đường: Đường được hiểu là tập hợp của rất nhiều điểm. Mỗi đường đều có thể chia thành nhiều đoạn thẳng và mmỗi đoạn được xác dịnh bởi hai điểm ở hai đầu. Để cấu tạo nên yếu tố hình học của đưòng thì yếu tố cơ bản là hướng của đường. Ngoài ra, còn một yếu tố khác, đó là sự tiếp nối giữa các đường. Để hiểu sự tiếp nối đó, ta có thể hình dung tới một đoạn thẳng nối giữa một điểm này với một điểm khác.
Như vậy, các yếu tố cơ bản của mỗi đường gồm có:
Lj: (P1, P2, …Pn, Z1, Z2…Zm, H1…Hq)
ở đây: j Code của đường ( ID)
P1 điểm thứ 1
Pn điểm thứ n
Z1 thuộc tính của đoạn thứ 1
Zn thuộc tính của đoạn thứ n
Hq - Code ID của đoạn thứ q được nối trong thứ tự của đường
(1… n) là hướng của đường từ 1 đến n của đường.
Vùng: (area) hoặc (polygone)
Vùng là khái niệm phức tạp nhất trong 3 loại yếu tố không gian của cấu trúc vector. Vùng được hiểu là một diện tích giới hạn bởi một đường khép kín và phần bên trong đó có những tính chất cụ thể.
Định nghĩa : Vùng là đặc điểm thể hiện hai kích thước cả vị trí và diện tích, là đối tượng xác định về mặt ranh giới, liên tục và có hai kích thước. Nó có thể bao gồm cả phần bên hoặc không
Cáctính chất của polygon:Polygone dược xác định bởi một loạt các đường vạch định ranh giới. Thêm vào đó, polygone là yếu tố có 2 kích thước . Mỗi polygone được xác định bởi một diện tích nhất định. Vì polygone không có hình dạng và kích thước nhất định, nên mối quan hệ không gian sẽ khó xác định nếu không có những thuộc tính được làm rõ. Hai polygone có thể nằm tách biệt với nhau, hoặc kề nhau, hoặc cái nọ nằm trong cái kia.
Trong trường hợp nằm tách biệt hẳn so với nhau thì lại có khả năng chúng được nối với nhau bằng polygone thứ ba.
Yêu cầu về thuộctính của polygone bao gồm:
G. K (L 1…L n, Z1… Zm σ1…σr, φ1…φs,Φ1… Φt)
ở đây: K là Code của polygone G, tần số kết nối của đường từ L1 đến Ln và nó xác định ranh giới của polygone G.
Z n xác định giá trị của thuộc tính thứ n
σ1…σr thể hiện một hoặc nhiều polygone kết nối với nhau tạo nên polygone K
φ1…φs xác định có 1 hay nhiều polygone chứa trong polygone K
Φ1… Φt xác định có một hay nhiều polygone nằm trong polygone K
Các thông tin hình học bổ sung khác còn có thể là cần thiết đối với các polygone phức tạp. Nhiều thông tin hình học có thể được bổ sung ngay trong những thông tin về đường hoặc được làm đơn giản hoá đi. Ví dụ: hai polygone nằm liền kề thì phải có thêm thông tin về một đoạn thẳng chung ở giữa làm biên giới giữ hai polygone
.
II.5.Các mô hình cấu trúc cơ sở dữ liệu
II.5.1.Khái quát chung
Tư liệu (data) được hiểu như những sự hiện diện đã được kiểm tra về thế giới thực (Graeme F Borinam Carter). Thông tin là tư liệu được tổ chức theo những mẫu thể hiện nhằm dễ dàng tìm kiếm và khai thác.
Tư liệu không gian phải được trình bày và lưu trữ một cách riêng biệt trong nưhngx không gian của HTTĐL. Ví dụ: đường, điểm, vùng, bề mặt … phải được lưu trữ độc lập cùng các thuộc tính của chúng tạo thành những file dữ liệu không gian hoặc phi không gian.
Cơ sở dữ liệu ( CSDL) là toàn bộ những thông tin cần thiết về đối tượng được lưu giữ dưới dạng số. CSDL có thể là không gian hoặc phi không gian. Hệ thống quản lý CSDL (Database management System - DBMS) là tập hợp một số chức năng của phần mềm để lưu giữ, bổ sung và thể hiện dữ liệu . Các hệ thống quản lý cơ sở dữ liệu phi không gian hoặc không gian thường tách biệt nhau. Cũng có một số phần mềm tổ chức kết hợp để quản lý cả hai dạng dữ liệu hoặc cung cấp khả năng liên kết với các phần mềm CSDL khác. Chương trình này sẽ tập trung giới thiệu các cấu trúc dữ liệu chính là cấu trúc phân nhánh, chia nhỏ và cấu trúc mạng. Ngoài ra, các dữ liệu thuộc tính phi không gian trong mối liên hệ với các thuộc tính không gian cũng được đề cập đến. Cấu trúc dữ liệu không gian là sự tổ chức tư liệu không gian dưới một khuôn dạng phù hợp với máy tính. Cấu trúc của dữ liệu phải được tổ chức để có sự liên hệ giữa các mô hình dữ liệu và các khuôn dạng (format) dữ liệu. Thực tế, giữa khái niệm mô hình và cấu trúc dữ liệu ít có sự phân biệt. Tuy nhiên khái niệm mô hình được sử dụng ở phạm vi nguyên lý từ khái quát đến cụ thể, còn cấu trúc là khái niệm mang tính chất kỹ thuật và minh hoạ một cách hệ thống về bản chất và sự liên hệ giữa các thành phần của CSDL.
Cấu trúc của dữ liệu Raster được sử dụng rộng rãi trong hệ xử lý ảnh và xử lý TTDL - raster, còn cấu trúc của dữ liệu vertor được sử dụng nhiều trong các hệ CAD (Computer Aided Decizion - Máy tính thiết kế trợ giúp), hoặc trong HTTĐL vertor với những khả năng mạnh về bản đồ. Trong thực tế áp dụng nhiều HTTD có cả hai hệ thống cấu trúc dạng Raster và Vertor để có thể sử dụng một cách linh hoạt và giao diện với nhau để đáp ứng cho những nhiệm vụ cần giải quyết. Những sự giao diện đó được thể hiện cụ thể với việc xử lý một hệ thống dữ liệu mẫu điểm là: có bảng thuộc tính về tính chất và toạ độ các điểm, có khả năng nội suy thuộc tính mẫu thành các file Raster; có khả năng tạo file vertor và contour của các trường thuộc tính đã được nội suy; có khả năng tạo các mặt phẳng hình học và các mô hình không gian với dữ liệu Raster hoặc Vertor. Tuy nhiên do không phải là những HTTĐL chuyên đề mà các HTTĐL tổng hợp thường có một số ưu thế và những hạn chế nhất định.
II.5.2.Cấu trúc dữ liệu Raster
Raster được hiểu là ô hình vuông có kích thước nhất định gọi là cell hoặc pixell (picture element), cấu trúc Raster là cấu trúc hình ảnh. Mỗi ô vuông có chứa thông tin về một đối tượng hay một sự hợp phần của đối tượng. Vị trí của đối tượng được xác định bởi vị trí của các ô vuông theo trật tự hàng và cột. Cấu trúc dữ liệu Raster đơn giản nhất là cấu trúc dạng bảng, ở đó có chứa các thông tin về toạ độ và thuộc tính phi không gian. Thông tin về vị trí được thể hiện ở toạ độ theo hàng và cột, tính theo trật tự sắp xếp của dữ liệu. Trường hợp có nhiều tính chất thì có thể gọi là thông tin nhiều chiều. Bảng thuộc tính hai chiều của đối tượng được gọi là bảng một chiều hay còn gọi là bảng thuộc tính Raster mở rộng (expanded Raster table). Cấu trúc Raster đầy đủ là cấu trúc có đầy đủ số lượng các pixell sắp xếp theo những vị trí xác định. Cấu trúc Raster rất tiện lợicho việc áp dụng các chức nằng xử lý không gian dựa trên nguyên tắc chồng xếp thông tin nhiều lớp. Các đặc điểm không gian là có thông tin về địa lý, nghĩa là chúng có thể được trình bày trên bất cứ một bản đồ nào của một hệ toạ độ đã biết. Cấu trúc Raster yêu cầu mỗi một đặc điểm phải được trình bày thành dạng đơn vị hình ảnh (picture elemarts pixel). Trong trường hợp này một bản đồ được phân chia thành nhiều pixels, mỗi pixel có vị trí theo hàng và cột. Một điểm nhỏ nhất được trình bày bởi một pixel đơn lẻ và nó chiếm một diện tích bằng kích thước của một pixel.
Hình 3. Một đường có thể tổ chức trong cấu trúc Vector (A) và Raster (B)
Một đường trong cấu trúc Raster là một loạt cácpixel nối với nhau và một polygon là một đám (cluster) của các pixel có cùng một giá trị.
Sau đây là những ưu điểm cơ bản của cấu trúc Raster:
Đơn giản và dễ tham khảo
Việc chồng xếp các lớp bản đồ được thực hiện một cách thuận tiện đưa đến kết quả.
Đối với mô hình không gian, các đơn vị địa lý được xác định trong cấu trúc Raster, bao gồm hình dạng và kích thước. Như vậy trong kết quả mối quan hệ giữa các pixel là ổn định và dễ dàng vẽ ra được.
Dễ thiết lập một bề mặt liên tục bằng phương pháp nội suy.
Đa số các tư liệu không gian thường được ghi ở dạng Raster như ảnh vệ tinh, ảnh máy bay chụp quét. Thông thường các tư liệu Raster đó dẽ dàng nhập trực tiếp mà không cần một sự thay đổi nào.
Những nhược điểm của cấu trúc dữ liệu Raster:
Tài liệu thường bị tình trạng quá tải, làm tốn nhiều phần của bộ nhớ trong máy tính. Trong rất nhiều trường hợp, các yếu tố bản đồ không nhất thiết phải được gắn thuộc tính (code hoá) thành các ô lưới đặc trưng. Trong cấu trúc dữ liệu Raster, những vùng rất rộng lớn có đặc điểm giống nhau được tồn tại một cách ngẫu nhiên với một giá trị nào đó và là tập hợp của rất nhiều ô lưới. Trong khi đó khi thể hiện về độ dốc thì ở vùng có độ dốc tương đối giống nhau, cấu trúc raster vẫn thể hiện sự khác nhau do kích thước của các pixel tạo nên đường gồ ghề.
Mối quan hệ về hình học giữa các yếu tố không gian thì khó vẽ và khó thiết lập được, ví dụ với hai bản đồ được xác định bằng hàng, cột thì mối liên hệ hình học giữa các đặc điểm của hai bản đồ đó là rất khó xác định.
Các bản đồ Raster thường thô và kém vẻ đẹp hơn so với bản đồ vẽ bằng đường nét thanh của cấu trúc Vector. Trong bản đồ Raster, các yếu tố đường, sông, … ranh giới thường được biểu hiện bằng các pixel nên có dạng răng cưa.
Việc chuyển đổi các thuộc tính không gian của cấu trúc Raster thì dễ bị nhiễu. Ví dụ một con đường khi quay đi một góc nào đó rồi quay lại đúng góc đó nhưng nó có thể bị biến đổi so với hình dạng ban đầu.
Đối với phân tích không gian, hạn chế nhất của cấu trúc Raster là độ chính xác thường thấp so với mong muốn (ví dụ khi tính độ day của một đoạn thẳng sai số thường lớn hơn so với đo trực tiếp). Đây là điều khó tránh khỏi vì kích thước tính được liên quan đến kích thước của các pixel và vị trí của một đoạn thẳng hay của một điểm cũng được xác định tuỳ thuộc kích thước của pixel.Đây cũng là một điểm cần lưu ý trong khi thể hiện bản đồ dạng Raster ( hình 4 )
Hình 4. Mô phỏng cách thể hiện các khoanh vi theo cấu trúc Raster
II.5.3.Cấu trúc dữ liệu dạng Vector
Như phàn trên đã giới thiệu,trong cấu trúc dữ liệu dạng Vector, các đối tượng không gianđược trình bày bằng một loạt các Vector. Trong khái niệm toán học, một Vector được thể hiện bằng một điểm xuất phát (starting point) với toạ độ X và Y đã cho, một hướng (direction) nghĩa là có một góc nào đó theo hướng đông, tây, nam, bắc và một độ dài (length). Một điểm được thể hiện bởi một Vector bị thoái hoá (degenerate) với cả hướng và độ dài của nó đều bằng 0. Trong trường hợp này điểm cũng không có cả diện tích.
Một đường được thể hiện bởi sự lặp lại của các Vector, mà các Vector này là các đoạn thẳng vì chiều rộng của các Vector cũng không được xác định nên về ý nghĩa không gian, đường chỉ có một kích thước, đó là độ dài.
Một polygon được thể hiện bở một loạt các Vector tạo nên một vùng khép kín và diện tích của vùng đó có thể đo được.
Hiình 5. cấu trúc dữ liệu vecter
Những ưu điểm của cấu trúc Vector:
ít trường hợp tư liệu bị đầy chặt bộ nhớ trong máy tính vì tổ chức dữ liệu Vector thường ở dạng nén, vì có thể chứa được một lượng dữ liệu Vector rất lớn trong tư liệu không gian.
Các đối tượng riêng biệt được thể hiện một cách rõ ràng và liên tục bằng những đường nét rõ ràng.
Các yếu tố không gian về mặt hình học thì dễ dàng được xác định.
Có độ chính xác cao trong việc tính toán và xử lý các yếu tố không gian.
Nhược điểm:
Nhược điểm lớn nhất của cấu trúc dữ liệu Vector là xử lý chồng xếp các lớp bản đồ rất khó thực hiện được, ngay cả những việc chồng xếp rất đơn giản của dữ liệu Raster.
Ví dụ: Để xác định một điểm nằm trong một polygon không thì ở cấu trúc Raster rất đơn giản khi biết vị trí của điểm theo hàng hay cột. Trong khi đó ở cấu trúc Vector thì phải có một sự tính toán rất phức tạp.
Hình bên trái dễ dàng xác định vị trí pixel B ở hàng 7 và cột số 8
hình bên phải các polygon A, B, C, D được xác định bởi một loạt các toạ độ XY
Hình 6. So sánh giữa cấu trúc Raster và Vector
Rất phức tạp. Để xác định một điểm có toạ độ 8,4 (theo toạ độ phẳng) (tương ứng với điểm B ở hình bên trái có toạ độ hàng 7 cột 8) thì việc tính toán là rất phức tạp mới xác định được điểm đó nằm ở polygon nào
.
II.6.Mô hình cấu trúc dữ liệu cung và điểm nút (arc-node)
Một mô hình dữ liệu là một cấu trúc cớ bản của dữ liệu được thiết kế để sao cho việc khai thác và xử lý là thuận tiện nhất.
Mô hình cung và điểm nút (are-node) là mô hình do cục thống kê của Mỹ thiết kế theo các file dữ liệu địa lý từ năm 1980. Trên cơ sở mô hình này, các đường phố và yếu tố dạng tuyến khác của nước Mỹ cũng được tổ chức theo hệ thống file dữ dạng có hai thuộc tính độc lập về cung và điểm nối (dual independence map encoding - DIME) (are-node Model- mô hình cung điểm nối). Theo mô hình này, các cung tạo nên phần lớn các đơn vị cơ bản trên bản đồ. Khái niệm về cung (area) ở đây khác với khái niệm về cung ở trong hội bản đồ của Mỹ quy định. ở đây mỗi một cung bao gồm hai điểm nút: điểm đầu và điểm cuối. Giữa các điểm nối và cung có thể không có hoặc có các giao điểm của các cung khác. Hình dạng và độ dài của cung được xác định bởi vị trí của các điểm nối và các giao điểm (vertice hoặc vertex). Một điểm nối khác với giao điểm về tính chất hình học. Cụ thể: một điểm nối thì có toạ độ x và y và thuộc tính hình học, còn giao điểm (vertex) thì chỉ có toạ độ x và y mà không có thuộc tính (hình 7)
Hình 7. Cấu trúc một polygon đơn giản trong mô hình cung và điểm nối
Trên hình 3 có 4 polygon 101, 102, 103 và 104, các polygon được xác định bởi 7 cung (are) từ 33-39. Mỗi cung có một điểm nối là điểm đầu và điểm cuối. Những cung thẳng là không có giao điểm còn những cung gấp khúc là có một hoặc nhiều giao điểm (vertex). Một điểm quan trọng cần lưu ý về mô hình cung - điểm nối là một cung luôn được xác định bởi một điểm nối.
Hướng của một cung được hiểu một cách đặc biệt trong thứ tự của các điểm nối, đó là điểm đầu và điểm cuối. Với một hướngđã biết thì hai phía (phải và trái) của cung cũng được xác định. Những thông tin về một cung bao gồm:
Thuộc tính (ID) của cung
Thuộc tính (ID) của điểm nối đầu
Thuộc tính (ID) của điểm nối cuối
Thuộc tính (ID) của polygon bên trái của cung
Toạ độ x, y của điểm nối đầu
Toạ độ x, y của điểm nối cuối
Toạ độ của tất cả giao điểm
Ngoài ra trường (field) bao gồm độ dài của một cung cũng được xác định.
Điểm nối có ý nghĩa về mặt hình học là nó thể hiện sự tiếp nối giữa hai yếu tố mô hình cung - điểm nối (area-node), một điểm được thể hiện bằng một yếu tố đường bị thiếu hụt (degenerate) với điểm nối đầu trùng lên điểm nối cuối và không có điểm giao cắt ở giữa.
Như vậy, một điểm được thể hiện bằng một điểm nối (node) vì điểm nối đầu và điểm nối cuối là giống nhau. Đối với polygon như đã nêu ở trên thì mỗi polygon là bao gồm tập hợp các cung và điểm nối. Để xác định mối quan hệ không gian của polygon thì mọi điểm giao cắt phải được xácđịnh bằng một điểm nối.
ưu thế cơ bản của mô hình cung cầu - điểm nối là luôn có thuộc tính không gian và như vậy mức độ chính xác sẽ rất cao, đồng thời dễ xác định được mối quan hệ không gian của các yếu tố. Ví dụ sự tiếp giáp của hai polygon hay pplygon này nằm trong polygon kia và cách đơn giản là xem ở bảng thống kê các cung mà chúng ta tạo nên 2 polygon đó. Trong bảng thống kê nếu có một cung nào đó là một phần của cả hai polygon thì 2 polygon đó là nằm liền kề nhau.
Phần mềm ERIS ARC/INFO là phần mềm điển hình có tổ chức vector theo mô hình cung- điểm nối và nó tự động tính và thống kê các thuộc tính của cung, điểm nối, từ đó dễ dàng cho việc tính toán và xử lý các mô hình không gian.
Trong ARC/INFO, có hai dạng bảng thống kêlà bảng thống kê thuộc tính của các polygon (polygon attribute table - PAT) và bảng thống kê thuộc tính của các cung are attribute table – AAT.
Bảng 1. bảng thuộc tính của polygon PAT
# - ID N0 Thuộc tính
Poly – ID Thuộc tính polygon
Perimeter
Chu vi
Area
Diện tích
1
0
8418
4,506
2
104
8596
2,078
3
102
4296
1,144
4
101
2233
0,301
5
103
4325
0,983
Bảng 2. Bảng thống kê thuộc tính của cung AAT
# - ID Thứ tự
Area- ID Thuộc tính cung
F-node điểm đầu
T- node điểm cuối
I- Poly. P bên trái
P-Poly. P bên phải
Length độ dài
1
38
3
1
2
1,1
51
2
33
4
3
5
1,0
40
3
35
4
1
3
2,1
50
4
37
2
2
4
2,2
33
5
36
1
5
2
4,1
20
6
39
5
3
2
1,0
93
7
34
4
5
1
2,1
93
Trên bảng PAT, mọi tính chất chi tiết của polygon đều được tính và thống kê, các chi tiết đó gọi là coverage.
Polygon thứ nhất (#-ID: 1)được gọi là polygone tổng hợp (universe polygone), nó thể hiện một vùng tổng hợp tất cả các polygon có bên trong và có diện tích được quy định là âm và có giá ttrị tuyệt đối bằng tổng diện tích của các polygon bên trong. Các polygon tiếp theo được gắn các thuộc tính và các giá trị: chu vi, diện tích mà được tính tự động khi các tính chất chi tiết được thiết lập.
Bảng AAT mỗi cung được xác định bởi cả số thứ tự và thuộc tính của cung, thuộc tính của điểm đầu, điểm cuối và thuộc tính của các polygone ở bên phải, bên trái của cung. Và các polygon này cũng chính là các polygone ở trong bảng PAT. Ví dụ: polygone số 3 trong bảng AAT có số thứ tự là 3 và thuộc tính là 102 t0 bảng PAT.
Cả 3 yếu tố quan trọng của vector về tính chất hình học (topology) là tính chất nối tiếp (adracency), tính chất chứa đựng (containment) và tính chất nối (conectivity) là những yếu tố rất quan trọng và là vấn đề cốt lõi của mô hình cung - điểm nối (are - node). Các yếu tố này sẽ giúp người phân tích xác định rõ được tính chất của các yếu tố trong bản đồ.
Ví dụ: để xác định hai polygon có tiếp giáp nhau hay không, người phân tích chỉ cần xem các cung xác định nên hai polygon đó, nếu có một cung nào cùng tính chất thì nó chính là vị trí tiếp giáp của hai polygon. Trong bảng TAB, hai polygon có số 102 và 103 được tiếp giáp nhau bởi cung số 33 trong bảng AAT.
Để xác định tính chất chứa đựng, cách xác định cũng như vậy. Muốn xác định polygon A được chứa bởi polygon B hay không thì trước hết phải xác định các cung tạo nên polygon A và thuộc tính của cả hai bên các cung, nếu như xác định thấy A luôn ở mọi phía của cung thì A nhất thiết phải được chứa trong B. Ví dụ cung số 37 trong hình 3 xác định nên polygon số 101, một phía của cung luôn là polygon số 104 thì nhất thiết polygon số 101 phải được chứa trong polygon số 104. Trong trường hợp một polygon lớn chứa nhiều polygon nhỏ bên trong cũng xác định một cách tương tự.
Tính chất tiếp nối của một cung được xác định từ thuộc tính của điểm đầu (F) và điểm cuối (T) trong bảng AAT. Hai cung được xem là nối trực tiếp một khi có chung điểm nối. Ví dụ trong bảng, cung 33, 38 và 39 là có chung một điểm nối số 3.F. Trong khi đó cung số 37 là không được nối với một điểm nào cả vì nó chỉ có một điểm nối riêng của nó (số 2) tạo nên polygon thứ 4 có thuộc tính là 101.
Ví dụ trên là ví dụ cho một sự ưu điểm của mô hình cung - điểm nối, nó xác định mối liên hệ hình học của các yếu tố và điều rất quan trọng trong xử lý không gian. Mặt khác, vị trí (toạ độ x, y) của mỗi một điểm nối, điểm giao cắt cũng được xác định. các thuộc tính đó cũng được thống kê rõ ràng trong bảng PAT và AAT giúp cho người phân tích dễ dàng xử lý các thông tin. Trong thực tế, các tư liệu không gian là rất phức tạp, mô hình are-node là công cụ hữu hiệu cho việc xử lý. Hiện nay các phần mềm ERSI-ARC/INFO và INTERGRAPH được xây dựng theo mô hình này, Trong khi đó, phần mềm MAP/ INFO không được xây dựng theo mô hình cung-điểm nên giao diện giữa chúng không tương thích.
Tóm lại: nội dung phần này nhằm giới thiệu tập trung vào tư liệu không gian, đó là cơ sở cho việc xử lý HTTĐL. Công việc thống kê thuần tuý thì không cần phải có các dữ liệu không gian, sự phân tích không gian thì lại rất cấn các thông số đó, đặc biệt là các thông số về địa lý và bản đồ.
Các đối tượng không gian có thể được trình bày dưới các dạng khac nhau là đường, điểm và polygon. Các yếu tố cơ bản của chúng cần được xác định đó là vị trí, thuộc tính và tính chất hình học.
Việc tổ chức các yếu tố này ở hai dạng cấu trúc Raster và polygon là khác nhau. Nhìn chung vị trí và thuộc tính thì được tổ chức tương đối giống nhau trongcả hai dạng cấu trúc dữ liệu, song tính chất không gian thì hết sức khác nhau.
Trong xử lý không gian, các thông tin quan trọng nhất về hình học và tính chất tiếp giáp, chứa đựng và nối tiếp, cấu trúc Raster có hạn chế cơ bản là không thể hiện được mối quan hệ không gian. Thay vào đó, cấu trúc Vector và đặc biệt là cấu trúc cung- điểm nối có ưu điểm là cung cấp đầy đủ các thông tin thuộc tính của điểm, đường và vùng nên nó giúp cho việc xử lý không gian được rõ ràng và hiệu quả.
II.7.Mô hình mạng (network model)
Trong mô hình mạng , các cung trở thành mạng được thể hiện trong mạng giao thông (đường sắt, đường bộ, đường không), mạng lưới điện , mạng thông tin , mạng ống gas, ống nước. Các điểm nối trở thành các điểm nối, điểm dừng hoặc điểm giữa của mạng giống như hệ thống chạc 3 hoặc hệ thống van một cổng dẫn.
Các điểm đó là nơi để dừng hoặc tiêp nhận các đối tượng hoặc đưa ra các đối tượng cần lưu thông , tương tự các điểm dừng xe, bến đổ, nơi chuyển tải.. Trung tâm của mạng là nơi chuyển tải nguồn cung cấp hoặc là nơi có những hoạt động có tính chất cung ứng cho mạng như: siêu thị, bệnh viện, sân bay, trường học… ở qui mô lớn hơn trung tâm có thể là cả một thành phố cung cấp , chuyển tải cho cả một vùng rộng lớn. Như vậy điểm liên hệ trong mạng là những đầu mối và các đường dẫn và mối liên hệ đó có hướng nhất định theo các điểm quay - đổi chiều. Tóm lại những tính chất như đường nối , điểm nối , các điểm dừng , các trung tâm và các điểm quay là những thông tin thuộc tính của mô hình mạng cơ sở dữ liệu vector. Còn một tính chất khác của mạng là sự cản trở (tương tự điện trở của mạch điện). Sự cản trở bởi khối lượng thông tin được truyền và thời gian truyền tải. Sự cản trở có liên quan đến nhiều yếu tố của mạng, đồng thời có liên quan đến cả năng lượng truyền. Trong mạng của HTTDL với dữ liệu vector , những yếu tố quan trọng ảnh hưởng đến sự liên kết trong mạng đó là yếu tố hình học và sự nối tiép. Ngoài ra các thuộc tính khác của đối tượng cũng phải được bố trí hợp lý cho từng mạng.
II.8.Chuyển đổi khuôn dạng dữ liệu
Trong xử lý HTTĐL, ngoài việc chuyển đổi khuôn dạng dữ liệu (format) với các phần mềm khác thì một trong những chức năng quan trọng cần thiết là chuyển đổi từ vector sang Raster và ngược lại. Chức năng này cho phép sử dụng một cách linh hoạt những lớp thông tin có sẵn trong CSDL hoặc các lớp thông tin mới tạo nên để đưa vào xử lý nhanh chóng trong hệ thống.
Chuyển đổi dữ liệu thanhf Raster (Raster hoá) (Rasterisation hay Rasterising) là quá trình chuyển đổi dữ liệu từ cơ sở pixel sang dạng vector. Công việc này rất cần thiết cho nhiều mục đích, Khi mà các đường contour của vector cần thiết được xử lý phối hợp với tài liệu Raster.
Để Raster hoá cần thiết phải tạo lưới với độ phân giải (kích thước pixel) thích hợp lên toàn bộ bản đồ và tính gia trị pixel bằng việc lựa chọn các vùng mẫu tại nơi giao nhau của các đường vector hoặc nơi tiếp giáp của các polygon, từ đó gắn giá trị các pixel tại nơi tiếp giáp, sao cho nó phân biệt hẳn với các pixel ở xung quanh. Nếu vector hoá với độ phân giải thấp thì sẽ làm giảm độ chính xác của bản đồ đôi khi làm rối các đường contour.
Nguyên nhân của việc làm rối, sai lệch các đường là do lựa chọn độ phân giải không thích hợp hoặc chọn vùng mẫu của lưới chưa đúng vị trí. Tuy nhiên, trong thực tế áp dụng các chức năng này đã có sẵn trong các phần mềm nên khi áp dụng người sử dụng ít phải can thiệp và khi cần thiết thì thao tác; quan trọng là xác định độ phân giải và vị trí các ô lưới.
Chuyển dữ liệu Raster thành vector (vector hoá) có nhiều phương pháp vector hoá. Công việc này chỉ thực hiện một khi tài liệu gốc có ở dạng Raster (ví dụ như ảnh vệ tinh hoặc các bản đồ nội suy) trong quá trình phân tích lại đòi hỏi ở dạng vector. Vector hoá chỉ thực hiện được một khi chiều rộng của dải pixel được xác định và có đường nối giữa các pixel đó với nhau. Vector hoá là một quá trình xử lý tỉ mỉ, nó đòi hỏi phải có sự xem xét và điều khiển quá trình xử lý, đặc biệt là ở những chổ tiếp nối. Trong quá trình hai việc phải làm là: tẩy sạch rìa của các đối tượng có chức năng tạo nên đường biên giới. Kết quả là các đối tượng này trông sắc nét dạng răng cưa vuông. Quá trình tẩy rửa được thực hiện theo chiều kim đồng hồ. Quá trình tẩy cũng cho phép bổ sung các toạ độ của các pixel một cách rõ ràng để phục vụ cho việc định vị các đường vector được lập.
Hình 8. chuyển đổi Raster và véctơ
Nối các pixel bằng đường chạy qua chúng. Đây là quá trình xử lý đơn giản giống như việc số hoá. Quá trình này được thực hiện lần lượt, khi gặp vị trí có sự chuyển thành nhiều hướng thì đó là các điểm. Quá trình này có sự can thiệp của người điều hành thì kết quả sẽ tốt hơn. Cũng cần lưu ý rằng chức năng vector hoá chỉ nên áp dụng một khi cần thiết.
Tóm lại, những phần trên này đã tập trung giới thiệu để cung cấp một cách nhìn rõ ràng về vấn đề cơ sở dữ liệu hình thành trong máy tính. Chúng ta cũng đã nêu khái quát những đặc điểm của hai dạng dữ liệu cơ bản là Raster và vector, đồng thời cũng giới thiệu về hai khái niệm quan trọng khác của HTTĐL là mạng và các bề mặt.
II.9. Nén dữ liệu
Do dữ liệu Raster thường chiếm khối lượng lớn nên cần thiết phải có các phương pháp nén dữ liệu .Có một số khái niệm nén số liệu phổ biến như sau
Mã hoá chạy theo dòng ( run lengh code)
Mã hoá theo chuỗi mắt xích ( chain codes)
Mã hoá theo khối ( bloch codes )
Mã hoá theo cách chia thành 4 ô nhỏ (quadtrees )
Nếu so sánh thì độ chính xác của dữ liệu vector cao hơn Raster. Tuy nhiên dù sao khái niệm độ chính xác của các đối tượng trong HTTĐL vẫn chỉ là tương đối. Trong quá trình xử lý theo mô hình không gian thì sự phối hợp giữa hai dạng tư liệu là điều cần thiết và là tất nhiên
Tóm tắt chung
Phần này đã tập trung giới thiệu để cung cấp một cách nhìn rõ ràng về vấn đề cơ sở dữ liệu hình thành trong máy tính. Trong đó, đã nêu khái quát những đặc điểm của hai dạng dữ liệu cơ bản là Raster và vector .Do dữ liệu Raster thường chiếm khối lượng lớn nên cần thiết phải có các phương pháp nén dữ liệu
Nếu so sánh thì độ chính xác của dữ liệu vector cao hơn Raster, tuy nhiên dù sao khái niệm độ chính xác của các đối tượng trong HTTDL vẫn chỉ là tương đối. Trong quá trình xử lý theo mô hình không gian thì sự phối hợp giữa hai dạng tư liệu là điều cần thiết và là tất nhiên.Thông thường , các mô hình xử lý tư liệu thường là không gian hai chiều hoặc 3 chiều. Trong tương lai, để theo dỏi diễn biến của các đối tượng thì phải xử lý theo đa thời gian và dự báo - đó là khái niệm về chiều không gian thứ 4 của mô hình xử lý HTTDL.
III.tính chất định lượng của phân tích không gian
Ba yếu tố của thông tin không gian là: vị trí, thuộc tính và tính chất hình học có những vai trò khác nhau trong phân tích không gian. Thông thường, những nghiên cứu đầu tiên là tập trung vào các thuộc tính của dữ liệu. Về sau, hướng cần nghiên cứu là thiết lập mô hình để giải thích sự phân bố của các hiện tượng hoặc các yếu tố tự nhiên trong mối quan hệ không gian nghĩa là phải xác định mối quan hệ về vị trí và thuộc tính của chúng.
Mỗi một yếu tố không gian đều chiếm một vị trí nhất định trên bề mặt trái đầt. Vì vậy muốn thể hiện một đối tượng nào đó lên bản đồ, nhất thiết phải được đặt trong một hệ thống toạ độ qui định. Độ chính xác của vị trí tuỳ thuộc vào hệ thống toạ độ sử dụng và phương thức tổ chức của các đối tượng lên bản đồ. Bên canh đó, việc xử lý không gian thường có tham khảo, sử dụng nhiều nguồn tư liệu với các hệ thống toạ độ khác nhau, vì vậy độ chính xác của xử lý còn tuỳ thuộc vào khả năng chuyển đổi giữa các hệ thống toạ độ đó.
Một số yêu cầu cơ bản về định lượng của việc phân tích không gian
Hệ thống toạ độ sử dụng phải tiện lợi cho quá trình tổ chức dữ liệu và xử lý HTTĐL. Khi xử lý nhiều nguồn dữ liệu với các hệ toạ độ khác nhau thì hệ thống phần mềm phải có khả năng chuyển đổi toạ độ một cách đa dạng.
Vì HTTĐL thường sử dụng nhiều nguồn tư liệu ở các hệ thống toạ độ khác nhau, phần mềm phải có khả năng thiết lập và chuyển đổi toạ độ vào hệ thống thường được sử dụng. HTTĐL phải cho phép những người sử dụng khác nhau có thể chuyển đổi toạ độ của dữ liệu nguồn về một hệ thống toạ độ chuyên để được sử dụng với từng chuyên ngành, khi đó phải có các hàm toán chuyển đổi tọa độ.
Việc đo đạc vị trí là bước đầu tiên của xử lý không gian và điều cốt yếu là phải thể hiện được vị trí của bất kỳ một đối tượng nào trong hệ thống toạ độ sử dụng sử dụng xác định hệ thống tọa độ là hết sức quan trọng vì nó giúp cho việc xác định tính chất và các thuộc tính về vị trí của dữ liệu.
Một trong những hệ thống toạ độ rất quan trọng cho việc xử lý không gian cũng như cho việc vẽ bản đồ là toạ độ lưới (grid system) và hệ thống này được chấp nhận một cách rộng rãi và có giá trị tham khảo cho toàn bộ các hệ toạ độ khác. Ngoài ra còn sử dụng hệ toạ dộ UTM (Universal Transverse Mercator projection).
III.1.hệ thống của toạ độ lưới-hay tọa độ địa lý
III.1.1. Toạ độ địa lý
Trong hệ thống toạ độ lưới, vị trí của một nơi trên bề mặt trái đất được xác định vào khoảng cách đến xích đạo và đường kinh tuyến chính. Phương Bắc địa lý (cực Bắc) được xác định là điểm cuối phía Bắc của trục quay trái đất và tương tự như vậy điểm Nam là điểm cuối trục quay trái đất. Xích đạo là nơi tập hợp các điểm tạo nên. là cơ sở để đo vị trí của các điểm ở hai hướng Đông và Tây. Nửa bán cầu phía đông của kinh tuyến chính, còn phần Tây bán cầu là ở phía Tây. Kinh độ của một điểm bất kỳ được đo bởi khoảng cách góc giữa xích đạo và điểm thứ hai tương ứng có cùng vĩ độ và nằm ở kinh tuyến chính.
Hình 9. các đường kinh tuyến, vĩ tuyến trong hệ toạ độ lưới
Việc xác định hướng Đông hay Tây tuỳ thuộc vào vị trí điểm nằm ở bán cầu nào. Vì kinh độ và vĩ độ được xác định trên cơ sở của hệ thống lưới và việc đo đạc được thực hiện trên hình cầu thay vì đo trên mặt phẳng. Như vậy, mỗi một ô được xác định bỏi một cặp kinh tuyến và một cặp vĩ tuyến với một bề mặt cong. Toạ độ dựa trên kinh độ và vĩ độ phải được chuyển đổi về một lưới chiếu bản đồ. Tóm lại lưới địa lý là lưới được chiều từ dạng mặt cầu lên một mặt phẳng để tạo lập nên bản đồ. Dưới dây là hai mối liên hệ quan trọng về mối quan hệ không gian của kinh độ và vĩ độ.
Khoảng cách 1o của vĩ độ được xem là hằng số mặc dù trong thực tế khoảng cách đó là khác nhau tuỳ thuộc vào vĩ độ. Trong khi đó khoảng cách 1o của kinh độ là khác nhau khi ở các vĩ tuyến khác nhau.
Khoảng cách 1o kinh độ là khác nhau so với khoảng cách 1o vĩ độ và khác nhau giữa hai điểm nằm cách nhau mặc dù ở trên cùng kinh tuyến. Do có sự không nhất quán trong việc đó giữa kinh độ và vĩ độ mà việc đo khoảng cách dựa theo kinh độ và vĩ độ không áp dụng chung được trong xử lý không gian.
Hệ thống lưới địa lý thường được dùng để tham khảo chung về vĩ trí trên bề mặt trái đấi: vì hệ thống này xác định ví trí trên bề mặt cầu hơn là trên bề mặt phẳng và một đặc điểm chính của hệ thống là sự khác biệt với việc thể hiển một vị trí với hai chiều. Do đó trong việc áp dụng chính xác thì vị trí phải được chuyển đổi về hệ thống toạ độ phẳng hai chiều. Ba vấn đề quan trọng trong việc thể hiện một hệ thống toạ độ là xác định hướng bản đồ, tỉ lệ bản đồ và lưới chiếu bản đồ.
III.1.2.Định hướng bản đồ
Khi đã xác định hệ thống toạ độ, công việc đầu tiên là định hướng bản đồ. Thông thường chỉ thị định hướng cho bản đồ là mũi tên chỉ hướng bắc. Đối với bản đồ địa chất của Mỹ, thông thường có 3 hướng Bắc. Hướng Bắc thực (đúng), hướng Bắc tư tưởng và hướng Bắc của lưới. Hướng Bắc thực là chỉ đúng về hướng cực Bắc của Trái đất. Hướng Bắc tư tưởng là xác định theo kim của nam châm. Hướng Bắc của lưới là đường thẳng đứng chỉ tới điểm cuối cùng của lưới chiếu ô (Grid). Thông thường, trục thẳng đứng của một hệ thống toạ độ chính là cùng với hướng Bắc của lưới. Vì vậy, hướng Bắc của lưới có thể khác nhau tại từng phần của Trái đất, nên đối với một hệ toạ độ khác thì cần hiểu rằng đó chỉ là hướng Bắc của hệ toạ độ mà thôi.
Tỉ lệ bản đồ: tỉ lệ bản đồ được xác định bằng tỉ số giữa một đơn vị độ dài trên bản đồ với khoảng cách thực, tương ứng trên thực tế bản đồ có thể xác định theo 3 cách: bằng lới thuyết minh, bằng toán học hoặc bằng biểu đồ.
Xác định bằng lời ,ví dụ : 1 cm bản đồ tương ứng với 1000m thực tế hay 1 cm = 1000m
Thể hiện bằng toán học ví dụ : tỉ lệ 1: 100 000 hay 1/100 000 nghĩa là 1 cm bản đồ tương ứng với 100 000 cm ngoài thực địa hay 1000 m
Thể hiện bằng đồ thị: đồ thị được biểu thị bằng một đoạn ngắn với một giá trị lớn, trong đó ta chia nhỏ thành từng đoạn ngắn với chữ số bên dưới. Một bản đồ tỉ lệ lớn tuỳ chiếm một diện tích nhỏ trong thực tế song mức độ chi tiết sẽ lại cao hơn so với bản đồ tỉ lệ nhỏ, nên khi xây dựng thước tỉ lệ ở bản đồ tỉ lệ phải lớn hơn so với bản đồ tỉ lệ nhỏ để thể hiện được nhiều chi tiết hơn.
Một số điểm chú ý
Trong xử lý không gian, ba cách thể hiện nói trên về tỉ lệ bản đồ là rất quan trọng.
Tỉ lệ bản đồ xác định mức độ chính xác về vị trí của tư liệu. Mức độ chính xác đó liên quan đến một loạt yếu tố khác như: độ chính xác của phần cứng của máy tính hay độ phân giải của các thiết bị nhập và xuất dữ liệu (nghĩa là độ phân giải của bàn số và máy in), độ chính xác của bản đồ nguồn, thiết kế của cơ sơ dữ liệu, độ phân giải của phần mềm (nghĩa là sự xác định về sai khác trong khái niệm, số nguyên hay điểm thị sai (floating point) hoặc mức độ chính xác của điểm thị sai là bậc 1 và 2.
Hình 10. Các yếu tố chính của trái đất
Vĩ tuyến là những vùng tròn bất kỳ trên bề mặt trái đất và song song với xích đạo. Như vậy số lượng vĩ tuyến là vô cùng mà mỗi điểm trên mặt đất đều rơi chính xác vào một điểm đó. Kinh tuyến là một vùng tròn tưởng tượng trên bề mặt trái đất và chia đôi quả đất thành hai phần bằng nhau và nó chạy qua cả cực Bắc và cực Nam của Trái đất. Như vậy số lượng kinh tuyến là vô cùng nhiều. Kinh tuyến và vĩ tuyến luôn vuông góc với nhau và góc giao của chúng luôn là 90o. Kinh tuyến chính được quy định một cách ngẫu nhiên là kinh tuyến đi qua đài quan trắc thiên văn Greenwich ở Anh.
Xích đạo được sử dụng như một đường vĩ tuyến cơ sở để xác định hai hướng Bắc và Nam và nó có giá trị là 0o. Vĩ độ của một điểm bất kỳ được đo bằng khoảng cách góc (angular distance) giữa điểm đó và xích đạo và nó xác định cho một góc giữa đường thẳng nối từ điểm đó tới tâm Trái đất và đường thẳng từ tâm Trái đất đến một điểm có cùng kinh độ và năm trên đường xích đạo. Như vậy một điểm nằm trên bán cầu phía Bắc mà có vĩ độ là 900 thì chính là điểm cực Bắc. Tương tự như vậy ở Nam bán cầu là điểm cực Nam của Trái đất. Kinh tuyến có giá trị 0 được sử dụng và những vấn đề khác. Tất cả sẽ trở nên bằng nhau khi mà độ chính xác về tư liệu vị trí là một hàm của tỉ lệ bản đồ. Nhìn chung, các bản đồ tỉ lệ lớn hơn thường có độ chính xác lớn hơn.
Tỉ lện bản đồ ảnh hưởng tới sự đo đạc của việc thống kê không gian do đó phải phân tích kỹ các kết quả thống kê.
Mặc dù tỉ lệ bản đồ thể hiện cho một bản đồ tiêu chuẩn, song trong thực tế thì tỉ lệ bản đồ lại khác nhau tuỳ thuộc vào vị trí của nó ỏ trong lưới chiếu. Ví dụ khoảng cách của hai điểm ở gần cực thì khác với khoảng cách của hai điểm đó nếu nó thuộc về vĩ độ cao hơn mặc dù trong bản đồ thì khoảng cách đó được thể hiện gần bằng nhau. Sự sai lệch đó sẽ ảnh hưởng nhiều khi thực hiện ở bản đồ tỉ lệ lớn, do vậy không thể sử dụng những dấu hiệu phân tích ở bản đồ nhỏ áp dụng cho bản đồ tỉ lệ lớn, do vậy không thể sử dụng nhưng dấu hiệu phân tích ở bản đồ nhỏ áp dụng cho bản đồ tỉ lệ lớn. Trong thực tế, để phân tích không gian cho nghiên cứu địa hình ở tỉ lệ nhỏ với một vùng rộng lớn thì những sai lệch của việc đo đạc có thể rất lớn và cần phải được cân nhắc khi xử lý
III.1.3.Các lưới chiếu bản đồ
Các phân tích không gian yêu cầu có sự chuyển đổi các đặc điểm trên bề mặt cầu của Trái đất thành hệ thống toạ độ hai chiều. Phép chiếu bản đồ cung cấp khả năng chuyển tư liệu vị trí từ mặt cầu sang bề mặt phát triển. Developed Surface và một bề mặt phát triển đó có thể được trình bày thành một bề mặt phẳng hoàn toàn. Mặc dù nều mặt cầu được chia thành rất nhiều mẩu nhỏ thì mỗi mảnh vẫn còn lưu giữ được phần cong của mặt cầu nguyên thuỷ. Do đó, nhiệm vụ của bản đồ học là chuyển đổi một cách hệ thống tài liệu vị trí từ mặt cầu sàng bề mặt phát triển.
Rất nhiều lưới chiếu bản đồ có khả năng đó, nhưng tất cả đều bị sai lệch ở một trong các yếu tố: hình dạng, diện tích, khoảng cách và hướng. Một lưới chiếu bản đồ tối ưu đối với một phép chiếu nào đó thì phụ thuộc vào việc có độ chính xác cần thiết và kích thước của vùng nghiên cứu (bản đồ). Ngoài ra còn một số yếu tố khác. Mỗi lưới chiếu có một quá trình chuyển đổi riêng và có những đặc điểm riêng. Có 4 phương pháp chiếu cơ bản là chiếu theo phương vị (azimuthal), chiếu hình trụ (cylindrical), chiếu hình nón và chiếu hình trụ giả (Psedu-cylindrical).
Lưới chiếu phương vị: có đặc điểm là sử dụng một nguốn sáng từ trung tâm hình cầu chiếu vào các đường kinh vĩ tuyến thì hình chiếu của kinh vĩ tuyến lên mặt phẳng nằm ngang vuông góc sẽ là lưới chiếu phương vị thông thường, hình chiếu đó là những vòng tròn đồgn tâm và các đường kính giao nhau tại tâm, nguồn sáng có thể là khác nhau tạo nên các lưới khác nhau và nếu khoảng cách nguồn sáng là xa vô cực thì lưới chiếu Bắc bán cầu và Nam bán cầu lên bề mặt tiếp tuyến là trùng nhau, khí đó gọi là "lưới chiếu phương vị tập thể" (Stereo graphic Projection).
Hình 11. Lưới chiếu phương vị
Hệ chiếu hình lăng trụ: là lưới chiếu để chuyển các đường kinh vĩ tuyến từ mặt cầu lên bề mặt một hình trụ đứng, hình trụ này phủ lên hình cầu với vùng tròn tiếp tuyến hoặc cắt qua hình cầu bởi những vòng tròn đồng tâm. Khi phát triển bề mặt hình trụ này thành mặt phẳng thì tạo nên một hệ toạ độ có 2 kích thước, khí đó bề mặt hình trụ chuyển thành hình chữ nhât.
Hình 12.Lưới chiếu hình trụ triển khai thành mặt phẳng với các ô hình chữ nhật
Hệ chiếu hình nón là hệ chiếu che phủ lên hình cầu hoặc cắt qua nó bởi một hình tháp nón chuyển thành dạng hình nón cụt (hình 13).
Hình 13. Triển khai của lưới chiếu hình trụ
Hệ lưới chiếu UTM (Universal Transverse Mecator) của Mỹ là sử dụng hệ lưới chiếu hình nón. Ngoài ra còn một hệ lưới chiếu khác gọi là hệ chiếu giả hình trụ, nó không thật sự lưới chiếu hình lăng trụ nhưng có cơ sở toán học tương tự như hệ chiếu hình lăng trụ.
Tóm lại: Các hệ chiếu bản đồ có 3 thuộc tính không gian cơ bản là: bằng nhau về diện tích vùng chiếu, sự nhất quán về lưới chiếu và các thuộc tính khác như góc, hình dạng và mối quan hệ của các yếu tố là ổn định.
Diện tích và quan hệ góc là những thuộc tính rất quan trọng của bản đồ. Song một lưới chiếu thì không đảm bảo được cả hai tính chất đó. Nghĩa là một hình chiếu có cùng diện tích thì luôn có quan hệ khác nhau về góc giữa các đối tượng và ngược lại nếu quan hệ về góc giống nhau thì diện tích lại khác nhau.
Về dạng khác của lưới chiếu là loại lưới chiếu tạo nên sự ổn định hoặc không ổn định về diện tích song thường có sự bố trí tương đối hợp lý giữa hai tính chất diện tích và quan hệ về góc. Sự bằng nhau và ổn định là hai thuộc tính có tính chất toàn cầu về lưới chiếu. Có một số lưới chiếu được áp dụng mang tính địa phương mà không áp dụng được cho mọi nơi trên một tờ bản đồ. Thông thường các lưới chiếu này áp dụng cho lập bản đồ tỉ lệ lớn tại một số vị trí cụ thể.
Một ví dụ khác là lưới chiếu phương vị với khoảng cách bằng nhau (azimural equidistant projection) thể hiện khoảng cách giữa một điểm ở trung tâm của lưới chiếu và các điểm khác trên bản đồ. Trong trường hợp này, các khoảng cách bằng nhau đó không thể áp dụng cho bất kỳ một cặp điểm nào khác mà phân bố theo nguyên tắc khác.
Hệ toạ độ lưới địa lý là không phải hệ Cartesian vì hai lý do sau: trước hết hệ toạ độ lưới là dựa theo bề mặt cầu và nó không phải là có hai kích thước (hai chiều).
Thứ hai, mặc dù kinh tuyến và vĩ tuyến là vuông góc với nhau nhưng khoảng cách từ kinh tuyến đến vị tuyến là luôn khác nhau. Nghĩa là khoảng cách 1o của kinh độ thì không phải là luôn bằng khoảng cách 1o của vĩ độ. Vì vậy hệ thống toạ độ lưới thường không phù hợp cho việc tạo lập toạ độ trong xử lý không gian. Trong khi đó, hệ thống toạ độ UTM (Universal Transver Mercator) lại được sử dụng rộng rãi trong HTTĐL do đó khắc phục được những hạn chế của hệ toạ độ lưới.
Hệ lưới chiếu UTM (Universal Transver Mercator)
Hệ lưới chiếu UTM có cơ sở là phép chiếu Mercator do cục địa chất Mỹ xây dựng đầu tiên cho một loạt các bản đồ ở vùng vĩ độ 7,5 phút, có phối hợp kiểm tra bằng hệ thống đo đạc nổi toàn năng theo cực (Universal Polar Stereographic - UPS)
Hệ lưới chiếu UTM (Universal Transverse Mecator) của Mỹ là sử dụng hệ lưới chiếu hình nón. Trong phép chiếu Mercator đã được dùng từ lâu trong hàng hải thì các đường tạo lưới có bản chạy dọc theo kinh tuyến. Vì độ lệch tăng dần theo khoảng cách đến kinh tuyến chuẩn. Phép chiếu Mercator chuyển đổi chỉ dùng có hiệu quả trong vùng gần với kinh tuyến chính. Vì vậy, toàn bộ trái đất được chia thành nhiều vùng hẹp thuộc phía Bắc và Nam. Trong mỗi vùng thì sự sai lệch về toạ độ là nhỏ nhất.
Theo nguyên tắc đó, hệ UTM được tổ chức thành các vùng tính từ Đông sang Tây, mỗi vùng rộng 6o theo kinh độ. Như vậy toàn bộ trái đất bao gồm 60 vung. Tỉ lệ được thể hiện dọc theo 2 kinh tuyến ở phía Đông và phía Tây của kinh tuyến. Trung tâm có độ ổn định là 0,966.
60 vùng của hệ UTM bắt đầu từ đường đánh dấu quốc tế International Date Line (IDL) hay là kinh độ 180o căn cứ vào đồ thị vùng thứ nhất (vùng 1) bao phủ một dải giữa kinh độ nghĩa hoàn hảo khi áp dụng trong một vùng (zone).
180W
174W
168W
162W
156W
84Bắc
80Nam
Xích đạo
Bắc
Nam
Hình 14. Hệ toạ độ UTM
Toạ độ của mỗi một vùng phải được tham khảo một cách độc lập. Ví dụ: toạ độ ở vùng 11 thì không thể dùng để tham khảo cho vùng 12 hay vùng khác. Khoảng cách hướng đông được xác định là khoảng cách từ đường trung tâm của vùng, có giá trị bằng với giá trị của trục nằm ngang trong hệ toạ độ Carsterian.
Đường trung tâm được thiết kế cho việc đo chuẩn về hướng Đông là 500 000m. Với đó, các điểm nằm trong vùng đều giá trị dương. Nếu khoảng cách 1 điểm về hướng Tây lớn hơn 500 000 mét so với đường trung tâm thì điểm đó phải thuộc về vùng kế tiếp. Một giá trị hướng đông nếu nhỏ hơn 500 000 mét thì nó thể hiện một vị trí ở phía Tây của đường trung tâm. Toàn bộ các trường hợp, giá trị hướng đông đều là dương và nhỏ hơn 1 000 000 mét, vì cùng một vùng. Nói cách khác, chiều dài nằm ngang thực tế của một vùng là rộng nhất ở vùng xích đạo và nó trở nên rất hẹp khi chuyển dần về phía cực.
Khoảng cách hưởng Bắc: được đo theo hướng Bắc - Nam, nó có giá trị bằng trục Y (thẳng đứng) trong toạ độ Castersian. Tại bán cầu Bắc, xích đạo được xác định là đường 0m. Toàn bộ các vị trí trên bán cầu Bắc sẽ có giá trị là khoảng cách về hướng Bắc bằng khoảng cách đến xích đạo, ở bán cầu Nam, cực Nam được xác định là có giá trị khoảng cách về hướng Bắc là 0 và xích đạo có giá trị hướng Bắc là 10 000 000 mét
Hệ toạ độ UTM thực tế về bản chất là hệ Castersian vì đơn vị mét là đơn vị tiêu chuẩn để đo. Nói tóm lại: một đơn vị khoảng cách trên trục X thì bằng một đơn vị khoảng cách trên trục Y và khoảng cách về hướng Đông và khoảng cách về hướng Bắc được đo theo hai hướng vuông góc với nhau. Tất nhiên, có một hạn chế chính của hệ UTM là nó không thể áp dụng cho những vùng cắt chéo nghĩa là một khi diện tích nghiên cứu lại nằm ở hai vùng khác nhau thì hệ UTM nhất thiết phải được chuyển sang hệ lưới chiếu khác để phân tích.
Phần lớn các phần mềm GIS đều có chức năng toạ và chuyển đổi hệ lưới chiếu và hệ lưới chiếu GRID được dùng rộng rãi để thể hiện bề mặt trái đất, người phân tích có thể chuyển đổi hệ UTM của 2 vùng liền kề nhau sang kinh độ, vĩ độ của hệ lưới chiếu GRID. Trường hợp đó thì toàn bộ bản đồ lại phải được xử lý ở hệ toạ độ khác để phân tích về hệ GRID cũng không phải hệ Cartesian.
Một ưu điểm khác đặc biệt quan trọng của hệ UTM cho phân tích không gian theo tỉ lệ của địa hình là các vùng của UTM được tổ chức theo hình chữ nhật mặc dù trong thực tế nó không phải là hình chữ nhật. Nguyên nhân là do khoảng cách Đông - Tây là khác nhau và đoạn dài của 1o kinh độ luôn khác nhau từ chỗ này sang chỗ khác. Về tập thể, hệ UTM là chỉ có hiệu quả ở trong dải từ 81o Bắc đến 84o Nam. Ngoài vùng đó thì hệ chiếu cực toàn năng lập thể được sử dụng thay cho UTM. Một điểm lưu ý là toạ độ của vùng cắt chéo thì không thể sử dụng chung được.
Hệ toạ độ phẳng quốc gia:
Hệ toạ độ phẳng quốc gia thường được xây dựng để dùng riêng cho mỗi quốc gia. Hệ toạ độ phẳng được dùng như một tài liệu lịch sử để quản lý đất đai. Hệ toạ độ này không thích hợp cho việc nghiên cứu mang tính khuvực hoặc một vùng rộng lớn vì trong thực tế, mỗi quốc gia lại sử dụng một hệ lưới chiếu riêng. Các nước nằm theo hướng Đông - Tây thì hãy sử dụng hệ lưới chiếu chuyển đổi Mercator, trong khi đó các nước năm theo hướng Nam Bắc lại so dung how lei chiếu hình nón khối Lambert. Mỗi nước lại chia thành nhiều vùng nhỏ để giảm thiểu những sai số ưu thế của hệ toạ độ phảng quốc gia là sử dụng đơn vị đo riêng. Ví dụ ở Mỹ và Anh thì dùng foot (hay feet), inch (1 foot = 12 inch, 1 yard = 3 feet, 1 mile = 5280 feet).
Nhiều nước thì sử dụng hệ mét vì hệ đơn vị này thông dụng hơn khi đo khoảng cách. Tuy nhiên, đo đạc để lập hệ toạ độ phẳng quốc gia đôi khi gây nhiều khó khăn cho xử lý không gian ở tỉ lệ khu vực. Lý do không chỉ vì sự chuyển đổi các đơn vị đó mà việc chuyển hệ toạ độ từ hệ lưới chiếu này sang hệ lưới chiếu khác đòi hởi những quá trình tính toán phức tạp, đặc biệt là trong trường hợp các vị trí khác nhau lại được xác định theo các hệ toạ độ khác nhau.
III.4.Các phép đo đạc cơ bản về các đối tượng không gian
III.4.1.Đo đạc các giá trị thuộc tính
Với việc thành lập một hệ toạ độ, mỗi đối tượng điểm cần phải được trình bày bởi một cặp giá trị toạ độ x và y. Để tiện sử dụng, trong phần này Pi được trình bày cho điểm thứ i trong một thuộc tính (coverage) và vị trí của một điểm được xác định bởi (xi, yi). Đối tượng đường: được thể hiện bằng trật tự của các điểm. Trong lập bản đồ số, các đường cong được chia nhỏ thành hàng loạt các đoạn thẳng. Tính chất của đường cong sẽ phụ thuộc vào số lượng điểm, nghĩa là phụ thuộc vào số lượng đoạn thẳng được chia ra. Khi số lượng đoạn thẳng tăng lên thì đường sẽ gần giống đường cong hơn. Một đường thẳng được xác định bởi hai điểm nối đầu và cuỗi. Như vậy, một đường Li được trình bày bởi một loạt các điểm PiS nghĩa là Li (P1, P2, P3… Pn) với n là số lượng điểm xác định lên đường Li. Một vùng cũng được trình bày bằng cách tương tự với các đường là tập hợp các đoạn segment thẳng. Trong trường hợp đó thì một đường tròn không thể quan niệm là một vòng tròn. Thay vào đó đường tròn là tập hợp rất nhiều đoạn thẳng bằng nhau và chúng tạo nên một vùng có hinhf dạng là tròn. Căn cứ vào đó, một Polygon Gi được trình bày dưới dạng là Gi (L1, L2, … Lm) với m là số lượng đoạn thẳng được chia ra để tạo nên polygon.
Một khi các đối tượng không gian được xác định thì việc đo đạc hình học cơ bản được áp dụng để thực hiện việc đo đạc và tính toán.
Khoảng cách giữa hai điểm trong bề mặt Cartesian (bề mặt thuỷ chuẩn) được xác định bởi khoảng cachs Ơclit (Euclidean Distance). Hình vẽ sau minh hoạ cho việc tính khoảng cách giữa hai điểm có toạ độ là (1,4) và (4,2).
Y
0
X
1
2
3
4
1
2
3
4
P1(1,4)
P2(4,2)
D1,2
Hình 15. Đoạn thẳng segment (D1,2) được xác định bởi hai điểm đầu và cuối
Khoảng cách Ơclit là khoảng cách của một đoạn thẳng nối giữa hai điểm trên một mặt phẳng. Trong thực tế, việc đo đạc có thể được thực hiện bằng cách khác. Ví dụ: một phép đo được gọi là đo khoảng cách Manbattan với ý nghĩa như: "khoảng cách khối phố - city block distance), ở đó áp dụng hệ toạ độ lưới Grid tương tự như các khối phố. Khi đó khoảng cách Manbattan được tính theo công thức:
Di,j = (Xi - Xj) - (Yi - Yj)
Diện tích của rất nhiều vùng nhỏ tạo nên một polygon thì có thể được tính bằng việc lập một đa giác (trapezoid) từ tất cả các đoàn thẳng đó rồi tính tập hợp cho diện tích của cả polygon.
Hình 16. Tính diện tích một polygon theo phương pháp đa giác (trapezoid)
Polygon trên tạo nên từ 7 điểm và 7 đoạn thẳng. Mỗi đoạn thẳng được xác định bởi hai điểm (điểm nối hoặc điểm giao cắt). Mỗi đoạn thẳng có hai đường thẳng song song với trục Y để xác định các giá trị X cho từng điểm. Sẽ có các hình thang (đa giác) được tạo nên bởi các đường thẳng song song đó, đoạn segment và đoạn hình chiếu của chúng trên trục X, khi đó:
ở đây: Aij: diện tích hình thang
i, j là điểm thứ i và j
Khi áp dụng công thức này và tính cộng dồn chiều kim đồng hồ ta sẽ được điện tích của polygon (lưu ý khi tính diện tích của các hình thang xác định bởi các đoạn P7 - P1, P1 - P2, P2 - P3 và P3 - P4 sẽ có giá trị dương và diện tích tạo bởi các đoạn P4 - P5, P5 - P6, P6 - P7 sẽ có giá trị âm và tổng của tất cả các diện tích 7 hình thang sẽ cho diện tích của polygon G (P1 ... P7).
Tương tự như vậy, nếu ta vẽ tạo thành các tam giác cho toàn bộ các đoạn segment và đưa về hệ toạ độ ban đầu rồi tính tổng diện tích các tam giác thì kết quả cũng là diện tích của cả polygon. Hai phương pháp đều có độ chính xác tương tự như nhau
III.4.2.Đo đạc các tính chất của thuộc tính
Trong cả việc lập bản đồ số và phân tích định hướng của các hiện tượng và đối tượng không gian thì các đối tượng (hoặc đơn vị địa lý) đều phải được định lượng hoá và được xử lý theo các giá trị đo đạc. Việc đo các dữ liệu thuộc tính phụ thuộc vào tính chất mà có thể đánh giá được và khả năng tài liệu cho phép. Việc đo đạc các tài liệu thuộc tính được chia ra các mức sau: có tồn tại trên danh nghĩa (niminal), thông thường (ordinal), khoảng cách biệt (interval) và tỉ số (ratio).
Đo đạc các mức độ (levels)
Đo mức độ danh nghĩa (normal): là sự đo đạc về tính chất và chủng loại. Ví dụ: tên đất nước sinh ra, màu, nơi sinh, địa bàn có quyền bầu cử (ví dụ ở Mỹ). Tính chất này chỉ mang tính chất đặt tên theo thứ tự mà không có thuộc tính nào về khoảng cách hay về bản chất. Ví dụ: thứ tự đặt tên theo vần ABC nghĩa là A tốt hơn B. Cách đặt tên có thể là theo vần hoặc theo thứ tự. Trong trường hợp đặt tên theo số thứ tự thì giá trị số đó không thể được dùng để tính toán.
Đo mức độ thứ hạng (ordinal): là xác định ý nghĩa trong khái niệm của một trật tự mà ở đó mỗi một chỉ tiêu có giá trị đồng nhất khi so sánh với các chỉ tiêu khác. Ví dụ: một người nào đó có thể nằm trong trật tự phân chia về nghề nghiệp hoặc vị trí xã hội như: công nhân, trí thức, nông dân ... tầng lớp nghèo, trung bình hay giàu (về mức độ thu nhập). Trong trường hợp đó, tầng lớp trung bình phải ở thứ hạng cao hơn nghèo và thấp hơn giàu.
Khi áp dụng đo đạc mức độ thứ hạng có thể xác định thuộc tính (code) theo a b c hoặc theo trật tự số, nhưng mức độ của sự khác biệt giữa các thứ hạng thì không được làm rõ về định lượng. Vì vậy, trật tự các số hạng không thể dùng để tính toán về mặt toán học mà chỉ xác định về mối quan hệ. Ví dụ : bảng độ cứng của các khoáng vật hay cấp bão, cấp động đất là các minh hoạ tương đối rõ của sự đo đạc và phân chia về số hạng.
Đo khoảng cách biệt (interval)
Việc đo đạc khoảng cách biệt là xác định về trật tự và khoảng cách giữa các chỉ tiêu, khoảng cách giữa các chỉ tiêu là ổn định và bằng nhau về đơn vị. Ví dụ điển hình của sự phân chia này là thang nhiệt độ Census (cả nhiệt độ Ken vin). Trong đó, khoảng khác giữa 50o và 49o là bằng với khoảng khác nhau giữa 49o và 48o. (Tất nhiên 50o thì không có khái niệm là ấm hơn 25o hai lần).
Một tính chất khác nhau trong việc đo khoảng cách biệt là không có giá trị của điểm khởi đầu. Ví dụ: 0oC là xác định nhiệt độ của điểm đóng băng nhưng không có nghĩa là ở 0oC là hết nhiệt.
Nói tóm lại, việc đo khoảng cách biệt cho pháp xác định sự khác nhau giữa các hiện tượng nhưng không có nghĩa về sự khác biệt biên độ (ví dụ, bão cấp 2 không có nghĩa là mạnh hơn gấp 2 lần bão cấp 6 hay kim cuong (độ cứng 10) không có nghiã là cứng hơn thạch cao (độ cứng 2) là 5 lần.
Đo đạc tỷ số: đo đạc tỉ số thì đầy đủ tính chất của việc đo khoảng cách biệt, có thêm một thuộc tính là giá trị 0 được xác định bởi đồ thị. Ví dụ, khi đo khoảng cách tự nhiên, khoang cách 0 được hiểu là sẽ không có khoảng cách giữa hai đối tượng. Khoảng cách này được xác định rõ và một điểm giá trị 0 cũng có ý nghĩa tỷ số đã được tính. Cụ thể hơn về ý nghĩa đó là khi ta nói 10 km có khoảng cách gấp hai lần 5 km.
Một ví dụ khác là khi tính trọng số cho một đơn vị đo khi trọng số bằng 0 nghĩa là không có trọng số. Nó có ý nghĩa khi nói 10km3 nặng gấp 2 lần 5m 3 . Trong kinh tế, trọng số thể hiện cho sự thu nhập mặc dù đơn vị tiền tệ tính có thể khác nhau. Khi đó, định lượng về ý nghĩa hoàn toàn được xác định.
Đo đạc Sự hướng tâm và sự phân tán (central tendency and disperion): xác định sự hướng tâm hay phân tán là nội dung quan trọng nhất của xử lý thống kế các hiện tượng, trong thống kê, sự hướng tâm thể hiện một trường (trend) của sự phân bố. Trong khi đó, sự phân tán thể hiện độ phân tán so với mức phân bố (tendency) trung tâm.
Ví dụ khi tính toán tổng thu nhập khi so sánh giữa hai nhóm dân tộc giá trị trung bình là một giá trị thống kê ở mức hướng tâm giá trị đó có thể được sử dụng làm chỉ thị cho mức tổng thu nhập, từ đó có thể so sánh thu nhập của hai nhóm với nhau, khi đó mức độ phân tán cho biết giá trị trung bình.
Với những giá trị khác nhau đo được ở tỷ lệ thông dụng, sự hướng tâm được xác định bởi giá trị mode, đó là lớp giá trị có tần số phân bố cao nhất. Ví dụ: một khu vực có 3 dân tộc sinh sống là đân tộc A chiếm 30%, dân tộc chiếm 60% và dân tộc C chiếm 10%. Trường hợp đó, mode của khu vực là B vì có số dân đông nhất. Trong trường hợp đó mode thể hiện sự hướng tâm cũng là B nếu như sự phân bố là ngẫu nhiên, tần số của mode nhóm được xác định là f mode và sự phân tán ở tỷ lệ đo thông dụng được tính bởi tỷ số khác biệt (variation ration).
V = 1 - (f mode/N)
ở đây: V là tỷ số khác biệt
N là tổng số phân bố
Giá trị nhỏ hơn của sự phân tán thể hiện cho trường hợp hướng tâm nhiều và mode là chỉ thị tốt hơn cho trường phân bố. Nếu như một nhóm dân tộc chiếm nhiều hơn 80% tổng số dân trong vùng thì tỷ số sự khác biệt là 0,2. Nếu dân tộc chiếm đa số song cũng chỉ đạt 80% tổng số dân thì trường hợp đó tỉ số phân tán là 0,6.
Mức tập trung của việc đo sự khác biệt về thứ hạng được tính bởi giá trị trung bình, đó là trường hợp có sự tập trung ở giữa (nghĩa là có một số giá trị cao hơn hoặc thấp hơn giá trị trung bình). Vì sự khác biệt được đo ở tỷ lệ về thứ hạng nên toàn bộ các trường hợp có thể phân bố dạng phân nhánh, có nhấnh nằm ở thứ hạng cao hoặc tháp hơn giá trị trung bình. Trường hợp đó giá trị trung bình sẽ rơi chính xác vào khoảng giữa của tập hợp. Ví dụ nếu có 15 người lớn thược về nhánh đi xuống ở một tầng lớp trong xã hội thì trường hợp thứ 8 là thuộc về giá trị trung bình của vùng phân bố này. Khi đó giá trị trung bình cho biết một điều là nếu có một người thuộc về thứ hạng cao hơn thì có thể vẫn thuộc về thì có thể vẫn thuộc về tầng lớp đó hoặc cao hơn. Còn những người ở thấp hơn thứ hạng thì vẫn có thể thuộc về tầng lớp đó hoặc ở thấp hơn.
Sự phân tán của sự khác biệt về thứ hạng được tính theo tỷ lệ thập phân, với sự khác biệt giá trị giữa định và đáy của phân vị thứ 10. Ví dụ: điều tra sự phân tán về ưu thế cuộc sống của 50 thành phố, thứ hạng khác biệt xây dựng theo tỉ lệ từ 1 -10, khi đó 10 sẽ là ưu thế cao nhất. Nếu như có 5 thành phố có ưu thế nhất thì nó có thể nằm ở thứ hạng là 8 thuộc về phần đỉnh của thứ hạng 1 - 10, còn lại là 45 thành phố sẽ nằm ở phần đáy của thứ hạng và có giá trị là 3, và như vậy sự khác biệt (phân tán) sẽ là 5 (khác biệt giữa 3 và 5). Ngược lại, việc điều tra cho thấy có 5 thành phố thuộc về thứ hạng 6, còn lại 45 thành phố thuộc thứ hạng 4 thì sự phân tán chỉ là 2. Nói tóm lại, giá trị thứ hạng của sự khác biệt là thể hiện mức độ của sự khác biệt và thứ hạng đó được dùng ở tỷ lệ thập phân.
Sự tập trung của cả việc đo về khoảng khác biệt (interval) hay tỉ số (ratio) đều được tính toán theo giá trị trung bình:
ở đây: Zi là trường hợp phân bố thứ i trong vùng phân bố.
Si là tổng các giá trị Z trong vùng phân bố
N tổng các phân bố
Sự phân tán so với giá trị trung bình được tính bằng độ khác biệt hay phương sai (variance) hay độ lệch tiêu chuẩn (Standard Deviation).
ở đây: s là phương sai
S là độ lệch chuẩn
Độ lệch chuẩn lớn hơn thì sự phân tán cũng cao hơn còn nếu độ lệch nhỏ thì sự tập trung cao hơn.
Trong nhiều trường hợp, giá trị trung bình và độ lệch tiêu chuẩn của nhiều phép đo có thể không thích hớp cho việc xử lý các hiện tượng không gian khi mà trọng số không gian cần được tính đến. Ví dụ, trong một phân bố mà các đơn vị địa lý khác nhau về kích thước thì giá trị trung bình chỉ là chỉ thị tốt cho yếu tố kích thước là có trọng số rất lớn. Trong trường hợp này, sự tập trung có thể được tính toán theo khái niệm giá trị trung bình được điều chỉnh theo vùng (area - adjusted mean):
ở đây: Ai là vùng của đơn vị thứ i, và độ lệch điều chỉnh theo vùng được tính như sau:
Sự hướng tâm và phân tán là các thông số cơ bản nhất của việc thống kê để mô tả một sự phân bố cuả bất kỳ một hiện tượng không gian nào. Chúng cũng được dùng để so sánh các mẫu không gian của sự phân bố các yếu tố khác nhau với mục đích phân biệt sự khác nhau ảnh hưởng đến mỗi yếu tố. Sự thống kê mang tính mô tả cũng được sử dụng để phân tích sự thay đổi trong việc phân bố của một hiện tượng để hiểu tốt hơn và phân tích được rõ ràng những sự sắp xếp phân bố không gian.
Ví dụ sau thể hiện sự phân bố không gian của 3 loài chim với sự hướng tâm và phân tán khác nhau. Sự phân bố là ở kích thước giống nhau và hình dạng địa lý giống nhau. Như vậy, sự phân bố được tổ chức thành ô lưới với kích thước 5 x 5 ô. Các ô đánh dấu đen là có sự phân bố chim, còn ô trắng là không có. Sự hướng tâm thể hiện vị trí tập trung trung bình của các loài.
Hình 17. Ví dụ về sự phân bố không gian
Nhóm A xuất hiện tập trung ở góc trên bên trái. Giá trị trung bình tính toán của toạ độ x và y là (2,2), còn nhóm B và C có giá trị trung bình ở toạ độ là (3,3). Như vậy nhóm chim A có sự hướng tâm khác với nhóm B và C, còn nhóm B và C có sự hướng tâm giống nhau. Độ lệch của sự phân bố không gian được tính bằng độ lệch tiêu chuẩn. Nhóm A và B tuy có sự hướng tâm khác nhau nhưng lại có độ lệch tiêu chuẩn với toạ độ của x và y là 0.83 và 0.83. Nói cách khác, phương thức hai nhóm A và B là có sự phân tán quanh giá trị trung bình giống nhau. Còn nhóm C, mặc dù có cùng giá trị hướng tâm với nhóm B song có sự phân tán rộng hơn, vì khi tính độ lệch chuẩn của nhóm C với x và y là 1.63 và 1.63. Giá trị đó thể hiện sự phân tán của nhóm C bằng hai lần của 2 nhóm kia. Nói cách khác, nếu giá trị độ lệch lớn thì phương thức phân bố là kém tập trung xung quanh trung tâm.
Tóm lại, phần này giải thích và trình bày cách tính định lượng các giá trị về vị trí và thuộc tính của các đối tượng không gian. Trong thực tế bản đồ là sự thể hiện 2 chiều và vị trí của bất kỳ một đối tượng nào cũng được xác định bằng cặp toạ độ x và y. Tuy nhiên việc chuyển vị trí từ hình cầu với 3 kích thước sang mặt phẳng nằm ngang có 2 kích thước luôn luôn là vấn đề gặp sai số trong việc xử lý phép chiếu. Các phân tích không gian nhất thiết phải chú ý đến các tính chất của phương pháp chiếu được sử dụng trong những dữ liệu gốc. Các giá trị toạ độ luôn khác nhau giữa các hệ thống toạ độ, ở Mỹ và một số nước Tây âu hay sử dụng hệ lưới chiếu UTM hay Gausse. Một khi hệ toạ độ được chọn chuẩn xác thì mọi phép tính trong xử lý không gian có thể được áp dụng bằng các phép toán trong các phần mềm GIS (ví dụ tính độ dài, diện tích polygon).
Để bổ sung cho việc đo đạc tư liệu về vị trí các phân tích không gian yêu cầu việc xử lý các dữ liệu thứ hạng và dạng tỉ số. Viêc thống kê giá trị hướng tâm và phân tán phải căn cứ vào tỉ lệ đo đạc hay trả lời với các câu hỏi khác nhau. Giá trị hướng tâm và phân tán được xử lý bằng mode và tỉ số.
Bài tập
Đổi vị trí của một điểm ở vĩ độ 45o Bắc và kinh độ 171o Tây sang hệ toạ độ UTM với giả thiết Trái đất là hình cầu thực.
Mô tả hệ toạ độ UTM cho một điểm góc toạ độ 496 000 m hướng Đông, 20 000 m hướng Bắc, vùng 5 có sử dụng phốip hợp kinh độ, vĩ độ và mét.
Dùng phương pháp hình thang tính diện tích của Polygon dưới đây (hoặc vẽ tay).
Tính toạ độ x, y cho các điểm nối tạo nên Polygon.
Tính độ dài của mỗi segment và chu vi của Polygon.
IV.Điều khiển các lớp thông tin
Điều khiển một hệ thông tin không gian là một chức năng cực kỳ quan trọng của HTTĐL, vì nó thiết kế dữ liệu ở một khuôn dạng thích hợp cho việc tình bày bản đồ và phân tích không gian. Trong việc điều khiển HTTĐL có hai phương thức chính (categories) là: điều khiển một lớp thông tin và điều khiển lớp thông tin. Điều khiển một lớp là xử lý các thông tin của một lớp trong một thời gian, còn điều khiển nhiều lớp là xử lý thông tin của nhiều lớp một cách đồng thời. Theo kinh nghiêm áp dụng thì hai phương thức này được xử lý hầu như độc lập với nhau. Phần lớn các áp dụng của HTTĐL đều xử lý thông tin một lớp trước rồi mới thực hiện điều khiển (xử lý) cho nhiều lớp. Vì vậy, để tiện cho việc áp dụng hai phương thức này sẽ lần lượt được trình bày riêng.
IV.1.Điều khiển thông tin một lớp
Điều khiển thông tin một lớp được gọi là điều khiển theo phương thức nằm ngang (horizontal operation) với ý nghĩa là chỉ có một lớp tư liệu và xử lý tư liệu chỉ theo phương thức nằm ngang hay hai chiều mà thôi. Tuy nhiên, việc điều khiển này cũng sẽ được trình bày ở chương tiếp theo. Trong điều khiển thông tin một lớp, tư liệu gôc được tổ chức ở dạng vector và mỗi lớp bao gồm đặc điểm riêng của từng đối tượng. Ví dụ: toàn bộ các điểm được tổ chức thành một lớp riêng và nó không pha trộn với các thuộc tính của đường hoặc polygon. Như vậy, việc xử lý cũng chỉ được thực hiện ở chức năng xử lý nhiều lớp thôgn tin. Trong nội dung xử lý thông tin một lớp, có 3 loại chính là: điều khiển tích chất (Feature Manipulation); phân loại tính chất (Feature Classification); Lựa chọn tính chất (Feature Selection).
Điều khiển tính chất: có những việc chính là xử lý ranh giới và phân tích sự quan hệ gần nhau (proximity).
Lựa chọn tính chất: có nội dung là xác định tính chất thông qua xử lý đồ hoạ hay phân tích logic hoặc mô tả đặc điểm của các đối tượng được phân biệt.
Phân loại tính chất: lựa chọn và phân nhóm đối tượng theo tính chất với các chỉ tiêu thông kê.
Điều khiển tính chất (Feature Manipulation)
Điều khiển tính chất của một lớp thông tin bao gồm hai nội dung chính là xác định tương quan về ranh giới của các đối tượng có sự biến đổi. Trong một số trường hợp, sự thay đổi đó xác định nên các đối tượng mới.
Phân tích quan hệ gần gũi là xử lý để tạo nên các polygon mới trên cơ sở khoảng cách từ các đối tượng được lựa chọn trên bản đồ.
Điều khiển ranh giới (Boundary Operation)
Các công việc được thực hiện trong điều khiện ranh giới gồm có: cắt nhỏ (chipping), xoá (erasing), cập nhật (updating), chia đôi (spliting) và tẩy bỏ, xoá (dissolving), các thuật ngữ trên được dùng trong ARC/INFO. Đối với một số phần mềm khác, tên gọi của công việc (hay thuật ngữ) có thể khác đi.
Cắt nhỏ (SPLIT). Quá trình chia cắt nhỏ là việc tạo ra một tập hợp (coverage) mới, trong đó có chứa một phần của bản đồ ban đầu. Toàn bộ các tính chất của bản đồ ban đầu. Toàn bộ các tính chất của bản đồ năm trong một tập hợp các ranh giới được lưa chọn và lưu ở một tập hợp (converage) mới. Nói tóm lại, tập hợp mới là một phần của bản đồ gốc và được xác định bằng tính chất địa lý. Công việc này hay được thực hiện khi một phần của bản đồ được sử dụng trong phân tích. Ví dụ: mạng lưới giao thông của một vùng hay một tỉnh được tách từ mạng lưới giao thông của cả nước. Khi đó, công việc phải làm là tách tất cả những đường thuộc ranh giới khu vực nghiên cứu để tạo nên một lớp thông tin về đường của khu vực (hình 18).
Hình 18. Cắt nhỏ bản đồ gốc để tạo nên bản đồ mới với diện tích nhỏ hơn
Sơ đồ sau sẽ minh hoạ rõ hơn: converage ban đầu có 5 vùng. Nếu dùng SLIP để cắt ở giữa thì sẽ có một bản đồ mới với thuộc tính là một phần của bản đồ cũ
Khi sử dụng thì vòng tròn bên ngoài của b được sử dụng làm ranh giới cắt. Kết quả là tạo ra bản đồ C với một số thuộc tính của bản đồ A vẫn còn giữa nguyên song có diện tích được quy định bởi ranh giới cắt. Tóm lại, cắt lại việc copy một phần của bản đồ gôc để toạ nên một bản đồ mới
Xoá (ERASE): xoá là quá trình ngược lại với việc cắt. Xoá là công việc loại bỏ những phần mà công việc trung gian tạo nên (ví dụ việc cắt) là làm khôi phục lại những phần có thuộc tính của bản đồ gốc ở trong vùng đã được cắt ra sẽ bị xoá.
Hình 20. Ví dụ của việc xoá để tạo nên một coverage mới
Công việc xoá là rất có ích khi mà tính chất các vùng ở ngoài vùng phân tích cần vẽ lại như cũ hoặc ngược lại cần loại bỏ đi. Việc này cũng hữu ích khi có nhiều lỗi tập trung ở một vùng nào đó thì có thể xoá chúng đi để rồi chỉnh sửa lại. Các vùng cần xóa thường có hình dạng đều đặn hoặc không đều tuỳ người đều hành.
Cập nhật (update) hay bổ sung: Cập nhật là công việc thay đổi dữ liệu không gian trong một vùng nào đó của bản đồ với những thộc tính mới.
Gắn/ nối (append mapjoin): Việc gắn và giáp nối bản đồ là công việc tương tự, thay cho quá tách, chia bản đồ, đây là việc ghép nối các bản đồ thành một bản đồ lớn. Hai chức năng này hơi khác nhau một chút, tuỳ thuộc vào việc tổ chức dữ liệu. Sự khác biệt là việc giáp nối thì không tái tạo hay chia cắt thuộc tính hình học ở phần bản đồ kết quả. Quá trình gắn và giáp nối là ngược với quá trình chia đã nêu ở trên. Hình dưới đây là minh hoạ của quá trình gắn và giáp nối bản đồ.
Hình 22. 4 Bản đồ được ghép nối bằng chức năng gắn/ nối bản đồ
Trên hình vẽ 17, 4 bản đồ đất nguyên thuỷ có 4 thuộc tính (coverage) riêng. Khi gắn/ giáp nối, 4 bản đồ tạo thành một bản đồ lớn ở bên phải. Có một chức năng phụ phải thực hiện sau khi giáp nối là làm sạch, tẩy nước ranh giới không cần thiết ở bản đồ kết quả. Thông thường ở ARC/INFO, đó là chức năng dissolving.
Tẩy sạch (dissolving): chức năng tẩy là loại bỏ các ranh giới không cần thiết sau khi các bản đồ đã được giáp nội. Ngoài ra, chức năng này còn cho phép đặt tên lại các điểm nối giữa các đường với các giá trị thuộc tính xác định. Thông thường, chức năng này kiểm tra tất cả các đoạn thẳng để xác định xem các đoạn thẳng khi nối với nhau có cùng thuộc tính như yêu cầu hay không. Trong trường hợp hai polygon giáp nối là có cùng thuộc tính (ID) trong khi ở bản đồ kết quả có một segment ở giữa thì có thể loại bổ segment đó đi để giáp nối cả hai polygon đó với nhau.
a
a
a
a
b
b
b
b
b
c
c
Hình 23. Kết quả của việc tẩy sạch để tạo nên một coverage mới
ở hình bản đồ bên trái sau khi ghép nối còn có 7 polygon. Tuy nhiên thực tế chỉ có 3 loại đất là ABC, sau khi kiểm tra toàn bộ các segment thì loại bỏ các segmen grafi nối các polygon có cùng tên (cùng loại đất). Kết quả là các polygon A được ghép lại, các polygon B cũng được ghép. Bản đồ kết quả chỉ cò 4 polygon với 3 loại đất riêng biệt.
Đối với phân tích không gian, chức năng tẩy hay làm sạch hay được sử dụng để thiết lập các mô hình. Trong trường hợp đó, một mô hình được thiết lập để mô tả các mẫu không gian và hệ số đánh giá được sử dụng để hiệu chỉnh cho các đặc điểm không gian. Mỗi đối tượng được xác định với một giá trị thuộc tính phù hợp, căn cư vào hệ số đánh giá của mô hinh. Ranh giới giữa các đối trượng tiếp giáp nhau mà có cùng tính chất thì được tẩy đi để tạo nên một mẫu không gian mới. Chức năng tẩy sẽ được đề cập tiếp ở phần sau.
Loại bỏ (Eliminate): chức năng loại bỏ được áp dụng phổ biến trong trường hợp do lỗi của tư liệu có những đường không muốn được hình thành tạo nên nhiều đường nhỏ và nhiều polygon nhỏ vụn (Sliver polygons). Tình trạng có nhiều polygon nhỏ vụn thừa luôn xảy ra trong kết quả của việc chồng xếp các lớp bản đồ. Khi có 2 polygon chồng lên nhau, do qua trình số hoá mà hai mảng thuộc tính của hai lớp sẽ có xu hướng tạo nên nhiêu polygon nhỏ vụn.
Bản đồ ban đầu
Bản đồ sau khi loại bỏ
Hình 24. áp dụng chức năng loại bỏ để chỉnh sửa bản đồ.
Kết hợp : có thể kết hợp một hoặc nhiều đối tượng để tạo nên 1 coverage mới.
Tạo vùng đệm : tạo từ các đối tượng polygon: khi mở rộng, hai polygon (bên trái) sẽ tạo nên một polygon ở bên phải:
Hình 25. Tạo vùng đệm từ các đối tượng
Trong việc tạo vùng đệm chiều rộng của vùng đệm có thể tạo khác nhau cho từng điểm, đường ,polygon với các mức khác nhau song cũng có thể là tạo tất cả giống nhau (nghĩa là cùng một chiều rộng). Ví dụ: khi nghiên cứu sự ô nhiễm không khí, vùng mở rộng tính từ nguồn là một hàm của mức độ ô nhiễm tính từ mỗi nguồn điểm. Trong trường hợp này, chiều rộng của vùng bị ô nhiễm sẽ có cá mức khác nhau tuỳ theo mức ô nhiễm.
Lợi ích của việc tạo vùng đệm trong phân tích không gian là tạo nên các vùng có cùng khoảng cách với một đối tượng lựa chọn. Chức năng này rất có ích cho việc phân tích mối quan hệ về sự phân bố và tác động giũa các đối tượng không gian.
Ví dụ, giả sử muốn nghiên cứu sự tương quan giữa các giá trị và khoảng cách của mạng lưới giao thông huyết mạch (chính) thì khoảng cách của từng chỗ đến đường giao thông gần nhất cần phải được xác định (hình)
Trong hình, các vùng có cùng khoảng cách tới đường giao thông chính được vạch ra. Phương pháp này có thể áp dụng cho việc định giá đất tính từ đường giao thông chính quy hoạch tưới tiêu tính từ sông hoặc để tính các vùng kế cận nhau.
Hình 26. Tạo các vùng đệm với các khoảng cách khác nhau
Phân tích sự gần gũi (Proximity analysis)
Phân tích sự gần gũi là công việc dựa vào cơ sở về khoảng cách của các điểm lựa chon. Tạo một vùng mở rộng của một đối tượng, thông thường được hiểu là việc tạo vùng đệm (buffer operation). Việc tạo vùng đệm có thể thực hiện cho rất nhiều kiểu đối tượng, bao gồm cả điểm, đường và polygon. Vì quá trình tạo vùng đệm là sự mở rộng về diện tích nên kết quả luôn tạo thành các đối tượng polygon.
Figure 27. Kết quả phân tích sự gần gũi
Trong quá trình tạo vùng đệm, nếu có nhiều mức với nhiều khoảng cách khác nhau tính từ một đối tượng, thì ranh giới giữa các mức sẽ được vạch ra hay là tạo nên các đường đẳng giá trị (isolines)
Một kiểu phân tích sự gần gũi khác là tạo nên các polygon Thiessen - hay cũng gọi là các polygon gần nhất. Các polygon Thiessen được tạo từ một loạt điểm và các polygon được tao ra chia khu vực thành các vùng phụ (tương tự như phụ lưu vực trong thuỷ văn). Mỗi một phụ vùng đó thì phần bên trong là gần gũi với điểm đó hơn là so với điểm khác.
Hình 28. Kết quả phân tích sự gần gũ Thiessen i
Việc tạo lập các polygon thiessen có thể áp dụng cho nhiều nội dung nghiên cứu khác nhau, kể cả tự nhiên và xã hội. Trong kinh tế, ví dụ của hình là sự phân chia các vùng kinh tế, với trung tâm là các tụ điểm thương mại. Như vậy, các đường segment tạo nên nơi giáp nhau của các vùng nhỏ sẽ là nơi có khả năng buôn bán tốt.
Việc phân tích sự gần gũi có thể áp dụng cho điều hành nhiều lớp thông tin mà ở đó các khoảng cách khác nhau được tạo nên trong quá trình phân tích, áp dụng cụ thể sẽ được đề cập đến ở phần sau.
Phân biệt và lựa chọn (identification and selection): việc xử lý thông tin theo phương nằm ngang cũng cho phép sử dụng để phân biệt các đối tượng không gian trong một bản đồ hay một cơ sở dữ liệu. Trước hết, công việc này có thể thực hiện bằng việc xử lý sơ đồ tương tác, sau đó có thể áp dụng phương pháp xử lý logic với cơ sở dữ liệ
Các file đính kèm theo tài liệu này:
- Giao Trinh He Thong Thong Tin Dia Ly.doc