Tài liệu Đề tài Quản lý hệ thống cây xăng ứng dụng công nghệ GIS: ĐẶT VẤN ĐỀ
Ñ&Ð
Trong những thập kỷ gần đây, công nghệ thông tin phát triển nhanh chóng và có mặt ở hầu khắp các lĩnh vực khoa học và xã hội. Với ngành địa lý, thuật ngữ GIS hay hệ thống thông tin địa lý đã trở nên quen thuộc. Phân tích dữ liệu bản đồ bao gồm quá trình thu thập, lưu trữ, phân tích và kết xuất dữ liệu. Quá trình này trước đây thường được làm bằng tay, trên dữ liệu tương tự và sản phẩm tạo ra là bản đồ giấy. Tuy nhiên, vấn đề là dữ liệu được lấy từ rất nhiều nguồn khác nhau, tại các vị trí khác nhau do đó mà chúng thường có tỷ lệ và phép chiếu khác nhau. Để tổng hợp được nguồn dữ liệu này ta cần phải quy đổi chúng về cùng một tỷ lệ và phép chiếu. Công việc này tốn rất nhiều thời gian và tiền bạc mà độ chính xác lại không cao. Sự ra đời của GIS đã cho ta một cái nhìn khác về phân tích dữ liệu bản đồ. Các bản đồ giờ đây được số hoá và đặt trong một hệ toạ độ tiêu chuẩn, việc tổng hợp và quy đổi dữ liệu được thực hiện dễ dàng bằng các phần mềm chuyên dụng.
Cùng với tập ...
122 trang |
Chia sẻ: hunglv | Lượt xem: 1338 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Đề tài Quản lý hệ thống cây xăng ứng dụng công nghệ GIS, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
ĐẶT VẤN ĐỀ
Ñ&Ð
Trong những thập kỷ gần đây, công nghệ thông tin phát triển nhanh chóng và có mặt ở hầu khắp các lĩnh vực khoa học và xã hội. Với ngành địa lý, thuật ngữ GIS hay hệ thống thông tin địa lý đã trở nên quen thuộc. Phân tích dữ liệu bản đồ bao gồm quá trình thu thập, lưu trữ, phân tích và kết xuất dữ liệu. Quá trình này trước đây thường được làm bằng tay, trên dữ liệu tương tự và sản phẩm tạo ra là bản đồ giấy. Tuy nhiên, vấn đề là dữ liệu được lấy từ rất nhiều nguồn khác nhau, tại các vị trí khác nhau do đó mà chúng thường có tỷ lệ và phép chiếu khác nhau. Để tổng hợp được nguồn dữ liệu này ta cần phải quy đổi chúng về cùng một tỷ lệ và phép chiếu. Công việc này tốn rất nhiều thời gian và tiền bạc mà độ chính xác lại không cao. Sự ra đời của GIS đã cho ta một cái nhìn khác về phân tích dữ liệu bản đồ. Các bản đồ giờ đây được số hoá và đặt trong một hệ toạ độ tiêu chuẩn, việc tổng hợp và quy đổi dữ liệu được thực hiện dễ dàng bằng các phần mềm chuyên dụng.
Cùng với tập các tiến trình xử lý dữ liệu thô để sản sinh ra các thông tin có ích cho công tác lập quyết định, hệ thống thông tin địa lý đã được thiết kế để làm việc với dữ liệu quy chiếu hay toạ độ địa lý. Nhờ vào khả năng sử dụng dữ liệu không gian và phi không gian từ các nguồn khác nhau nên công nghệ GIS được ứng dụng trong rất nhiều lĩnh vực như quản lý hệ thống đường phố, quản lý giám sát tài nguyên, thiên nhiên môi trường, quản lý quy hoạch, quản lý thiết bị, phân tích tổng điều tra dân số, lập bản đồ các dịch vụ y tế, bưu điện… Đồng thời GIS cũng là sự hội tụ của các lĩnh vực công nghệ và các ngành truyền thống: địa lý, bản đồ, khoa học viễn thám, thống kê, khoa học máy tính, toán học… Nó hợp nhất các số liệu mang tính liên ngành bằng tổng hợp, mô hình hoá và phân tích. Vì vậy có thể nói, GIS được xây dựng trên các tri thức của nhiều ngành khoa học khác nhau để tạo ra ngành khoa học mới.
Một điểm mạnh của GIS so với các công nghệ trước đây là khả năng tích hợp dữ liệu không gian và dữ liệu thuộc tính (phi không gian) bên trong một hệ quản trị cơ sở dữ liệu quan hệ. Điều này giúp cho việc biểu diễn thông tin bản đồ linh động và trực quan hơn. Đặc biệt là khi những thông tin này được đưa lên mạng Internet.
Hiện nay, vấn đề giao thông luôn là vấn đề nóng bỏng của mọi quốc gia khiến cho thông tin về nó ngày càng quan trọng, đặc biệt là khi nước ta đang trong quá trình xây dựng cơ sở hạ tầng giao thông tốt nhằm phục vụ cho việc đi lại trong các thành phố và các địa điểm lân cận thêm thuận tiện. Do đó rất cần thiết phải có một hệ thống cung cấp thông tin về giao thông đến tất cả mọi người dân. ArcGIS là một công cụ mạnh mẽ, cho phép ta kết xuất dữ liệu bản đồ dưới dạng ảnh phục vụ cho việc truyền qua mạng, thực hiện các phép toán phân tích không gian cơ bản để từ đó xây dựng nên các chức năng tra cứu bản đồ có kết hợp yếu tố không gian và thuộc tính, điều mà các công nghệ khác không làm được. Qua quá trình tìm hiểu và nghiên cứu, em muốn áp dụng những kiến thức được học trên ghế nhà trường vào công việc cụ thể. Được sự hướng dẫn của thầy PGS.TS. Nguyễn Cảnh Lương, em đã quyết định chọn cho mình một đề tài nhỏ nhưng rất thực tế về vấn đề quản lý giao thông, đó là: “Quản lý hệ thống cây xăng ứng dụng công nghệ GIS”. Đề tài được xây dựng với mục đích đưa ra thông tin chính xác về vị trí các cây xăng thuộc địa bàn Hà Nội giúp cho người điều khiển phương tiện giao thông có thể xác định chính xác được phương hướng đến các trạm xăng một cách gần nhất và nhanh nhất, tiết kiệm thời gian và công sức cho người tham gia giao thông. Mặc dù có nhiều cố gắng nhưng đây chưa phải thưc sự là một web site hoàn thiện để đưa vào sử dụng vì web site chưa sử lý được nhiều chi tiết phức tạp. Vì đây là lần đầu tiên là em làm quen với công nghệ GIS, một công nghệ còn rất mới ở nước ta, khả năng bản thân còn hạn chế và thời lượng thực hiện có hạn, do vậy em không tránh khỏi những thiếu sót. Vì vậy em rất mong được sự góp ý của các thầy cô cùng các bạn để web site ngày càng hoàn thiện và có thể áp dụng trong tương lai.
Em xin chân thành cảm ơn thầy PGS.TS. Nguyễn Cảnh Lương và các thầy cô giáo trong khoa Toán - Tin Ứng Dụng đã tạo điều kiện cho em hoàn tất đề tài nghiên cứu này.
CHƯƠNG I
TỔNG QUAN VỀ GIS
I. KHÁI NIỆM GIS
GIS - Geographic Information System hay hệ thống thông tin địa lý được hình thành từ ba khái niệm địa lý, thông tin và hệ thống. Khái niệm “địa lý” liên quan đến các đặc trưng về không gian, vị trí. Các đặc trưng này ánh xạ trực tiếp đến các đối tượng trong không gian. Chúng có thể là vật lý, văn hoá, kinh tế, tự nhiên... Khái niệm “thông tin” đề cập đến phần dữ liệu được quản lý bởi GIS. Đó là các dữ liệu về thuộc tính và không gian của đối tượng. GIS có tính “hệ thống” tức là hệ thống GIS được xây dựng từ các module. Việc tạo module giúp thuận lợi trong việc quản lý và hợp nhất.
GIS là một hệ thống có ứng dụng rất lớn. Từ năm 1980 đến nay đã có rất nhiều các định nghĩa được đưa ra, tuy nhiên không có định nghĩa nào khái quát đầy đủ về GIS vì phần lớn chúng đều được xây dựng trên khía cạnh ứng dụng cụ thể trong từng lĩnh vực. Có ba định nghĩa được dùng nhiều nhất:
+ GIS là một hệ thống thông tin được thiết kế để làm việc với các dữ liệu trong một hệ toạ độ quy chiếu. GIS bao gồm một hệ cơ sở dữ liệu và các phương thức để thao tác với dữ liệu đó.
+ GIS là một hệ thống nhằm thu thập, lưu trữ, kiểm tra, tích hợp, thao tác, phân tích và hiển thị dữ liệu được quy chiếu cụ thể vào trái đất.
+ GIS là một chương trình máy tính hỗ trợ việc thu thập, lưu trữ, phân tích và hiển thị dữ liệu bản đồ.
1. Mô hình công nghệ
Một cách khái quát, có thể hiểu một hệ GIS như là một quá trình sau:
Dữ liệu vào
Quản lý dữ liệu
Xử lý dữ liệu
Phân tích và mô hình
Dữ liệu ra
Hình 1.1 Mô hình công nghệ GIS
+ Dữ liệu vào: dữ liệu được nhập từ các nguồn khác nhau như chuyển đổi giữa các cách biểu diễn dữ liệu, máy quét, hình ảnh từ vệ tinh, ảnh chụp…
+ Quản lý dữ liệu: sau khi dữ liệu được thu thập và tổng hợp, GIS cần cung cấp các thiết bị có thể lưu và bảo trì dữ liệu nhằm đảm bảo về bảo mật số liệu, tích hợp số liệu, lọc và đánh giá số liệu, khả năng duy trì. GIS lưu thông tin thế giới thực thành các tầng dữ liệu riêng biệt, các tầng này đặt trong cùng một hệ trục toạ độ và chúng có khả năng liên kết với nhau.
+ Xử lý dữ liệu: các thao tác xử lý dữ liệu được thực hiện để tạo ra thông tin. Nó giúp cho người sử dụng quyết định cần làm tiếp công việc gì. Kết quả của xử lý dữ liệu là tạo ra các ảnh, báo cáo và bản đồ.
+ Phân tích và mô hình: số liệu tổng hợp và chuyển đổi chỉ là một phần của GIS. Những yêu cầu tiếp theo là khả năng giải mã và phân tích về mặt định tính và định lượng thông tin đã thu thập.
+ Dữ liệu ra: một trong các phương diện công nghệ GIS là sự thay đổi của các phương pháp khác nhau trong đó thông tin có thể hiển thị khi nó được xử lý bằng GIS. Các phương pháp truyền thống là bảng và đồ thị có thể cung cấp bằng các bản đồ và ảnh 3 chiều.
2. Các lĩnh vực khoa học liên quan đến GIS
GIS là sự hội tụ các lĩnh vực công nghệ và các ngành truyền thống, nó hợp nhất các số liệu mang tính liên ngành bằng tổng hợp, mô hình hoá và phân tích. Vì vậy có thể nói GIS được xây dựng trên các tri thức của nhiều ngành khoa học khác nhau để tạo ra các hệ thống phục vụ mục đích cụ thể. Các ngành này bao gồm:
+ Ngành địa lý: là ngành liên quan mật thiết đến việc biểu diễn thế giới và vị trí của đối tượng trong thế giới. Nó có truyền thống lâu đời về phân tích không gian và nó cung cấp các kỹ thuật phân tích không gian khi nghiên cứu.
+ Ngành bản đồ: nguồn dữ liệu đầu vào chính của GIS là các bản đồ. Ngành bản đồ có truyền thống lâu đời trong việc thiết kế bản đồ, do vậy nó cũng là khuân mẫu quan trọng nhất của đầu ra GIS.
+ Công nghệ viễn thám: các ảnh vệ tinh và ảnh máy bay là nguồn dữ liệu địa lý quan trọng cho hệ GIS. Viễn thám bao gồm cả kỹ thuật thu thập và xử lý dữ liệu ở mọi vị trí trên quả địa cầu. Các dữ liệu đầu ra của hệ thống ảnh vệ tinh có thể được trộn với các lớp dữ liệu của GIS.
+ Ảnh máy bay: khi ta xây dựng bản đồ có tỷ lệ cao thì ảnh chụp từ máy bay là nguồn dữ liệu chính về bền mặt trái đất được sử dụng làm đầu vào.
+ Bản đồ địa hình: cung cấp dữ liệu có chất lượng cao về vị trí của ranh giới đất đai, nhà cửa…
+ Ngành thống kê: các kỹ thuật thống kê được sử dụng để phân tích dữ liệu GIS. Nó là đặc biệt quan trọng trong việc xác định sự phát sinh các lỗi hoặc tính không chắc chắn trong số liệu của GIS.
+ Khoa học tính toán: tự động thiết kế máy tính cung cấp kỹ thuật nhập, hiển thị biểu diễn dữ liệu. Đồ hoạ máy tính cung cấp công cụ để thể hiện, quản lý các đối tượng đồ hoạ. Quản trị cơ sở dữ liệu cho phép biểu diễn dữ liệu dưới dạng số, các thủ tục để thiết kế hệ thống, lưu trữ, xâm nhập, cập nhật.
+ Toán học: các ngành hình học, lý thuyết đồ thị được sử dụng trong thiết kế hệ GIS và phân tích dữ liệu không gian.
3. Một số ứng dụng
Công nghệ GIS ngày càng được sử dụng rộng rãi. GIS có khả năng sử dụng dữ liệu không gian và thuộc tính (phi không gian) từ các nguồn khác nhau khi thực hiện phân tích không gian để trả lời các câu hỏi của người sử dụng. Một số ứng dụng cụ thể của GIS thường thấy trong thực tế là:
+ Quản lý hệ thống đường phố bao gồm các chức năng: tìm kiếm toạ độ khi xác định được vị trí đường phố hoặc tìm vị trí khi biết trước toạ độ đường phố. Đường giao thông và sơ đồ; điều khiển đường đi, lập kế hoạch lưu thông xe cộ. Phân tích vị trí, chọn khu vực xây dựng các tiện ích như bãi đỗ xe, ga tàu xe… Lập kế hoạch phát triển giao thông.
+ Quản lý giám sát tài nguyên, thiên nhiên, môi trường bao gồm các chức năng: quản lý gió và sông ngòi, các nguồn nhân tạo, bình đồ lũ, vùng ngập úng, đất nông nghiệp, tầng ngập nước, rừng, vùng tự nhiên, phân tích tác động môi trường… Xác định ví trí chất thải độc hại. Mô hình hoá nước ngầm và đường ô nhiễm. Phân tích phân bố dân cư, quy hoạch tuyến tính.
+ Quản lý quy hoạch bao gồm các chức năng: phân vùng quy hoạch sử dụng đất. Các hiện trạng xu thế môi trường. Quản lý chất lượng nước.
+ Quản lý các thiết bị bao gồm các chức năng: xác định đường ống ngầm, cáp ngầm. Xác định tải trọng của lưới điện. Duy trì quy hoạch các thiết bị, sử dụng đường điện.
+ Phân tích tổng điều tra dân số, lập bản đồ các dịch vụ y tế, bưu điện và nhiều ứng dụng khác.
4. Các hệ thống tương tác
Các hệ thống xử lý số liệu: số liệu vào từ các bản đồ, ảnh hoặc đo đạc hiện trường cần được xử lý để đưa vào cơ sở dữ liệu số. Sau đó là quá trình lưu trữ số liệu, cách sử dụng, cập nhật…
Hệ phân tích dữ liệu: rút ra và phân tích, có thể đơn giản để đáp ứng yêu cầu hoặc các phân tích thống kê tổng hợp dữ liệu. Thông tin ra hay cách hiển thị kết quả có thể là bản đồ, bảng biểu và cũng có thể dùng để đưa vào một hệ dữ liệu số khác.
Hệ sử dụng thông tin: người dùng có thể là các nhà điều tra, quy hoạch, quản lý. Sự tương tác cần thiết giữa các nhóm GIS và người sử dụng để lập kế hoạch cho các thủ tục phân tích và hệ thống quản lý cấu trúc dữ liệu.
II. CÁC THÀNH PHẦN GIS
GIS bao gồm 5 thành phần:
- Con người
- Dữ liệu
- Phương pháp phân tích
- Phần cứng
- Phần mềm
Các thành phần này kết hợp với
nhau nhằm tự động quản lý và phân phối
Hình 1.2 Các thành phần của GIS
thông tin thông qua biểu diễn địa lý.
1. Con người
Con người là thành phần quan trọng nhất, là nhân tố thực hiện các thao tác điều hành sự hoạt động của hệ thống GIS.
+ Người dùng GIS: là những người sử dụng các phần mềm GIS để giải quyết các bài toán không gian theo mục đích của họ. Họ thường là những người được đào tạo tốt về lĩnh vực GIS hoặc là các chuyên gia.
+ Người xây dựng bản đồ: sử dụng các lớp bản đồ được lấy từ nhiều nguồn khác nhau, chỉnh sửa dữ liệu để tạo ra các bản đồ theo yêu cầu.
+ Người xuất bản: sử dụng phần mềm GIS để kết xuất ra bản đồ dưới nhiều định dạng xuất khác nhau.
+ Người phân tích: giải quyết các vấn đề như tìm kiếm, xác định vị trí…
+ Người xây dựng dữ liệu: là những người chuyên nhập dữ liệu bản đồ bằng các cách khác nhau như vẽ, chuyển đổi từ định dạng khác, truy nhập cơ sở dữ liệu…
+ Người quản trị cơ sở dữ liệu: quản lý cơ sở dữ liệu GIS và đảm bảo hệ thống vận hành tốt.
+ Người thiết kế cơ sở dữ liệu: xây dựng các mô hình dữ liệu vật lý và lôgic.
+ Người phát triển: xây dựng hoặc cải tạo các phần mềm GIS để đáp ứng các nhu cầu cụ thể.
2. Dữ liệu
Một cách tổng quát, người ta chia dữ liệu trong GIS thành 2 loại:
+ Dữ liệu không gian (spatial): cho ta biết kích thước vật lý và vị trí địa lý của các đối tượng trên bề mặt trái đất.
+ Dữ liệu thuộc tính (non-spatial): là các dữ liệu ở dạng văn bản cho ta biết thêm thông tin thuộc tính của đối tượng.
3. Phần cứng
Là các máy tính điện tử: PC, Mini Computer, MainFrame… là các thiết bị mạng cần thiết khi triển khai GIS trên môi trường mạng. GIS cũng đòi hỏi các thiết bị ngoại vi đặc biệt cho việc nhập và xuất dữ liệu như máy số hoá (digitizer), máy vẽ (plotter), máy quét (scanner)…
4. Phần mềm
Hệ thống phần mềm GIS rất đa dạng. Mỗi công ty xây dựng GIS đều có hệ phần mềm riêng của mình. Tuy nhiên, có một dạng phần mềm mà các công ty phải xây dựng là hệ quản trị cơ sở dữ liệu địa lý. Dạng phần mềm này nhằm mục đích nâng cao khả năng cho các phần mềm cơ sở dữ liệu thương mại trong việc sao lưu dữ liệu, định nghĩa bảng, quản lý các giao dịch do đó ta có thể lưu các dữ liệu đồ địa lý dưới dạng các đối tượng hình học trực tiếp trong các cột của bảng quan hệ và nhiều công việc khác.
III. CHỨC NĂNG GIS
Một hệ GIS phải đảm bảo được 6 chức năng cơ bản sau:
+ Capture: thu thập dữ liệu. Dữ liệu có thể lấy từ rất nhiều nguồn, có thể là bản đồ giấy, ảnh chụp, bản đồ số…
+ Store: lưu trữ. Dữ liệu có thể được lưu dưới dạng vector hay raster.
+ Query: truy vấn (tìm kiếm). Người dùng có thể truy vấn thông tin đồ hoạ hiển thị trên bản đồ.
+ Analyze: phân tích. Đây là chức năng hộ trợ việc ra quyết định của người dùng. Xác định những tình huống có thể xảy ra khi bản đồ có sự thay đổi.
+ Display: hiển thị. Hiển thị bản đồ.
+ Output: xuất dữ liệu. Hỗ trợ việc kết xuất dữ liệu bản đồ dưới nhiều định dạng: giấy in, Web, ảnh, file…
Xuất dữ liệu
Quan sát thực địa
Tài liệu, bản đồ giấy
Thu nhập dữ liệu
Dữ liệu thô
Lưu trữ
Phân tích
Truy vấn
Hiển thị
Dữ liệu có cấu trúc
VDU
Thiết bị ra
Cơ sở dữ liệu
Hình 1.3 Quan hệ giữa các nhóm chức năng của GIS
1. Thu thập dữ liệu
Thu thập dữ liệu là quá trình thu nhận dữ liệu theo khuân mẫu được áp dụng cho GIS. Mức độ đơn giản nhất của thu thập dữ liệu là chuyển đổi khuân dạng mẫu có sẵn từ bên ngoài. Trong trường hợp này, GIS phải có các tiện ích để hiểu được các khuân dạng mẫu dữ liệu chuẩn khác nhau để trao đổi. GIS còn phải có khả năng nhập các ảnh bản đồ. Trong thực tế, nhiều kỹ thuật trắc địa được áp dụng để thu thập dữ liệu thô, bao gồm thu thập dữ liệu về bề mặt trái đất như địa hình, địa chất học và thảm thực vật nhờ trắc địa đo đặc hay ảnh chụp từ vệ tinh, máy bay. Các dữ liệu như kinh tế - xã hội thu thập từ điều tra phỏng vấn hay chuyển đổi từ các bài tư liệu viết. Bản đồ vẽ bằng tay trên giấy phải được số hoá sang dạng raster. Việc sử dụng ảnh vệ tinh hay ảnh chụp từ máy bay được xem là nguồn dữ liệu quan trọng khi nghiên cứu tài nguyên thiên nhiên và đo vẽ bản đồ địa hình.
Đa số nguồn gốc thông tin không gian là các bản đồ in hay bản đồ dưới khuôn mẫu tương tự. Để các dữ liệu này được sử dụng trong GIS thì chúng cần được số hoá. Ở mức thủ công thì chỉ có thể số hoá các đặc trưng bản đồ và nhập thuộc tính mô tả các đặc trưng đó. Còn ở mức tự động hoá cao hơn là số hoá bản đồ bằng máy quét ảnh để phát sinh ảnh số bản đồ đầy đủ. Đầu ra của máy quét là ma trận của các giá trị điểm ảnh 2D, có thể được sử dụng cho công việc vector hoá để tạo ra bản đồ mã hoá dữ liệu, kiểm chứng và sửa lỗi để có được dữ liệu phù hợp.
Nói chung, công việc thu thập dữ liệu hay “làm dữ liệu bản đồ” là nhiệm vụ khó khăn và là quan trọng nhất khi xây dựng các ứng dụng GIS.
Quá trình thu thập dữ liệu luôn gắn liền với quá trình xử lý dữ liệu. Chúng ta có ba mô hình quan niệm của thông tin không gian là mô hình hướng đối tượng, mạng và bề mặt. Quá trình phân tích trên cơ sở các cách nhìn khác nhau đòi hỏi dữ liệu phải được biểu diễn và tổ chức cho phù hợp. Vì vậy cần cung cấp phương tiện cho người sử dụng GIS thay đổi cấu trúc dữ liệu để thích nghi với các yêu cầu khác nhau. Điều này đòi hỏi cần phải có các chức năng thay đổi cách biểu diễn, thay đổi phân lớp, làm đơn giản hoá hay tổng quát hoá dữ liệu, biến đổi giữa hệ thống trục toạ độ khác nhau và biến đổi các phép chiếu bản đồ. Các thao tác này được xem là tiền phân tích không gian. Mức độ xử lý dữ liệu thô khác nhau phụ thuộc vào mục đích của ứng dụng GIS.
Một số công cụ phân tích của GIS phụ thuộc chặt chẽ vào các mô hình dữ liệu raster, do đó nó đòi hỏi quá trình biến đổi mô hình dữ liệu vector sang dữ liệu raster, quá trình này được gọi là raster hoá. Một số công cụ phân tích khác lại làm việc chủ yếu với mô hình vector, nên đòi hỏi quá trình biến đổi ngược từ raster sang vector, hay còn gọi là vector hoá. Raster hoá là quá trình phân tích đường (line) hay miền (polygon) thành các điểm ảnh (pixel). Ngược lại, vector hoá là quá trình tập hợp các điểm ảnh để tạo thành đường hay miền. Dữ liệu ban đầu của ta thông thường là dưới dạng raster nên nếu dữ liệu không có cấu trúc tốt thì việc nhận dạng mẫu sẽ rất phức tạp.
Khi so sánh dữ liệu từ các nguồn khác nhau, vấn đề thường nảy sinh là sử dụng hai hay nhiều phân lớp để mã hoá cho cùng hiện tượng. Để nhận ra các khía cạnh khác nhau của hiện tượng với mức độ chi tiết khác nhau, cần phải có tiến trình xấp xỉ hoá để biển đổi về cùng một phân lớp.
Trong việc tích hợp dữ liệu bản đồ, vấn đề nảy sinh là hệ thống toạ độ của chúng được đo, vẽ trên cơ sở nhiều phép chiếu bản đồ khác nhau. Các dữ liệu này không thể tích hợp trên cùng bản đồ nếu không biển đổi chúng về cùng một hệ trục toạ độ.
2. Lưu trữ và truy cập dữ liệu
Lưu trữ dữ liệu liên quan đến tạo lập cơ sở dữ liệu không gian (đồ hoạ, bản đồ). Nội dung của cơ sở dữ liệu này có thể bao gồm tổ hợp dữ liệu vector hoặc dữ liệu raster hoặc cả hai, dữ liệu thuộc tính để nhận diện hiện tượng tham chiếu không gian. Thông thường dữ liệu thuộc tính của GIS trên cơ sở đối tượng được lưu trong bảng, chúng chứa khoá chính là một chỉ danh duy nhất tương ứng với đối tượng không gian, kèm theo nhiều mục dữ liệu thuộc tính khác. Chỉ danh đối tượng không gian duy nhất được dùng để liên kết giữa dữ liệu thuộc tính và dữ liệu không gian tương ứng. Trong bảng thuộc tính cũng có thể bao gồm cả giá trị không gian như độ dài đường, diện tích vùng mà chúng đã được dẫn xuất từ biểu diễn dữ liệu hình học.
Với dữ liệu raster thì các tệp thuộc tính thông thường chứa dữ liệu liên quan đến lớp hiện tượng tự nhiên thay cho các đối tượng rời rạc. Việc lựa chọn mô hình raster hay mô hình vector để tổ chức dữ liệu không gian được thực hiện khi thu thập dữ liệu vì mỗi mô hình tương ứng với các tiếp cận khác nhau. Thông thường cơ sở dữ liệu GIS cho khả năng quản trị cả hai mô hình không gian nói trên, khi xây dựng cơ sở dữ liệu không gian thì nhất thiết phải liên kết bảng dữ liệu liên quan đến hiện tượng tương ứng.
Theo thuật ngữ của hệ quản trị cơ sở dữ liệu thì các mô hình vector và raster được xem như những thí dụ của mô hình quan niệm. Chúng mô tả các quan niệm liên quan đến ứng dụng thế giới thực được biểu diễn trong cơ sở dữ liệu. Các mô hình quan niệm được mô tả theo nhiều cấp bậc trừu tượng, trong đó các mô hình vector và raster là ở mức trừu tượng thấp nhất. Chúng gần với biểu diễn dữ liệu máy tính hơn các mô hình trên cơ sở dữ liệu đối tượng, mạng và bề mặt. Khái niệm mô hình dữ liệu lôgic được sử dụng để đề cập đến cách mà hệ quản trị cơ sở dữ liệu tổ chức mô hình quan niệm thành tệp, bản ghi, chỉ số. Ngày nay, công nghệ cơ sở dữ liệu truyền thống không còn thích hợp với việc quản lý dữ liệu địa lý. Một số hệ GIS được sử dụng rộng rãi đã xây dựng cơ sở dữ liệu trên cơ sở tổ hợp mô hình quan hệ quản lý thuộc tính phi hình học và lựợc đồ chuyên dụng, phi quan hệ để lưu trữ, xử lý dữ liệu không gian. Một vài GIS khác đã lợi dụng các phương tiện của lược đồ lưu trữ cơ sở dữ liệu quan hệ để quản lý cả hai loại dữ liệu hình học và phi hình học. Phương tiện truy nhập trong cơ sở dữ liệu GIS bao gồm cả phương tiện có sẵn của cơ sở dữ liệu quan hệ chuẩn và khả năng xây dựng câu hỏi truy vấn để tìm thông tin mà giá trị của chúng bằng hoặc nằm trong khoảng xác định. Đặc tính đặc biệt theo vị trí đối với hệ toạ độ nào đó và theo các quan hệ không gian. Do nhu cầu khai thác thông tin trên cơ sở dữ liệu không gian thường bao gồm phương pháp chỉ số không gian đặc biệt. Câu hỏi không gian thường là tìm ra đối tượng nằm trong hay trên các biên của cửa sổ hình chữ nhật. Khai thác dữ liệu trên cơ sở vị trí hay quan hệ không gian được xem như là nền tảng của thâm nhập cơ sở dữ liệu GIS.
3. Tìm kiếm và phân tích dữ liệu không gian
Đây là chức năng đóng vai trò rất quan trọng trong GIS. Nó tạo nên sức mạnh thực sự của GIS so với các phương pháp khác. Tìm kiếm và phân tích dữ liệu không gian giúp tìm ra những đối tượng đồ hoạ theo các điều kiện đặt ra hay hỗ trợ việc ra quyết định của người dùng GIS.
Có rất nhiều các phương pháp tìm kiếm và phân tích dữ liệu không gian, các phương pháp khác nhau thường tạo ra các ứng dụng GIS khác nhau. Sau đây là một số phương pháp được dùng phổ biến nhất:
Buffer (tìm kiếm dữ liệu trong vùng không gian): Buffer hay còn gọi là truy vấn không gian trên cơ sở các quan hệ không gian giữa các đối tượng. Các quan hệ này thông thường nói lên vị trí tương đối của đối tượng này với đối tượng kia. Phương pháp buffer được chia làm nhiều loại (phép toán) khác nhau, nhưng cách thức xử lý thì luôn tuân theo các bước cơ bản sau đây:
+ Chọn ra một hay nhiều đối tượng trên bản đồ, gọi là các đối tượng gốc.
+ Áp dụng một quan hệ không gian để tìm ra các đối tượng khác mà có quan hệ đặc biệt với các đối tượng gốc.
+ Hiển thị tập đối tượng tìm thấy cả trên dữ liệu không gian và thuộc tính.
Một số phép toán buffer thông dụng:
+ Tìm các đối tượng nằm bên trong các đối tượng khác: phép toán này xác định quan hệ “bao kín” giữa các đối tượng không gian. Đường thẳng bao gồm nhiều điểm, một đa giác (polygon) có thể bao gồm nhiều đường thẳng hoặc gồm các đa giác con khác.
+ Tìm các đối tượng cắt các đối tượng khác: phép toán này xác định các đối tượng có giao điểm hay nằm chồng lên các đối tượng khác. Hai đa giác giao nhau nếu chúng có một miền chung. Hai đường thẳng cắt nhau nếu chúng có một điểm chung. Một đường thẳng giao với một đa giác khi nó nằm một phần hay toàn bộ trong đa giác.
+ Tìm các đối tượng liền kề với các đối tượng khác: đây là kiểu tìm kiếm trong đó các đối tượng có chung đường bao (biên). Quan hệ này chỉ áp dụng cho đường thẳng hoặc đa giác.
+ Tìm các đối tượng nằm bên trong hoặc bên ngoài một khoảng cách xác định: kiểu tìm kiếm này được sử dụng trong việc xác định các đối tượng xung quanh một hay nhiều các điểm mốc. Quá trình thực hiện bao gồm việc tạo ra một vùng đệm quanh các điểm mốc này và sau đó xác định các đối tượng căn cứ vào vị trí của chúng so với vùng đệm tạo ra.
Một bài toán rất điển hình cho phương pháp buffer này là bài toán về “Nhà máy hoá chất và các bệnh viện”. Mục đích của bài toán là xác định các vị trí thuận tiện nhất trên bản đồ cho việc di dời các bệnh viện trong trường hợp nhà máy hoá chất gặp sự cố. Các nhà máy hoá chất và bệnh viện được biểu diễn trên bản đồ bằng các đối tượng điểm (points). Mỗi nhà máy bao gồm các thông tin chi tiết về loại hoá chất sản xuất và mức độ phát tán chất độc ra môi trường trong các điều kiện thời tiết khác nhau. Khi có sự cố, vùng nguy hiểm cần di dời sẽ được thể hiện trên bản đồ. Từ đó, chúng ta có thể biết được nên chuyển bệnh viện đến vùng nào là an toàn và thuận tiện nhất.
Hình 1.4 Buffer bên trong một vùng có bán kính xác định
Geocoding (tìm kiếm theo địa chỉ): một đối tượng trên bản đồ bao giờ cũng được biểu diễn bằng một kiểu dữ liệu đồ hoạ. Phần đồ hoạ này có thể thu được bằng cách số hoá hay quét ảnh bản đồ. Tuy nhiên, khi ta đã có bản đồ (bản đồ số), chúng ta cũng có thể xác định được phần đồ hoạ biểu diễn đối tượng hay là vị trí, hình dạng của đối tượng thông qua các dữ liệu mô tả vị trí của nó ví dụ: số nhà, tên đường, tên quận…
Geocoding (address matching) là một tiến trình nhằm xác định các đối tượng trên cơ sở mô tả vị trí của chúng. Đây là một kỹ thuật rất nổi tiếng, có mặt trong rất nhiều ứng dụng của GIS.
Người ta gọi một geocoding service là quá trình chuyển đổi toàn bộ mô tả thuộc tính về vị trí sang mô tả không gian.
Để tìm được vị trí thông qua địa chỉ, geocoding service phải tham chiếu đến ít nhất một nguồn dữ liệu bao gồm cả thông tin về địa chỉ (thuộc tính) và thông tin không gian (vị trí, hình dạng). Dữ liệu này được gọi là dữ liệu tham chiếu. Các gocoding service có thể thao tác trên nhiều kiểu dữ liệu tham chiếu khác nhau.
Sau khi đã geocoding dữ liệu tham chiếu (tức là ánh xạ mô tả thuộc tính vào mô tả không gian). Ta có thể nhập địa chỉ của đối tượng cần tìm. Quy trình xử lý trải qua các bước sau:
+ Chuẩn hoá giá trị địa chỉ vừa nhập vào bằng cách tách nó thành các thành phần địa chỉ nhỏ.
+ Geocoding service sau đó sẽ tìm trong nguồn dữ liệu tham chiếu để xác định các đối tượng có các thành phần địa chỉ tương ứng với dữ liệu nhập vào. Mỗi kiểu geocoding service sẽ quy định các định dạng của các thành phần địa chỉ này.
+ Tập kết quả trả về sẽ được gán các trọng số (điểm) để tìm ra kết quả gần đúng nhất.
+ Geocoding service sẽ đánh dấu đối tượng vừa được tìm thấy trên bản đồ bằng một đối tượng đồ hoạ.
Hình 1.5 Kết quả tìm kiếm theo địa chỉ
Networks (phân tích mạng): Networks là kỹ thuật được ứng dụng rất rộng rãi trong giao thông, phân phối hàng hoá và dịch vụ, vận chuyển nước hay xăng dầu trong các đường ống dài, trao đổi thông tin qua mạng viễn thông… Trong GIS, networks được mô hình dưới dạng các đồ thị một chiều hay mạng hình học. Mạng hình học này bao gồm các đối tượng đang được hiển thị trên bản đồ, mỗi đối tượng đóng vai trò là cạnh hoặc nút trong mạng. Trong GIS để thiết lập nên mối quan hệ giữa nút - cạnh và cạnh - cạnh ta cần tạo các topology cho cơ sở dữ liệu. Topology được hiểu là mối quan giữa các đối tượng trong bảng dữ liệu. Quan hệ topology giữa các đối tượng gần giống quan hệ giữa các bảng (relationship).
Chúng ta có hai kiểu liên kết là nút - cạnh và cạnh - cạnh. Nút - cạnh là luật liên kết được thiết lập giữa một nút của đối tượng kiểu A với một cạnh của đối tượng kiểu B. Cạnh - cạnh là luật liên kết giữa một cạnh của đối tượng kiểu A và một cạnh của đối tượng kiểu B qua một tập các nút.
Khi đã tạo topology và xác lập luật liên kết, một mạng lôgic đã được hình thành. Lúc này ta có thể áp dụng các thuật toán về mạng để giải quyết các bài toán đặt ra.
Hình 1.6 Kết quả tìm kiếm trên mạng giao thông
Overlay (phủ trùm hay chồng bản đồ): đây là kỹ thuật khó nhất và cũng là mạnh nhất của GIS. Overlay cho phép ta tích hợp dữ liệu bản đồ từ hai nguồn dữ liệu khác nhau. Người ta định nghĩa: “Overlay là quá trình chồng khít hai lớp dữ liệu bản đồ với nhau để tạo ra một lớp bản đồ mới”. Điều này tương tự như việc nhân hai ma trận để tạo ra một ma trận mới, truy vấn hai bảng cơ sở dữ liệu để tạo ra bảng mới, với overlay là gộp hai lớp trên bản đồ để tạo ra bản đồ mới. Overlay thực hiện điều này bằng cách kết hợp thông tin một lớp này với một lớp khác để lấy ra dữ liệu thuộc tính từ một trong hai lớp.
Người ta chia overlay thành ba dạng phân tích khác nhau:
+ Point-in-polygon: chồng khít hai lớp point và polygon, đầu ra là lớp point.
+ Line-in-polygon: chồng khít hai lớp line và polygon, đầu ra là lớp line.
+ Polygon-in-polygon: chồng khít hai lớp polygon và polygon, đầu ra là lớp polygon.
Một bài toán rất điển hình cho kỹ thuật này là bài toán về kiểm tra tình hình ngập lụt của các thửa đất trong một vùng có thiên tai. Ở đây chúng ta thấy có hai lớp là lớp cho biết tình trạng lũ lụt trong vùng và lớp thuộc về đất đai. Thông thường hai lớp này sẽ nằm trên hai bản đồ khác nhau vì mục đích sử dụng của chúng khác nhau. Khi cần biết tình trạng ngập lụt của từng thửa đất, người ta tiến hành chồng khít hai lớp bản đồ. Lúc này thông tin về tình trạng của thửa đất sẽ được lấy từ lớp lũ lụt chứ không phải lấy từ lớp thửa đất vì lớp thửa đất không chứa các thông tin này. Ví dụ này mô tả bài toán thuộc loại “polyon-in-polygon”.
Qua bài toán chúng ta có thể thấy một điều rằng hai lớp mà ta đưa vào overlay phải có sự thống nhất với nhau. Thống nhất về hệ quy chiếu, thống nhất về tỷ lệ, có được điều kiện này ta mới tiến hành overlay được.
Quá trình overlay thường được tiến hành qua 2 bước:
+ Xác định tọa độ các giao điểm và tiến hành chồng kít hai lớp bản đồ tại giao điểm này.
+ Kết hợp dữ liệu không gian và thuộc tính của hai lớp bản đồ.
Các phép toán overlay bao gồm: phép hợp (Union), phép giao (Intersect) và phép đồng nhất (Identity).
- Phép hợp: hoạt động như toán tử Or. Đầu vào là hai lớp bản đồ kiểu là polygon. Kết quả đầu ra là một lớp bản đồ mới bằng cách overlay hai miền dữ liệu đầu vào và dữ liệu thuộc tính của chúng.
Điều kiện: miền dữ liệu phải là polygon
Hình 1.7 Phép hợp
- Phép giao: hoạt động như toán tử And. Tạo ra một vùng bao phủ mới bằng cách overlay hai tập dữ liệu đầu vào. Kết quả đầu ra bao gồm phần dữ liệu thuộc vào cả hai tập dữ liệu đầu vào.
Hình 1.8 Phép giao
- Phép đồng nhất: tạo ra một vùng bao phủ mới bằng cách overlay hai tập dữ liệu đầu vào. Kết quả đầu bao gồm toàn bộ phần dữ liệu của lớp đầu tiên và chỉ những phần nào của lớp thứ hai được chồng khít.
Hình 1.9 Phép đồng nhất
- Proximity (tìm kiếm trong khoảng cận kề): Proximity là phép tìm kiếm trên cơ sở đo khoảng cách quanh hoặc giữa các đối tượng. Khoảng cách này được tính theo khoảng cách Euclidean.
Có 3 phương pháp phân tích proximity:
Phương pháp thứ nhất là tìm kiếm nội dung trong vùng, trong đó vùng tìm kiếm được xác định bởi xấp xỉ tới hiện tượng có sẵn, đó chính là phương pháp buffer. Việc tìm kiếm này được thực hiện trong vùng tạo bởi mở rộng đối tượng cho trước theo một khoảng cách cho trước. Trong GIS vùng này được gọi là vùng đệm, nó được xây dựng xung quanh đối tượng điểm, đối tượng đường hay đối tượng vùng. Trong các hệ thống trên cơ sở raster thì việc tạo lập vùng đệm dược thực hiện nhờ chức năng spread.
Phương pháp thứ hai của tìm kiếm cận kề là tìm ra các vùng nối trực tiếp với đối tượng xác định trước, chẳng hạn như tìm các mảnh đất liền kề với mảnh đất sẽ xây dựng nhà máy.
Phương pháp thứ ba của tìm kiếm cận kề xảy ra khi cần phải tìm kiếm những vùng gần nhất tới tập các vị trí mẫu phân tán không đều. Các mẫu thường là các điểm. Tìm kiếm này thực hiện bằng cách tạo lập đa giác thiessen, nó xác định các vùng xung quanh mỗi điểm mà gần điểm này hơn mọi điểm khác. Sơ đồ đa giác thiessen còn được gọi là sơ đồ voronoi. Chúng được sử dụng để lập ra bản đồ sử dụng từ các mẫu đất cách biệt.
IV. VECTOR VÀ RASTER TRONG GIS
Có hai phương pháp chính để lưu trữ thông tin bản đồ: GIS lưu các đối tượng bản đồ trong định dạng vector và trong định dạng raster.
Trong định dạng vector, các đối tượng bản đồ được biểu diễn bởi các đối tượng hình học cơ bản point (điểm), line (đường), polygon (vùng). Point dùng xác định các đối tựợng không có hình dạng kích thước cụ thể, hay có kích thước quá nhỏ so với tỷ lệ bản đồ. Line để xác định các đối tượng có chiều dài xác định. Polygon để xác định các vùng, miền trên mặt đất. Trong định dạng này, thông tin được mô tả có tính chính xác cao đồng thời tiết kiệm không gian lưu trữ. Thông tin lưu trong định dạng vector chủ yếu được ứng dụng trong bài toán về mạng, hệ thống thông tin đất đai.
Trong định dạng raster, các đối tượng bản đồ được biểu diễn trong một chuỗi các điểm ảnh trong một lưới hình chữ nhật. Mỗi điểm ảnh được xác định thông qua chỉ số hàng và cột trong lưới. Trong raster, point sẽ được biểu diễn bởi một điểm ảnh đơn, line được biểu diễn bởi một chuỗi các điểm ảnh liên tiếp nhau, và polygon xác định bởi một nhóm các điểm ảnh kề sát nhau. Dữ liệu được lưu trong định dạng này rất đơn giản nhưng lại đòi hỏi dung lượng bộ nhớ lớn. Raster phù hợp với các dạng dữ liệu có đường biên không rõ ràng. Raster được ứng dụng nhiều trong phân tích bề mặt liên tục.
Hình 1.10 Định dạng dữ liệu Vector và Raster
V. HỆ TOẠ ĐỘ ĐỊA LÝ VÀ HỆ TOẠ ĐỘ QUY CHIẾU
Vị trí của vật thể trong không gian đều phải gắn liền với một hệ toạ độ. Trong GIS, để biểu diễn dữ liệu không gian người ta thường dùng 2 hệ toạ độ là hệ toạ độ địa lý và hệ toạ độ quy chiếu.
Hệ toạ độ địa lý là hệ toạ độ lấy mặt cầu ba chiều bao quanh trái đất làm cơ sở. Một điểm được xác định bằng kinh độ và vĩ độ của nó trên mặt cầu.
Hệ toạ độ quy chiếu là hệ toạ độ hai chiều thu được bằng cách chiếu dữ liệu bản đồ nằm trên hệ toạ độ địa lý về một mặt phẳng.
1. Hệ toạ độ địa lý
Hệ tọa độ địa lý sử dụng bề mặt hình cầu để xác định vị trí của một điểm trên trái đất. Đơn vị đo của hệ là độ.
Vì đây là hệ tọa độ gắn liền với trục trái đất nên để xác định vị trí của đối tượng người ta chia bề mặt trái đất thành các đường kinh tuyến và vĩ tuyến. Kinh tuyến là các đường cong cách đều nhau chạy qua hai điểm cực Bắc và Nam, vĩ tuyến là các đường tròn song song có tâm nằm trên trục của trái đất. Giao điểm giữa kinh tuyến và vĩ tuyến tạo thành các ô lưới.
Trong số các kinh tuyến và vĩ tuyến có hai đường quan trọng nhất được lấy làm gốc toạ độ đó là vĩ tuyến có bán kính lớn nhất - chính là đường xích đạo và kinh tuyến chạy qua vùng Greenland nước Anh. Giao điểm giữa hai đường này là gốc toạ độ. Hai đường này cũng đồng thời chia trái đất làm 4 phần bằng nhau là nửa Bắc và Nam nằm phía trên và dưới của đường xích đạo, nửa Đông và Tây nằm ở phía bên phải và trái của kinh tuyến gốc. Một điểm nằm trên mặt cầu sẽ có hai giá trị toạ độ là kinh độ và vĩ độ được xác định như trong hình vẽ trên. Giá trị này có thể được đo bằng độ theo cơ số 10 hoặc theo độ, phút, giây.
Miền giá trị của vĩ độ: -900 ÷ 900
kinh độ: -1800 ÷ 1800
Hình 1.11 Hệ toạ độ địa lý (trực quan)
Chú ý là chỉ trên đường xích đạo thì khoảng cách một độ của vĩ tuyến mới bằng khoảng cách một độ trên kinh tuyến. Trên các vĩ tuyến khác khoảng cách này khác nhau rất nhiều. Người ta tính rằng một độ trên kinh tuyến dài khoảng 111,321 km trong khi 600 trên vĩ tuyến chỉ có độ dài 55,802 km. Chính vì sự khác nhau này nên ta không thể đo chính xác được chiều dài và diện tích của đối tượng khi dữ liệu bản đồ được chiếu lên mặt phẳng.
Mặt cầu và mặt Ellipsoid: trong hệ toạ độ địa lý có hai bề mặt hình cầu được sử dụng đó là mặt cầu (tuyệt đối) và mặt ellipsoid.
Vì bề mặt của trái đất của ta không phải là hình cầu tuyệt đối mà nó gần với hình ellipsoid nên mặt ellipsoid thường được dùng để biểu diễn. Tuy nhiên đôi khi người ta cũng sử dụng mặt cầu để công việc tính toán dễ dàng hơn. Khi tỷ lện bản đồ rất nhỏ 1:1.000.000 thì người ta cần thiết phải dùng mặt ellipsoid để đảm bảo độ chính xác. Do đó, việc lựa chọn mặt cầu hay mặt ellipsoid phụ thuộc vào mục đích của bản đồ và độ chính xác dữ liệu.
Hình 1.12 Mặt cầu và mặt ellipsoid
Nếu mặt cầu dựa trên hình tròn thì mặt ellipsoid lại có cơ sở là hình ellip. Hình ellip được xác định bởi hai bán trục mà ta hay gọi là bán trục lớn và bán trục nhỏ. Ta cho ellip xoay quanh bán trục nhỏ ta sẽ thu được hình ellipsoid.
Kích thước và hình dạng của ellipsoid được xác định bởi bán trục lớn a và bán trục nhỏ b, hay bởi a và hệ số dẹt f
f = (a - b) / a
Vì hệ số f rất nhỏ nên người ta thường dùng giá trị 1/f
A = 6378137.0 m
1/f = 298.25722563
2. Hệ toạ độ quy chiếu
Để thuận tiện cho sử dụng người ta phải nghiên cứu cách thể hiện bề mặt trái đất lên trên mặt phẳng của bản đồ. Do đó phải thực hiện phép chiếu bề mặt cong của trái đất lên mặt phẳng và hệ toạ độ quy chiếu ra đời. Hệ toạ độ này luôn lấy hệ toạ độ địa lý làm cơ sở.
Hệ toạ độ quy chiếu được đặc trưng bởi hai trục x theo phương ngang và y theo phương thẳng đứng. Gốc toạ độ là giao điểm của hai trục này. Hai trục giao nhau đồng thời chia mặt phẳng làm 4 phần tương ứng với 4 phần trong hệ toạ độ địa lý. Một điểm trên mặt được xác định được xác định bởi cặp giá trị (x, y).
Hình 1.13 Mặt phẳng hệ toạ độ quy chiếu
Có rất nhiều phép chiếu bề mặt cong của trái đất lên mặt phẳng song về cơ bản ta có thể hiểu như sau. Lấy một mảnh bìa cuộn xung quanh bề mặt cầu trong hệ toạ độ địa lý theo một hình trụ đứng. Từ tâm của bề mặt cong ta vẽ các tia cắt các điểm giao giữa kinh tuyến và vĩ tuyến, đồng thời kéo dài cắt mặt trụ. Thực chất của việc này là chiếu các ô lưới lên bề mặt phẳng. Mở tờ bìa ra ta có kết quả của phép chiếu. Nhìn vào tấm bìa ta nhận thấy, các ô lưới đã thay đổi khá nhiều (biến dạng), co lại hoặc dãn ra. Càng xa đường xích đạo thì sự biến dạng càng lớn. Điều này gây nên sự thay đổi về hình dạng, kích thước, khoảng cách của dữ liệu không gian.
Sau đó người ta dùng các công thức toán học để tương ứng toạ độ của bề mặt cong lên toạ độ mặt phẳng chiếu.
Các phép chiếu khác nhau gây ra các biến dạng bản đồ khác nhau nên việc sử dụng phép chiếu nào là dựa vào mục đích của bản đồ và độ chính xác của dữ liệu.
Hình 1.14 Minh hoạ cách chiếu bề mặt cong lên mặt phẳng
Các phép chiếu cơ bản: trong phần này ta sẽ tìm hiểu ba phép chiếu cơ bản và thường được sử dụng nhất đó là phép chiếu với mặt chiếu là mặt hình nón, mặt hình trụ và mặt phẳng phương vị.
Bước đầu tiên khi tiến hành phép chiếu này là tạo ra một hay một tập các điểm tiếp xúc. Các điểm tiếp xúc này được gọi là các tiếp điểm hay là tiếp tuyến (trong trường hợp là đường thẳng). Các điểm này có vai trò rất quan trọng, vì độ biến dạng của phép chiếu trên những điểm này bằng không. Độ biến dạng sẽ tăng khi khoảng cách giữa điểm chiếu và điểm tiếp xúc tăng.
+ Mặt hình nón: để thực hiên phép chiếu này người ta cho dùng một mặt hình nón “úp” lên bề mặt cầu. Đường thẳng tiếp xúc giữa mặt nón và mặt cầu là một vĩ tuyến và được gọi là vĩ tuyến chuẩn. Các đường kinh tuyến sau khi chiếu mặt nón sẽ thành những đường thẳng đứng, các đường vĩ tuyến sẽ tạo thành những đường tròn.
Sau khi thực hiện phép chiếu, người ta sẽ cắt hình nón dọc theo một kinh tuyến bất kỳ, lúc này ta sẽ được kết quả của phép chiếu trên bề mặt nón. Sự giao nhau giữa những đường thẳng và cung tròn sẽ tạo nên một mặt lưới. Đường thẳng đối diện với đường cắt được gọi là kinh tuyến trung tâm. Càng xa vĩ tuyến chuẩn độ biến dạng càng tăng. Do đó để tăng độ chính xác người ta cắt bỏ phần đỉnh của mặt nón hay ta không tiến hành chiếu lên vùng này. Phép chiếu này thường được dùng cho việc chiếu các vùng có các vĩ tuyến trung bình chạy qua và hướng theo chiều đông - tây.
Hình 1.15 Mặt chiếu hình nón
+ Mặt hình trụ: giống như phép chiếu mặt nón, phép chiếu này cũng có một đường thẳng tiếp tuyến. Khi sử dụng mặt trụ, người ta phân làm 3 loại tuỳ thuộc vào vị trí tương đối của mặt trụ so với mặt cầu:
- Hình trụ được đặt theo phương thẳng đứng và tiếp xúc với mặt cầu theo một vị tuyến, thường là đường xích đạo. Gọi là phép chiếu Mercator.
- Hình trụ được đặt theo phương nằm ngang, đường thẳng tiếp xúc là một kinh tuyến. Gọi là phép chiếu Transverse.
- Hình trụ đặt xiên và tiếp xúc với mặt cầu theo một đường tròn có bán kính lớn nhất (bằng với bán kính đường xính đạo). Gọi là phép chiếu Oblique.
Phép chiếu thường được sử dụng nhất là Mercator. Trong phép chiếu này, các đường kinh tuyến sẽ được chiếu thành những đường thẳng đứng cách đều nhau, các đường vĩ tuyến sẽ trở thành những đường nằm ngang khoảng cách không đều nhau; tăng dần về phía hai cực. Do đó biến dạng sẽ tăng dần về phía hai cực. Sau khi thực hiện phép chiếu, người ta sẽ cắt mặt hình trụ dọc theo một kinh tuyến, trải ra trên mặt phẳng ta sẽ thu được kết quả.
Hình 1.16 Mặt chiếu hình trụ
+ Mặt phẳng phương vị: là phép chiếu dữ liệu bản đồ lên một mặt phẳng tiếp xúc với mặt cầu. Điểm tiếp xúc này có thể là: nằm tại hai cực, tại đường xích đạo, hoặc tại một vị trí bất kỳ nằm giữa. Vị trí của điểm tiếp xúc cho ta biết vị trí tương đối của mặt phẳng chiếu với mặt cầu và tạo nên ba kiểu chiếu khác nhau: polar, equatorial và oblique.
Hình 1.22 Các vị trí của mặt phẳng phương vị
Mặt phẳng chiếu tiếp xúc với cực của mặt cầu là kiểu chiếu đơn giản nhất và cũng hay dùng nhất. Trong phép chiếu này, các đường kinh tuyến sẽ được chiếu thành một chùm đường thẳng giao nhau ở điểm cực, vĩ tuyến là các đường tròn có cùng tâm là cực của mặt cầu. Góc giữa các đường kinh tuyến được bảo tồn.
CHƯƠNG II
DỮ LIỆU VÀ CÁC MÔ HÌNH BIỂU DIỄN DỮ LIỆU TRONG GIS
I. DỮ LIỆU TRONG GIS
Trong các mô hình biểu diễn dữ liệu của GIS, chúng ta thường nhắc đến một khái niệm là feature. Theo định nghĩa của ISO (International Standard Organization): “Feature là sự trừu tượng hoá của một sự vật trong thế giới thực. Trong đó, thuộc tính của feature chính là đặc điểm mô tả feature đó”. GIS chia thuộc tính của feature thành 2 loại là thuộc tính không gian và thuộc tính mô tả lần lượt tương ứng với hai loại dữ liệu là dữ liệu không gian (spatial data) và dữ liệu thuộc tính (non-spatial data). Trong một hệ quản trị cơ sở dữ liệu, các feature sẽ được lưu trữ trong một bảng, một feature sẽ tương ứng với một dòng và các thuộc tính sẽ tương ứng với các cột trong dòng.
Thuộc tính mô tả cho ta biết chi tiết thông tin về từng feature. Ví dụ, feature là một thửa đất thì thuộc tính của nó có thể là: số hiệu thửa, chủ sở hữu, diện tích thửa, chiều dài thửa, mặt tiền thửa, giá trị chuyển nhượng, loại đất…
Thuộc tính không gian được xác định bởi hình dạng và vị trí của feature trong thế giới thực. Hình dạng của feature được biểu diễn bằng các đối tượng hình học (Geometry). Vị trí của feature trong không gian được xác định bởi hệ toạ độ quy chiếu gắn với nó.
II. CÁC ĐỐI TƯỢNG HÌNH HỌC (GEOMETRY)
Hình 2.1 Các đối tượng hình học
Point: là đối tượng biểu diễn điểm có toạ độ x, y vị trí xác định trong hệ trục toạ độ.
MultipPoint: là một tập các điểm xác định trên mặt phẳng x, y. Vị trí của các điểm được lấy tương đối so với một điểm làm gốc.
Line: là một tập các điểm được xác định bởi hai điểm đầu và cuối.
Arc: là một tập các điểm được xác định bởi hai điểm đầu và cuối. Quỹ đạo tập hợp các điểm tuân theo quy luật của một hàm toán học.
Polyline: là một chuỗi các điểm, được nối với nhau theo từng đoạn (segment). Mỗi đoạn có thể là line hoặc arc.
Annotation: đó là các ký tự, nhãn nhằm biểu đạt các thông tin trên bản đồ.
Polygon: là một phần của mặt phẳng x, y được xác định bởi một polyline dạng vòng gọi là biên. Polygon là đối tượng phức tạp nhất, vì vậy việc xác định tọa độ của nó phải tuân theo một số nguyên tắc. Các tắc này do các nhà phát triển đặt ra trong quá trình xây dựng phần mềm của mình.
1
a
d
c
b
+ Nếu polygon là một miền kín đơn (dạng đơn giản nhất) tọa độ các điểm sẽ được lưu trữ theo quy tắc ngược kim đồng hồ.
ID Tọa độ
1 a,b,c,d,a
a
c
d
e
f
g
h
i
b
+ Nếu polygon có một vùng trống con bên trong, vùng trống này có viền bao liên quan đến viền bao ngoài. Ta sẽ phải thực hiện việc đảo ngược toạ độ vùng trống này, kết hợp với polygon tạo thành một polygon duy nhất.
ID Tọa độ
1 a,b,c,d,e,f,c,g,h,i,a
+ Nếu polygon có một vùng trống bên trong và viền bao của nó độc lập với bên ngoài. Cách đánh toạ độ của vùng trống bên trong ngược chiều với polygon bên ngoài. Danh sách toạ độ polygon ngoài luôn được đánh đầu tiên.
a
b
c
d
e
h
g
f
ID Tọa độ
1 a,b,c,d,a,e,f,g,h,e
a
b
c
d
e
k
g
f
h
i
j
ID Tọa độ
1 a,b,c,d,a,e,f,g,h,i,j,g,k,e
Một số quy ước đối với các đối tượng hình học (Geometry)
+ Point và MultipPoint
- Không có kích thước, đối tượng vô hướng.
- Hình chữ nhật bao quanh một point tương đương với giá trị toạ độ x,y của point đó.
- Hình chữ nhật bao quanh một multipoint là hình bao nhỏ nhất phủ trùm tất cả các point này.
+ Line và PolyLine
- Hai điểm liên tiếp không thể có cùng một toạ độ.
- Mỗi đoạn (line) phải chứa ít nhất hai điểm phân biệt.
- Với polyline, điểm đầu và điểm cuối có thể trùng nhau nhưng kết quả của “vòng bao kín” đó không thể coi là một polygon.
- Độ dài của polyline được tính bằng tổng chiều dài các đoạn (line).
+ Polygon
- Hai điểm liên tiếp không thể có cùng một toạ độ.
- Tập các đoạn thẳng tạo nên polygon phải tạo thành một miền kín và không giao nhau. Toạ độ các điểm được lưu theo nguyên tắc ngược chiều kim đồng hồ.
- Đối với các polygon chứa một hay nhiều vùng trống ở miền trong, phải xác định mối quan hệ tương đối giữa vùng trống với nhau và giữa vùng trống với polygon.
- Với các polygon có đường bao vùng trống bên trong tiếp xúc với đường bao polygon, phải đảo ngược toạ độ của vùng trống này và kết hợp với polygon.
- Hình chữ nhật bao quanh polygon có toạ độ chính bằng toạ độ cận trên và cận dưới của polygon.
Thuộc tính của các Geometry
+ Miền trong, biên, miền ngoài: tất cả các đối tượng đều chiếm giữ một vị trí trong không gian được xác định bởi miền trong, biên và miền ngoài. Miền ngoài của một đối tượng là vùng không gian mà nó không chiếm tới. Biên là phần giao giữa miền trong và miền ngoài. Miền trong là miền mà đối tượng chiếm giữ. Khái niệm miền trong và miền ngoài đối với các đối tượng là giống nhau, nhưng biên của các đối tượng khác nhau là khác nhau.
+ Đơn và không đơn: một số đối tượng có cả thuộc tính đơn và không đơn. Chúng mang thuộc tính đơn nếu chúng tuân theo các quy ước đặt ra trong một lớp các đối tượng và không đơn nếu chúng không tuân theo các quy ước này. Đối tượng point chỉ có thuộc tính đơn. Mulipoint là đơn khi không có hai điểm có cùng một toạ độ. Line mang thuộc tính đơn, polyline là đơn khi không có hai đoạn thẳng nào cắt nhau.
+ Rỗng: một đối tượng là rỗng khi nó không chứa một điểm nào. Khi này các thuộc tính khác như: hình chữ nhật (bao quanh), miền trong, biên, miền ngoài đều bằng rỗng. Đối tượng rỗng luôn luôn đơn và có thể có toạ độ Z. Một line là rỗng có chiều dài bằng 0. Polygon là rỗng có diện tích miền trong bằng 0.
+ Hình chữ nhật (bao quanh): hình chữ nhật của một đối tượng là hình bao quanh đối tượng đó. Toạ độ của hình chữ nhật này chính là toạ độ cận trên và cân dưới của đối tượng. Tuy nhiên, hình chữ nhật của đối tượng point là một điểm vì cận trên và cận dưới của nó trùng nhau.
+ Số chiều biểu diễn: mỗi đối tượng có số chiều biểu diễn là: 0, 1 hoặc 2.
Số chiều = 0: không có kích thước, diện tích.
1: chỉ có chiều dài, chiều rộng = 0.
2: là một miền có diện tích xác định.
Point và multipoint là hai đối tượng có số chiều bằng 0. Point biểu diễn các feature vô hướng và có thể được mô hình bằng một toạ độ đơn.
Line và polyline có số chiều bằng 1. Chúng dùng để biểu diễn đường giao thông, hệ thống sông ngòi và các đối tượng tuyến tính khác
Polygon và multipolygon là các đối tượng 2 chiều. Các loại feature thường được biểu diễn bằng chúng là: các khu vực hành chính, thửa đất, đồng ruộng…
Việc xác định số chiều sẽ làm tiền đề cho chúng ta xác định mối quan hệ giữa các feature vì ta chỉ có thể so sánh các đối tượng khi chúng có số chiều bằng nhau.
+ Toạ độ Z: một số đối tượng có thêm toạ độ Z. Toạ độ này mô tả độ cao hay độ sâu của đối tượng so với mặt nước biển.
III. CÁC MÔ HÌNH BIỂU DIỄN DỮ LIỆU
Có 3 cách mô hình dữ liệu trong GIS:
+ Modelling with vector data: mô hình dữ liệu vector.
+ Modelling with taster data: mô hình dữ liệu raster.
+ Modelling with triangulated data: mô hình lưới tam giác không đều.
1. Mô hình dữ liệu vector
Mô hình dữ liệu vector xem các sự vật, hiện tượng là tập các thực thể không gian cơ sở và tổ hợp của chúng. Trong mô hình 2D thì các thực thể cơ sở bao gồm điểm (point), đường (line), vùng (polygon). Các thực thể sở đẳng được hình thành trên cở sở các vector hay toạ độ của các điểm trong một hệ trục toạ độ nào đó.
Loại thực thể cơ sở được sử dụng phụ thuộc vào tỷ lệ quan sát hay mức độ khái quát. Với bản đồ có tỷ lệ nhỏ thì thành phố được biểu diễn bằng điểm (point), đường đi, sông ngòi được biểu diễn bằng đường (line). Khi tỷ lệ thay đổi kéo theo sự thay đổi về thực thể biểu diễn. Thành phố lúc này sẽ được biểu diễn bởi vùng có đường ranh giới. Khi tỷ lệ lớn hơn, thành phố có thể được biểu diễn bởi tập các thực thể tạo nên các đối tượng nhà cửa, đường sá, các trình tiện ích… Nói chung mô hình dữ liệu vector sử dụng các đoạn thẳng hay các điểm rời rạc để nhận biết các vị trí của thế giới thực.
Trong mô hình vector người ta trừu tượng hoá các sự vật hiện tượng và gọi chúng là các feature. Các feature được biểu diễn bằng các đối tượng hình học: point, line, polygon. Các biểu diễn này áp dụng cho những đối tượng đơn có hình dạng và đường bao cụ thể.
Hình 2.2 Bản đồ với mô hình dữ liệu vector
Trong cách biểu diễn này, người ta định nghĩa:
+ Feature là một đối tượng trên bản đồ có hình dạng và vị trí xác định, có các thuộc tính cùng với hành vi cụ thể.
+ Feature Class là một tập các feature có cùng kiểu tức là tập các point, line, hay polygon. Các feature class tương đương với một lớp trên bản đồ.
+ Feature Dataset là tập các feature class hay tập hợp các lớp trên cùng một hệ toạ độ. Feature dataset tương đương với một bản đồ.
Các thành phần dữ liệu
Trong feature dataset, mỗi point được lưu dưới một toạ độ đơn tương ứng, line được lưu dưới một chuỗi các điểm có toạ độ x, y cho trước, polygon được lưu thành một tập các điểm có toạ độ x, y xác định những đoạn thẳng và đóng kín.
Points biểu diễn các feature không có miền bao hay độ dài, nhiều khi nó biểu diễn các feature có kích thước quá nhỏ so với tỷ lệ của bản đồ.
Hình 2.3 Đối tượng point trên bản đồ
Lines dùng để biểu diễn các feature có chiều dài xác định nhưng không có miền bao hay những feature rất hẹp so với tỷ lệ bản đồ
Hình 2.4 Đối tượng line trên bản đồ
Polygons được dùng để biểu diễn các feature có miền bao xác định: ruộng đất, ao, hồ hay các đơn vị hành chính…
Hình 2.5 Đối tượng polygon trên bản đồ
Các phép toán phân tích không gian
GIS cung cấp rất nhiều phép toán phân tích không gian trên mô hình dữ liệu vector. Các phép toán này dựa trên cơ sở so sánh lôgic tập các đối tượng này với tập đối tượng khác.
Buffer
Cho trước một đối tượng và một giá trị khoảng cách, phép toán buffer sẽ tạo ra một vùng đệm là một polygon bao phủ xung quanh tất cả các điểm mà khoảng cách từ chúng đến đối tượng nhỏ hơn hoặc bằng khoảng cách đề ra.
Difference
Cho trước hai đối tượng giao nhau là đối tượng cơ sở và đối tượng so sánh. Phép toán difference sẽ tạo ra một đối tượng mới trong đó giữ nguyên phần của đối tượng cơ sở không nằm trong đối tượng so sánh.
Clip
Cho trước một đối tượng và một hình chữ nhật. Phép toán clip sẽ tạo ra một đối tượng mới bằng cách cắt đối tượng đầu vào theo hình chữ nhật.
Intersect
Cho trước hai đối tượng. Phép toán intersect sẽ tạo ra một đối tượng mới chính là phần giao giữa hai đối tượng.
Convex hull
Cho trước một đối tượng, phép toán convex hull sẽ tạo ra một đối tượng mới là một polygon bằng cách nối tất cả các điểm ở biên của đối tượng đó. Nói cách khác, đây là polygon nhỏ nhất bao kín đối tượng.
Symmetric difference
Phép toán symmetric difference sẽ tiến hành so sánh vị trí hai đối tượng và tạo ra một đối tượng mới từ hai đối tượng ban đầu và bỏ đi phần giao giữa chúng.
Cut
Cho một đường cong và một đối tượng, phép toán cut sẽ tách đối tượng này thành hai phần nửa phải và nửa trái theo hướng của đường cong. Point và multipoint không được áp dụng. Line và polygon phải cắt đường cong.
Union
Phép toán này tiến hành so sánh vị trí tương đối của hai đối tượng và trả về một đối tượng trên cơ sở hợp hai đối tượng ban đầu.
Mô hình dữ liệu vector cho ta nhiều thao tác hơn trên các đối tượng so với mô hình raster. Việc tính diện tích, đo khoảng cách của các đối tượng được thực hiện bằng các tính toán hình học từ toạ độ của các đối tượng thay vì việc tính toán trên các điểm ảnh của mô hình raster. Các thao tác trong mô hình này nói chung thường chính xác hơn. Thí dụ, tính diện tích, chu vi của một vùng nào đó trên cơ sở đa giác sẽ chính xác hơn việc đếm các điểm ảnh trên bản đồ có các phép chiếu khác nhau. Một số thao tác ở mô hình này cũng thực hiện nhanh hơn như tìm đường đi trong mạng lưới giao thông dựa trên lý thuyết đồ thị. Tuy nhiên, ở một số thao tác khác thì mô hình này sẽ chậm hơn so với mô hình raster, chẳng hạn khi thực hiện nạp chồng các lớp của bản đồ, các thao tác vùng đệm.
Mô hình dữ liệu vector hình thành trên cơ sở quan sát đối tượng của thế giới thực. Quan sát các đặc trưng theo hướng đối tượng là phương pháp tổ chức thông tin trong các hệ GIS để định hướng các hệ thống quản trị cơ sở dữ liệu. Chúng tối ưu trong việc lưu trữ số liệu bản đồ vì chỉ cần lưu các đường biên của các đặc trưng mà không cần phải lưu toàn bộ vùng của chúng. Do các thành phần đồ hoạ biểu diễn các đặc trưng của bản đồ liên kết trực tiếp với các thuộc tính của cơ sở dữ liệu nên người dùng dễ dàng tìm kiếm và hiển thị các thông tin từ cơ sở dữ liệu.
2. Mô hình dữ liệu raster
Mô hình raster biểu diễn các đặc trưng địa lý bằng các điểm ảnh (pixel). Dữ liệu raster gắn liền với dữ liệu dạng ảnh hoặc dữ liệu có tính liên tục cao. Dữ liệu raster có thể biểu diễn được rất nhiều các đối tượng từ hình ảnh bề mặt đất đến ảnh chụp từ vệ tinh, ảnh quét và ảnh chụp. Định dạng dữ liệu raster rất đơn giản nhưng hỗ trợ rất nhiều kiểu dữ liệu khác nhau.
Hình 2.6 Bản đồ với mô hình dữ liệu raster
Nguồn dữ liệu raster
Ảnh chụp từ vệ tinh, ảnh chụp từ máy bay, ảnh quét, ảnh chụp. Trong đó ảnh chụp từ vệ tinh là cách lấy dữ liệu tốn kém nhất nhưng lại có ý nghĩa to lớn trong việc nghiên cứu tình hình biến đổi của các sự vật trên trái đất theo thời gian. Ảnh chụp từ máy bay giúp ta vẽ bản đồ một cách chi tiết.
Ngoài ra ta còn raster còn có thể được tạo ra bằng cách chuyển đổi từ nhiều nguồn dữ liệu khác như vector hay TIN.
Hình 2.7 Ảnh chụp từ máy bay
Hình 2.8 Biến đổi từ dữ liệu vector sang raster
Các thành phần dữ liệu
Hình 2.9 Mảng cell và bảng thuộc tính
Raster được tạo nên bởi một mảng 2 chiều các điểm ảnh hay cell. Cell là một đơn vị đồng nhất biểu diễn một vùng xác định trên trái đất. Các cell đều có cùng kích thước. Gốc toạ độ của hệ được đặt tại cell nằm tại đỉnh góc trái. Mỗi cell được xác định bởi chỉ số dòng và chỉ số cột, đồng thời nó chứa một số nguyên (hoặc số thực) biểu diễn kiểu hay giá trị thuộc tính xuất hiện trên bản đồ.
Kích thước của cell trong raster phụ thuộc nhiều vào độ phân giải dữ liệu. Cell phải có kích thước đủ nhỏ để có thể thu thập được chi tiết dữ liệu, nhưng cũng phải có kích thước đủ lớn để có thể phân tích dữ liệu một cách thuận tiện.
Giá trị của cell sẽ định nghĩa các nhóm, lớp tại vị trí của cell. Cell tại những điểm có cùng một giá trị xác định một vùng, miền. Các cell trong cùng một miền không cần phải liên kết với nhau. Khi một số nguyên được chỉ định cho một tập các cell, thì số nguyên này có thể là mã phân biệt giữa các nhóm cell. Điều này tạo nên một quan hệ một - nhiều giữa mã và các cell có cùng giá trị. Ví dụ các cell có giá trị là 400 được gán mã là 4, các cell có giá trị 500 được gán mã là 5. Mã này có thể xuất hiện nhiều lần trong raster, nhưng chỉ xuất hiện một lần trong bảng giá trị thuộc tính (hình 2.9). Bảng này lưu các giá trị thuộc tính cho mã, điều này giúp việc cập nhật đơn giản hơn. Một thay đổi nhỏ của giá trị thuộc tính sẽ làm thay đổi cách thể hiện của hàng trăm đối tượng trên bản đồ.
Mỗi cell trong một raster đều có một giá trị. Giá trị này biểu diễn một trong bốn kiểu dữ liệu sau:
+ Nominal (biến tên): một giá trị thuộc kiểu dữ liệu nominal sẽ xác định một thực thể từ một thực thể khác. Những giá trị này được phân loại để tạo thành các nhóm. Trong mỗi nhóm, thực thể địa lý sẽ liên kết với cell tại vị trí của cell đó. Nominal được dùng trong rất nhiều kiểu mã như mã sử dụng đất, kiểu đất trồng.
+ Ordinal (biến thứ tự): một giá trị thuộc dữ liệu ordinal sẽ xác định vị trí của một thực thể so với các thực thể khác như thực thể được đặt ở vị trí thứ nhất, thứ hai, hoặc thứ ba. Nhưng các giá trị này không thiết lập tỷ lệ tương quan giữa các thực thể. Chúng ta không thể suy luận được thực thể này lớn hơn, cao hơn hay nặng hơn thực thể khác bao nhiêu.
+ Interval (biến thời gian): một giá trị thuộc dữ liệu interval biểu diễn một phép đo trên một tỷ lệ như thời gian trong ngày. Những giá trị này nằm trên một tỷ lệ xác định và không liên hệ với một điểm thực nào.
+ Ratio (biến tỷ lệ): một giá trị thuộc kiểu ratio có thể biểu diễn một phép đo trên một tỷ lệ với một điểm cố định và mang ý nghĩa.
Biểu diễn Point, Line và Polygon trong raster
Trong cấu trúc dữ liệu raster, point có thể được biểu diễn bằng một cell. Line được biểu diễn bởi một tập các cell có hướng xác định, độ rộng của line bằng chiểu rộng của một cell. Polygon được biểu diễn bởi một dãy các cell nằm kề sát nhau.
Hình 2.10 Biểu diễn các đối tượng cơ sỏ trong raster
Mặc dù ta có thể xác định các point, line và polygon trong raster một cách trực quan, nhưng nếu ta muốn tương tác với các đối tượng này hiệu quả, cách tôt nhất là ta chuyển đổi chúng từ dữ liệu raster sang dữ liệu vector. Sự chuyển đổi này gọi là vector hoá.
Hình 2.11 Chuyển đổi dữ liệu raster sang vector
Trên hình vẽ ta thấy một quá trình chuyển đổi dữ liệu từ raster sang vector. Độ phân giải của ảnh chụp sẽ ảnh hưởng rất nhiều đến độ chính xác của dữ liệu vector.
Các ưu và nhược điểm của mô hình raster
Ưu điểm lớn nhất của mô hình raster là toàn bộ dữ liệu hình thành bản đồ được lưu trong bộ nhớ máy tính. Do vậy, các thao tác kiểu như so sánh được thực hiện dễ dàng. Tuy nhiên nó sẽ gặp bất lợi cho việc biểu diễn đường, điểm vì mỗi đối tượng này là tập các cell trong mảng. Đường thẳng có thể bị đứt đoạn hay rộng hơn so với hình ảnh thực.
Khó khăn lớn nhất khi xử lý dữ liệu raster là vấn đề “tế bào trộn”. Thí dụ, ta có một bản đồ là vùng ven của một hồ nước nó là hình ảnh bao gồm nước và cỏ ven bờ. Khi biểu diễn chúng trên bản đồ, sẽ gặp khó khăn trong việc quyết định gán từng cell cho lớp ‘nước’ hay lớp ‘cỏ’. Các hệ GIS thường sử dụng phương pháp thoả hiệp: gán thuộc tính ‘sườn’ cho các tế bào thuộc loại này, nghĩa là chung không thuộc lớp nước và cũng không thuộc lớp cỏ. Sau này tuỳ thuộc vào ứng dụng thực tế mà xác định quy luật gán giá trị lại cho chúng.
Một vấn đề khác mà mô hình gặp phải đó chính là việc lưu trữ dữ liệu. Ta biết rằng bản đồ chia ra làm nhiều lớp, mỗi một lớp gồm hàng triệu tế bào biểu diễn một đặc trưng địa lý nào đó. Trung bình một ảnh vệ tinh phủ khoảng 30.000km2 với kích thước của mỗi điểm ảnh là 30m thì có khoảng 35 triệu tế bào. Vì thế có thể nói rằng số lượng dữ liệu cần lưu trữ là khổng lồ, điều này dẫn đến nhiều khó khăn cho hệ thống thông tin. Vấn đề đặt ra là cần phải nén dữ liệu nhờ một số thuật toán thích hợp. Mỗi thuật toán có những ưu điểm riêng: thuật toán bảo toàn dữ liệu cho khả năng khôi phục toàn bộ dữ liệu gốc tuy nhiên tốn về không gian nhớ, thuật toán tối ưu về dung lượng lưu trữ thì có thể mất mát thông tin so với lúc ban đầu.
3. Mô hình lưới tam giác không đều
Các ứng dụng mô hình hoá địa hình đòi hỏi phương pháp biểu diễn độ cao so với bề mặt nước biển. Có rất nhiều mô hình biểu diễn bề mặt thực hiện công việc này, trong đó mô hình “lưới tam giác không đều” - gọi tắt là mô hình TIN được đánh giá là hiệu quả nhất.
Hình 2.12 Bản đồ với mô hình dữ liệu TIN
TIN có khả năng biểu diễn bề mặt liên tục từ những tập hợp điểm rời rạc. Về mặt hình học, TIN là tập các điểm được nối với nhau thành các tam giác. Các tam giác này hình thành nên bề mặt 3 chiều. Các điểm được lưu trữ cùng với giá trị gốc chiếu của chúng. Các điểm này không cần phải phân bố theo một khuân mẫu nào và mật độ phân bố cũng có thể thay đổi ở các vùng khác nhau. Một điểm bất kỳ thuộc vùng biểu diễn sẽ nằm trên đỉnh, cạnh hoặc trong một tam giác của lưới tam giác. Nếu một điểm không phải là đỉnh thì giá trị hình chiếu của nó có được từ phép nội suy tuyến tính (của hai điểm khác nếu điểm này nằm trên cạnh hoặc của ba điểm nếu điểm này nằm trong tam giác). Vì thế mô hình TIN là mô hình tuyến tính trong không gian 3 chiều có thể được hình dung như sự kết nối đơn giản của một tập hợp các tam giác.
Ta có thể lưu trữ sơ đồ của TIN bằng danh sách liên kết đôi hoặc cấu trúc tứ phân. Cả hai phương pháp này đều mô tả cấu trúc hình học tô pô của bản đồ chia nhỏ. Sự mô tả này chấp nhận tất cả các thao tác duyệt cần thiết để đạt hiệu quả.
Trong mô hình TIN ta có thể xây dựng mô hình cấu trúc mạng để giải quyết các bài toán về mô tả đường, vì nó là một trường hợp đặc biệt của bản đồ chia nhỏ.
v1
v2
e8
e4
v4
v3
e6
v5
e1
e7
e5
e2
e3
t2
t1
t3
t4
Hình 1.13 Mô hình cấu trúc mạng của TIN
Đường đi này được lưu vào không gian nhớ trong đó mỗi tam giác t, cạnh e và đỉnh v sẽ cố một bản ghi mô tả đặc trưng của chúng. Bản ghi của tam giác t có 3 trường con trỏ. Các con trỏ này trỏ đến các bản ghi của các cạnh gắn liền với t. Bản ghi mô tả cạnh e có 4 trường con trỏ, trong đó 2 con trỏ trỏ đến hai tam giác gắn liền với nó còn hai con trỏ khác trỏ đến hai đỉnh tạo nên nó. Bản ghi của đỉnh v có ba trường lưu giá trị, đó là toạ độ x, y và giá trị hình chiếu của nó.
Các thành phần của TIN
Mô hình TIN có thể biểu diễn: point, line, polygon.
Hình 2.14 Biểu diễn TIN từ các đối tượng cơ bản
+ Breaklines: là các đoạn thẳng nối với nhau mà ở đó bề mặt của địa hình có sự thay đổi đột ngột.
+ Exclusion area: biểu diễn các bề mặt có cùng độ cao.
+ Project boundary: có thể tách bề mặt ra ngoài một vùng nào đó. Việc này rất quan trọng trong tính toán giá trị.
Phương pháp xây dựng TIN từ một tập các điểm
- Bước 1: thu thập các điểm cùng với toạ độ x, y, z của chúng bằng các thiết bị chụp, hệ thống GPS… Thu thập các đường breakline biểu diễn khu vực mà hình dạng bề mặt thay đổi đột ngột. Xác định các miền có cùng độ cao so với mặt nước biển gọi là Exclusion area.
- Bước 2: từ các dữ liệu về điểm và đường trên, phần mềm GIS sẽ tạo ra một mạng các tam giác tối ưu nhất, tức là các tam giác trong mạng càng đều càng tốt.
- Bước 3: mỗi tam giác ta coi là một bề mặt với độ dốc xác định.
Theo cách xây dựng này, ta có thể tính toán được độ cao (so với mặt biển) tại một điểm có toạ độ x, y bất kỳ bằng cách xác định vị trí tam giác đầu tiên sau đó nội suy theo chiều cao của nó.
Mô hình TIN rất hiệu quả trong xây dựng bề mặt. Mật độ của điểm trên bề mặt tỷ lệ với độ biến đổi của địa hình. Những bề mặt bằng phẳng tương ứng với mật độ điểm thấp và những địa hình đồi núi có mật độ điểm cao.
Phương pháp xây dựng TIN từ các đối tượng hình học cơ bản
Từ tập các point này ta áp dụng thuật toán để tạo ra mô hình TIN. Mô hình TIN này đã phán ánh được hình dạng của bề mặt, nhưng nó không biểu diễn được sự thay đổi khi có một dòng suối hay một cây cầu xuất hiện trên bề mặt.
Trong phần này chúng ta sẽ tìm hiểu cách xây dựng TIN từ point, breakline, và polygon.
Tập các point biểu diễn vị trí với giá trị z biểu thị độ cao. Mật độ của chúng phụ thuộc vào độ dốc của bề mặt.
Breakline biểu diễn một đối tượng tự nhiên cắt ngang qua bề mặt địa hình có độ dốc thay đổi.
Khi đường breakline được thêm vào, một tập các điểm mới được tạo ra tại các giao điểm. Mô hình TIN được cập nhật từ những điểm mới này.
Sau khi TIN tới trạng thái này, ta có thể kiểm tra và thêm bất kỳ point, breakline, hoặc polygon chỉnh sửa và tăng cường bề mặt của TIN
Polygon hoặc là biểu diễn một vùng trong đó các điểm có cùng độ cao, hoặc dùng để phân định danh giới và cắt các phần tam giác.
Hiển thị bề mặt trong TIN
Có nhiều cách để mô tả trực quan bề mặt trong TIN. Ta có thể ứng dụng TIN trên bản đồ 2 chiều trong đó ta dùng mầu sắc để thể hiện: độ cao, độ dốc, hướng. Để hiển thị 3 chiều, ta dùng các phần mềm hộ trợ như ArcInfor của ESRI. Phần mềm cho phép ta nhìn các bề mặt ở nhiều góc nhìn khác nhau với các hình ảnh, đường mức được gấp thành các nếp.
4. So sánh các mô hình
Mô hình vector
Mô hình Raster
Mô hình TIN
Biểu diễn dữ liệu
Mô hình tập trung biểu diễn các đối tượng đơn có độ chính xác cao
Mô hình chủ yếu được áp dụng biểu diễn các sự việc và hình ảnh có tính liên tục
Rất mạnh và hiệu quả trong việc biểu diễn bề mặt và độ cao của đối tượng
Nguồn dữ liệu
Từ các thiết bị thu nhận GPS
Từ bản vẽ trên CAD
Chuyển đổi từ dữ liệu raster hay TIN
Là các ảnh chụp từ máy bay hay vệ tinh
Chuyển đổi từ dữ liệu vector hay TIN
Từ thiết bị thu nhận GPS
Chuyển đổi từ dữ liệu vector
Tập các điểm có thêm độ cao
Lưu trữ
Point lưu toạ độ x, y
Line lưu cặp toạ độ (x, y)
Polygon lưu các point tạo thành các miền đóng kín
Mỗi cell được lưu chỉ số dòng và chỉ số cột đồng thời lưu giá trị tại cell đó
Các đỉnh của tam giác bề mặt lưu toạ độ x, y
Biểu diễn feature
Point biểu diễn các feature có kích thước nhỏ. Line biểu diễn các feature có chiều dài xác định. Polygon biểu diễn các feature trải trên một miền xác định
Point được biểu diễn bằng một cell đơn. Line xác định một tập các cell theo một hướng cụ thể. Polygon biểu diễn tập các cell sát cạnh nhau
Breakline xác định mức thay đổi trên bề mặt. ExclusionArea xác định các polygon có cùng mặt chiếu.
Liên kết hình học tô pô
Liên kết đường (line) sẽ lưu vết của các line liên kết với một nút. Liên kết đa giác (polygon) lưu các đa giác nằm về hai phía của một đoạn thẳng.
Các cell đứng cạnh nhau có thể được xác định vị trí bằng cách tăng hay giảm giá trị của dòng hoặc cột
Mỗi tam giác có thể liên kết với nhiều tam giác xung quanh nó
Kết xuất dữ liệu
Mô hình vector thích hợp cho việc thể hiện chính xác hình dạng và vị trí của đối tượng.
Mô hình raster thích hợp thể hiện hình ảnh hay các đối tượng liên tục
Mô hình TIN chuyên dùng để hiển thị bề mặt địa hình.
5. Lựa chọn mô hình biểu diễn
Mỗi mô hình đều có những ưu điểm và nhược điểm riêng, phù hợp với những mục đích cụ thể. Việc chọn mô hình thích hợp phụ thuộc rất nhiều vào dữ liệu mà sẽ biểu diễn và các thao tác trên dữ liệu đó.
Chúng ta có thể lựa chọn các mô hình này theo một số tiêu trí sau.
Chọn theo đặc trưng của đối tượng
Nếu đối tượng ta cần hiển thị là những đối tượng riêng lẻ không có mối quan hệ ràng buộc thì mô hình vector là thích hợp nhất.
Nếu ta định biểu diễn các đối tượng, sự kiện có tính liên tục và có quan hệ với nhau về mặt thuộc tính tại một vị trí cụ thể thì ta có thể chọn mô hình raster hay TIN. Trong đó, raster mô hình một miền bằng các giá trị thuộc tính tại một ô lưới, TIN mô hình miền bằng các điểm và các giá trị được lấy mẫu tại một vùng có mật độ thay đổi.
Dữ liệu gì đã có sẵn
Bước đầu tiên thiết kế mô hình hệ thống là ta phải xác định tất cả các dữ liệu đồ hoạ mà ta có. Xác định được dữ liệu mà ta có sẵn ảnh hưởng rất nhiều đến việc chọn mô hình biểu diễn. Khi đã tìm thấy kiểu dữ liệu phù hợp nhất, ta phải xét xem dữ liệu đó có đủ về mặt số lượng không và ta có thể tạo mới dữ liệu đó không. Việc tạo mới dữ liệu có ảnh hưởng nhiều đến chất lượng và giá thành của sản phẩm không.
Vị trí của đối tượng
Nếu việc xác định vị trí của đối tượng cần chính xác và rõ ràng thì ta nên chọn mô hình vector, vì mô hình này cho phép ta lựa chọn chính xác vị trí của từng đối tượng trên bản đồ.
Xác định vị trí đối tượng với mô hình raster phụ thuộc nhiều vào kích thước của các cell. Trong mô hình TIN thì chỉ có các điểm và đường breakline là được xác định. Hai mô hình này có nhiều hạn chế trong xác định vị trí.
Kiểu đối tượng cần biểu diễn
Nếu ta định mô tả một đối tượng có kích thước lớn và có giá trị thuộc tính thay đổi theo thời gian hay những đối tượng có đường bao ngoài không rõ ràng thì mô hình raster là thích hợp hơn cả. Trong trường hợp ta cần mô tả các đối tượng mang đặc điểm và hình dạng của bề mặt trái đất như: đỉnh của các dãy núi, thung lũng, các dải đất hay các dòng suối chảy men theo sườn núi, ta nên áp dụng mô hình TIN.
Để biểu diễn các đối tượng tự nhiên như hệ thống sông ngòi, kênh rạch... thì mô hình vector là thích hợp nhất. Chúng ta có thể vẽ hệ thống sông trên một lớp bản đồ, thực hiện các phép phân tích chỉnh sửa trên từng khúc sông.
Phương pháp phân tích dữ liệu
Nếu ta định phân tích bề mặt, mô hình TIN là mô hình cung cấp nhiều các hàm phân tích bề mặt nhất trong các mô hình. Bên cạnh đó, ta có thể chọn mô hình raster. TIN hỗ trợ việc tính toán độ cao giữa các bề mặt, xác định các vùng miền được nhìn thấy từ một điểm trong không gian, xác định độ cao, độ dốc của điểm trên bề mặt…
Nếu ta định phân tích độ phân tán của đối tượng vô định theo thời gian, ví dụ mức độ ô nhiễm, chùm khói… thì ta nên chọn biểu diễn dữ liệu theo mô hình raster. Mô hình này hỗ trợ việc xác định quan hệ giữa các đối tượng gần nhau.
Nếu dữ liệu cần biểu diễn liên quan đến việc xác định vị trí để đặt các các đối tượng lên bản đồ, tìm kiếm đối tượng quan mạng, quản lý hồ sơ đất hay truy vấn các đối tượng trên bản đồ, ta nên chọn mô hình vector.
Định dạng xuất
Kiểu, dáng và chất lượng hình ảnh trên bản đồ cũng ảnh hưởng đến việc ta quyết định nên chọn mô hình biểu diễn nào.
Raster và TIN thích hợp trong việc tạo các bản đồ động với các giá trị thuộc tính thay đổi. Vector tạo bản đồ với các nét rõ ràng của các đối tượng.
IV. MÔ HÌNH CƠ SỞ DỮ LIỆU ĐỊA LÝ
1. Khái niệm cơ sở dữ liệu địa lý (Geodatabase)
Cơ sở dữ liệu địa lý - Geographic Database hay Geodatabase là một cơ sở dữ liệu quan hệ chứa các thông tin địa lý. Nói cách khác, geodatabase là nơi lưu trữ các dữ liệu không gian bên trong một hệ quản trị cơ sở dữ liệu. Tất cả các dữ liệu: dữ liệu vector, raster, bảng và các đối tượng khác của GIS đều được lưu trong geodatabase.
Geodatabase tồn tại ở 2 dạng:
+ Personal Geodatabase cho các ứng dụng đơn, trong quy mô nhỏ. Chúng ta có thể triển khai Personal Geodatabase trong hệ quản trị cơ sở dữ liệu như: MSAccess.
+ Multip Geodatabase cho các ứng dụng đa người dùng với phạm vi lớn. Chúng ta có thể thực hiện dạng này trong các hệ quản trị cơ sở dữ liệu như: Oracle, SQL Server, IBM DB2 và Informix.
Geodatabase hỗ trợ mạnh mô hình dữ liệu vector. Trong mô hình này, ta biểu diễn các thực thể như là các đối tượng có thuộc tính, hành vi, và các quan hệ với các đối tượng khác. Thêm vào đó, mô hình còn biểu diễn các kiểu đối tượng cơ bản như: các đối tượng đơn, các feautre (đối tượng gắn với vị trí cụ thể), networks và topology (các feature có mối quan hệ về mặt không gian với các feature khác). Mô hình geodatabase đơn giản nhất chỉ bao gồm một tập các lớp feature độc lập. Mỗi lớp feature được biểu diễn bởi các point, line, polygon hoặc các annotation.
Feature dataset bao gồm tập các feature classes đặt trong một hệ toạ độ, bao gồm các đối tượng object và các quan hệ giữa feature và object.
Object là thực thể dữ liệu thuộc tính còn feature là thực thể dữ liệu không gian. Relationship liên kết hai thực thể với nhau.
Các object thuộc cùng kiểu tạo thành object class, các feature tạo thành feature class, các relationship tạo thành relationship class
Dữ liệu bên trong một Geodatabase
Geometric networks mô hình các hệ thống tuyến tính như mạng giao thông. Đối tượng này hỗ trợ rất nhiều các chức năng để giải quyết các bài toán về mạng.
Planar topologies cho phép các feature chia sẻ đường biên như: đường biên của tỉnh trùng với đường biên quốc gia
Các Domain là tập các giá trị thuộc tính hợp lệ của các đối tượng. Chúng có thể được biểu diễn dưới dạng ký tự hoặc số.
Validation rules đảm bảo tính toàn vẹn dữ liệu trong Domain.
Raster datasets biểu diễn bản đồ, bề mặt, tính chất của môi trường dưới dạng các file ảnh nhị phân. Đặc trưng của nó là các cell hay pixel.
TIN datasets đại diện một tập các tam giác không đều nằm tại các điểm có các độ cao z so với mặt biển. TIN phù hợp trong việc mô hình hoá bề mặt trái đất đặc biệt là mô phỏng 3D
Nhiều cơ sở dữ liệu lưu giữ các mô tả về các vị trí của các feature trên bản đồ. Các mô tả này được lưu dưới dạng bảng trong geodatabase. Một tiến trình sẽ làm nhiệm vụ chuyển đổi các mô tả này thành các feature.
Bảng trong geodatabase
Trong một geodatabase, bảng có thể dùng để lưu dữ liệu thuộc tính, dữ liệu không gian, và các quan hệ.
Bảng chứa dữ liệu thuộc tính gọi là object class.
Bảng chứa dữ liệu không gian gọi là feature class. Trong bảng này luôn có hai trường được định nghĩa trước là objectID và geometry.
Bảng mà lưu các quan hệ gọi là relationship class. Trong bảng này, ta có thể tuỳ ý tạo các trường để mô tả các thuộc tính của các quan hệ.
Các trường trong bảng
Có hai loại trường: các trường được định nghĩa trước và các trường do người dùng định nghĩa. Loại đầu tiên chỉ áp dụng cho các feature class, loại thứ hai xác định các thuộc tính nhằm mô tả cho các feature trong feature class. Hai kiểu trường này có thể tồn tại trên hai bảng là feature class và object class, hoặc chúng có thể cùng trên một bảng duy nhất feature class.
Thuộc tính trong các trường diễn tả các đặc điểm của một đối tượng. Giá trị thuộc tính được phân thành một số loại như sau:
+ Thuộc tính có thể được chỉ định trước bằng các giá trị bảng mã (giúp cho việc phân loại đối tượng).
+ Thuộc tính có thể mô tả bằng dạng văn bản diễn đạt đặc điểm của một feature.
+ Thuộc tính có thể mô tả khoảng cách, diện tích trong các kiểu số.
+ Thuộc tính dùng làm chỉ mục nhằm xác định duy nhất một đối tượng hay tham chiếu đến một dòng trong bảng khác.
Trường trong geodatabase hỗ trợ các thuộc tính trên và các thuộc tính này có kiểu sau: float, double, short integer, long integer, text, date, objectID, và BLOB (binary large object). Trong đó, objectID là các số nguyên được geodatabase sinh tự động mỗi khi một feature được tạo ra trong feature class. BLOB dùng để lưu dữ liệu âm thanh hoặc hình ảnh.
2. Dữ liệu Vector trong Geodatabase
Vector là cách biểu diễn dữ liệu địa lý toàn diện và thường dùng nhất trong các ứng dụng. Nó đặc biệt phù hợp để biểu diễn các đối tượng có hình dạng, kích thước và đường bao cụ thể. Các đối tượng đó thường được biểu diễn dưới dạng các kiểu hình học cơ bản: point, line, polygon. Dữ liệu vector được lưu trong geodatabase như sau:
+ Object class: là một bảng trong cơ sở dữ liệu chứa các giá trị thuộc tính có liên quan đến feature. Ví dụ, một object class tên “owners” là chủ của các thửa đất “land parcels”. Object class lưu trữ thông tin về các chủ đất của các thửa đất. Chúng ta có thể thiết lập một quan hệ giữa các feature “land parcels” với các “owners”.
Hình 2.17 Object class (owners) và feature class (parcels)
+ Feature class: Feature đơn giản chỉ là một đối tượng có vị trí cụ thể trong không gian thực, trên bản đồ feature class là một tập các feature có cùng kiểu. Các feature class có thể độc lập với các feature class khác hoặc có thể có quan hệ lẫn nhau. Khi ở trong mối quan hệ, các feature class được tổ chức thành một feature dataset. Trong geodatabase, feature class được thể hiện dưới dạng bảng. Trong bảng có một trường đặc biệt để lưu hình dạng và vị trí feature, trường này gọi là “shape” và có kiểu là geometry. Tất các các feature trong một feature class đều có cùng một kiểu geometry. Geometry tồn tại ở một trong 4 dạng: point, multipoint, polyline, và polygon.
+ Feature attributes: là dữ liệu thuộc tính của các feature. Chúng được lưu trong các cột thuộc bảng mô tả feature class. Giá trị của feature attribute cũng ở trong một số kiểu thông thường như: số (float, double, short integer, long integer), văn bản (text), ngày tháng (date). Ngoài ra trong geodatabase, giá trị của feature attribute còn có thể mang một số kiểu đặc biệt là:
ObjectID: có giá trị kiểu long integer, được sinh tự động trong cơ sở dữ liệu mỗi khi một feature class được thêm vào. ObjectID xác định duy nhất một feature và được dùng để nối và thiết lập quan hệ giữa hai đối tượng.
BLOB: chứa các đối tượng phức tạp như hình ảnh và âm thanh. Thuộc tính này cho phép ta lưu bất kỳ một dạng nội dung đa phương tiện nào vào trong một bảng của cơ sở dữ liệu.
Hình 2.18 Thuộc tính bên trong một feature class
+ Feature dataset: là một tập các feature class, object class, relationship class, spatial reference, và geometric networks trên cùng một hệ quy chiếu. Các feature class trong một feature dataset có thể tổ chức để tạo thành một mạng hình học (geometric networks). Điều này rất quan trọng khi ta định xây dựng các ứng dụng có liên quan như: phân luồng giao thông, điều khiển lưu lượng nước trong ống… Bên trong cơ sở dữ liệu, các feature dataset được lưu trong một bảng. Mỗi dòng lưu tên và chỉ danh của feature dataset.
+ Spatial reference: một feature dataset luôn được biểu diễn trong một hệ toạ độ quy chiếu. Điều này cho phép xác định chính xác vị trí của các feature dataset. Spatial reference bao gồm 3 thành phần chính:
- Hệ tọa độ quy chiếu xác định vị trí của feature được chiếu trên bản đồ.
- Miền giới hạn xác định phạm vi của tọa độ.
- Tỷ lệ xác định độ chính xác của tọa độ bản đồ.
Spatial reference luôn kết hợp với một feature class. Nếu các feature class được tổ chức trong một feature dataset thì tất cả các feature class này đều có chung một spatial reference.
Trong một geodatabase có thể có nhiều spatial reference, có thể dùng kết hợp với feature dataset và có thể dùng kết hợp với các feature class độc lập (không thuộc trong một feature dataset nào).
Khi một spatial reference được gán cho một feature class hoặc feature dataset, ta có thể cập nhật hệ tọa độ, tuy nhiên khổng thể thay đổi miền giới hạn và tỷ lệ.
Hình 2.19 Tham chiếu không gian
+ Relationship class: trong geodatabase, relationship dùng để thiết lập quan hệ giữa hai bảng, chỉ có một điểm cần nhớ là bảng có thể là feature class hoặc object class. Có 3 loại quan hệ relationship là topological (hình học), spatial (không gian), và general (thông thường).
- Topological: quan hệ này chỉ được thiết lập giữa các feature, đó là khi ta muốn xây dựng một geometric network (mạng hình học) hay planar topology (các feature chung đường biên). Quan hệ này được ứng dụng trong các bài toán về mạng hay tìm mối tương quan giữa các feature trên bản đồ.
- Spatial: GIS có rất nhiều phép toán phân tích không gian, trong đó nhằm xác định vị trí tương đối của các feature với nhau như nằm sát cạnh, trùng, bên trong, bên ngoài. Quan hệ này cũng chỉ rành riêng cho các feature.
- General: là quan hệ được tạo nên giữa một feature và một object (tức là giữa đối tượng đồ hoạ và thông tin thuộc tính của nó). Trong đó một đầu là “nguồn”, đầu kia là “đích“. Điều này rất quan trọng trong thao cập nhật, khi đối tượng “nguồn” bị thay đổi thì đối tượng “đích” cũng thay đối theo.
Các relationship được tổ chức lại để tạo thành relationship class. Đây là một điểm rất mới của geodatabase so với các cơ sở dữ liệu khác, coi relationship như là một đối tượng, ta có thể dùng các công cụ lập trình (được hỗ trợ) để tác động đến các quan hệ này.
Hình 2.20 Quan hệ giữa các đối tượng
+ Geometric network (mạng hình học): là một tập các feature class được định nghĩa bởi người dùng để tạo thành một mạng dưới dạng các cạnh và nút liên kết với nhau. Trong mạng này, ta sẽ tự xác định các feature class, xác định vai trò của các feature class này trong mạng hình học, đồng thời tổ chức chúng vào một feature dataset. Ví dụ, trong một mạng đường nước, các van và đồng hồ là các nút còn đường ống đóng vai trò các cạnh.
Hình 2.21 Các đối tượng trong geometric network
+ Domain: nhằm xác định các giá trị thuộc tính hợp lệ dưới dạng một tập các giá trị. Domain có thể là một miền giá trị quy định phạm vi cho việc nhập dữ liệu. Thông thường miền giá trị này có kiểu số.
Hình 2.22 Miền giá trị đúng
Giá trị domain cũng có thể ở dạng bảng mã nhằm phân loại các feature. Ví dụ: kiểu đất có thể là “trồng trọt”, “thổ cư”, “xây dựng”. Domain cũng có thể là các giá trị mặc định.
Ta ứng dụng domain không chỉ trong việc kiểm soát giá trị thuộc tính của đối tượng mà còn trong cả các phép toán không gian. Khi ta tiến hành tách đôi một thửa đất, các giá trị thuộc tính mới của thửa đất có thể dựa trên cơ sở tỷ lệ tương quan giữa hai phần đất hoặc ta có thể xác định tạm thời giá trị thuộc tính cho cả hai phần vừa tách. Việc xác định domain trong trường hợp này tuân theo giao thức đã được đặt ra.
+ Validation rules: là các luật ràng buộc về giá trị thuộc tính, liên kết hình học hay vị trí của các feature để đảm bảo tính toàn vẹn của các feature.
Validation rules liên quan chặt chẽ đến một khái niệm là subtype. Các feature trong feature class có thể được phân loại dựa vào một giá trị thuộc tính hay hành vi nào đó. Ví dụ feature là thửa đất ta có thể phân loại theo kiểu đất. Subtype chính là tập các feature có cùng giá trị thuộc tính hoặc hành vi...
Geodatabase định nghĩa 3 kiểu validation rules là: attribute rule, connectivity rule, và relationship rule.
Attribute rule là miền giá trị thuộc tính áp dụng cho một kiểu subtype của một feature class. Ví dụ attribute rule cho một trường tên là Diameter trong một bảng quy định đường kính của ống nước chỉ có các giá trị 10, 15, 25 và 50. Attribute rules gần giống với khái niệm domain.
Connectivity rule xác định một cặp giá trị thuộc tính hợp lệ cho các subtype đối với các feature trong một liên kết mạng. Ví dụ: tại điểm nối của hai ống nước, ống có đường kính A chỉ có thể nối với ống có đường kinh B qua một ống nối được đặt riêng cho hai loại ống này.
Relationship rule ràng buộc quan hệ giữa hai bảng trong cơ sở dữ liệu. Cụ thể là ta có thể thiết lập số lượng tổ hợp khi có kết nối hai bảng. Ví dụ: quan hệ chủ - thửa đất là quan hệ nhiều - nhiều, nhưng ta có thể quy định một thửa đất có thể có không, một, hoặc hai chủ (không có nhiều hơn); một chủ chỉ có không, một, hoặc hai thửa đất.
Hình 2.23 Ràng buộc quan hệ giữa các đối tượng
3. Dữ liệu Raster trong Geodatabase
Geodatabase có thể bao gồm dữ liệu raster là loại dữ liệu được đặc trưng bởi các cell hay pixel. Raster dataset lưu các giá trị được lấy mẫu cho từng cell dưới dạng một ma trận 2 chiều. Các cell đều có kích thước bằng nhau. Vị trí của cell đầu tiên bên cột trái cùng với kích thước của cell và số dòng, cột sẽ xác định vùng không gian trong một raster dataset.
Các cell trong raster dataset có thể mô tả nhiều kiểu dữ liệu như: độ phản xạ ánh sáng của dải quang phổ trong ảnh chụp từ vệ tinh, giá trị mầu sắc của một bức ảnh thường, giá trị bề mặt hay độ cao…
Mỗi raster dataset có thể có nhiều hơn một lớp hay dải giá trị (band). Ví dụ một ảnh mầu có ba dải mầu (đỏ, xanh lá cây, xanh), mô hình độ cao số (DEM) có một dải giá trị, một ảnh quang phổ có nhiều dải giá trị.
Hình 2.24 Các giải giá trị trong raster dataset
Trong geodatabase, raster dataset có thể chiếm một số lượng lớn và bao trùm nhiều vùng địa lý. Geodatabase sẽ tự động chia tập lớn raster dataset thành các phần nhỏ và có thể nén chúng lại để tiện truy cập và lưu trữ. Ta có thể sử dụng mô hình này để xây dựng các raster dataset lớn trong geodatabase.
Vì raster dataset có ứng dụng rất lớn, nên khi phân tích ta sẽ thường xuyên làm việc với một tập con của lớp cơ sở dữ liệu thực thể. Khi làm việc với một raster dataset lớn, ta phải xác định khung nhìn được của raster giảm tối đa các dữ liệu thừa từ phía máy chủ.
Khi xây dựng raster dataset, một khái niệm rất quan trọng cần đề cập đến là Pyramid. Pyramid là sự biễu diễn dữ liệu theo độ phân giải giảm dần. Chiều cao của pyramid là số mức được xác định bởi ứng dụng. Các ứng dụng được xây dựng sẵn sẽ giúp ta tự định nghĩa được chiều cao này.
Pyramid bắt đầu tại lớp cơ sở hay mức 0, đây là lớp ảnh gốc của raster. Pyramid sẽ tiến hành xử lý theo chiều từ gốc đến đỉnh bằng cách gộp bốn điểm ảnh kề nhau ở mức dưới thành một điểm ảnh tại mức trên. Quá trình như vậy sẽ tiếp tục cho tới khi số lượng điểm ảnh nhỏ hơn bốn. Mức mà tại đó quá trình kết thúc chính là đỉnh của pyramid.
Hình 2.25 Mô hình Pyramid
Việc xây dựng pyramid có ý nghĩa rất quan trọng trong việc tăng cường hiệu năng hiển thị dữ liệu raster trên bản đồ. Khi ta tải dữ liệu bản đồ, chúng ta sẽ quy định các mức hiển thị ứng với mỗi tỷ lệ bản đồ. Nếu bản đồ hiển thị với tỷ lệ nhỏ, ta chỉ cần tải dữ liệu của mức đỉnh trong pyramid. Khi người dùng thực hiện các thao tác phóng to, thu nhỏ, tại tỷ lệ nào ta sẽ tải dữ liệu của mức ứng với tỷ lệ đó. Điều này giúp chúng ta tiết kiệm rất nhiều thời gian trong hiển thị dữ liệu raster.
Lược đồ raster trong geodatabase
Trong một raster dataset đơn giản nhất bao gồm các bảng sau:
+ Bảng Raster_Columns: khi ta thêm một raster vào geodatabase, raster này sẽ được lưu tại một dòng trong bảng Raster_Columns. Trong Raster_Columns có một khoá ngoại tham chiếu đến bảng Raster_Table thông qua trường raster_id.
Tên Kiểu dữ liệu Chú thích
rastercolumn_id Interger khoá chính của bảng
description String mô tả bảng Raster_Table
database_name String tên cơ sở dữ liệu
table_name String tên bảng nghiệp vụ (Business_Table)
raster_column String tên raster
cdate Date thời gian mà một raster được thêm vào trong bảng Business_Table
+ Bảng Raster_Table: bao gồm các bản ghi lưu trữ thông tin về các ảnh có trong bảng Raster_Columns.
Tên Kiểu dữ liệu Chú thích
raster_id Interger khoá chính của bảng xác định duy nhất một ảnh được lưu trong bảng
raster_flags Integer một bit được thiết lập theo đặc điểm của ảnh lưu trữ
description String một chuỗi ký tự mô tả ảnh
+ Bảng Raster_Band: ta biêt rằng mỗi ảnh raster có thể được chia thành một hay nhiều giải giá trị. Bảng Raster_Band lưu trữ giải giá trị này cho các ảnh raster. Cột raster_id_column của bảng Raster_Band là một khoá ngoài tham chiếu đến bảng Raster_Table.
Tên Kiểu dữ liệu Chú thích
rasterband_id Integer khoá chính của bảng xác định duy nhất một giải giá trị
raster_id Integer khoá ngoài tham chiếu đến bảng Raster_Table
name String tên của giải giá trị raster
band_flags Integer một bit được thiết lập theo các đặc điểm của giải giá trị raster
block_height Integer
+ Bảng Business: đây là bảng do người dùng định nghĩa, ví như có thể chứa cột miêu tả hình ảnh của ngôi nhà house_image. Đây là một khoá ngoại tham chiếu đến Raster_Table. Trong trường hợp này, Raster_Table lưu một bản ghi cho mỗi ảnh raster của một ngôi nhà.
+ Bảng Raster_Block: bảng Raster_Block lưu các điểm ảnh cho mỗi giải giá trị raster. Geodatabase sẽ “lát” các điểm ảnh này vào các khối theo kích thước do người dùng tự định nghĩa. Kích thước của mỗi khối cùng với phương pháp nén dữ liệu sẽ xác định khối lượng cần lưu trữ của mỗi khối raster. Các khối raster có thể được cấu hình sao cho các bản ghi trong khối raster có kích thước phù hợp với khối dữ liệu trong một hệ quản trị cơ sở dữ liệu.
Bảng Raster_Block bao gồm trường rasterband_id là khoá ngoài tham chiếu đến bảng Raster_Table.
Tên Kiểu dữ liệu Chú thích
rasterband_id Integer khoá ngoài tham chiếu đến bảng Raster_Table
rrd_factor Integer xác định ví trí của khối raster trong mức phân giải của pyramid
row_nbr Integer số dòng trong một khối
col_nbr Integer số cột trong một khối
block_data BLOB mô tả dữ liệu điểm ảnh được “lát” vào trong một khối
+ Bảng Raster_Auxiliary: bảng Raster_Auxiliary là bảng lưu trữ các thông tin về mầu sắc của ảnh bản đồ. Trường rasterband_id là một khoá ngoài tham chiếu đến bảng Raster_Band.
Tên Kiểu dữ liệu Chú thích
rasterband_id Integer khoá ngoài tham chiếu đến bảng Raster_Band
type Integer là số nguyên đặc trưng cho các đặc điểm dữ liệu trong cột object
object BLOB có thể lưu mầu sắc bản đồ, số liệu ảnh…
Mô hình bảng
Raster_Column
rastercolumn_id
description
database_name
owner
table_name
raster_column
1
business
house
Raster_Table
Raster_Band
Raster_Block
Raster_Auxiliary
Business
building_id
house
10
55
raster_id
raster_flags
description
55
rasterband_id
block_height
name
band_flags
raster_id
89
55
rasterband_id
rrd_factor
row_ubr
block_data
89
rasterband_id
type
object
89
CHƯƠNG III
KIẾN TRÚC ARCGIS SERVER
I. VAI TRÒ CỦA ARCGIS SERVER VỚI HỆ THỐNG
Nói chung, khi nhắc đến GIS người ta thường nghĩ đến các phần mềm có thể xử lý, phân tích mọi thao tác bản đồ. Những phần mềm này là những ứng dụng được cài đặt trực tiếp trên máy cá nhân.
Tuy nhiên, mục đích cơ bản của hệ thống cung cấp thông tin cây xăng là cung cấp các thông tin cây xăng đến mọi người dùng dưới dạng bản đồ trực tuyến bao gồm dữ liệu đồ hoạ và dữ liệu thuộc tính, đồng thời thực hiện các thao tác tìm kiếm trên bản đồ.
Yêu cầu cơ bản của hệ thống là cung cấp thông tin qua Internet. Việc áp dụng các phần mềm trên cho hệ thống này là điều không tưởng. Vì vậy ta cần một công nghệ khác để thực hiện mục đích và yêu cầu này. ArcGIS Server là nền tảng để xây dựng hệ thống thông tin địa lý (GIS) có quy mô lớn, trong đó các ứng dụng GIS được quản lý tập trung, hỗ trợ đa người dùng, tích hợp nhiều chức năng GIS mạnh và được xây dựng dựa trên các tiêu chuẩn công nghiệp. ArcGIS Server quản lý các nguồn dữ liệu địa lý như bản đồ, số liệu không gian …
II. VỊ TRÍ CỦA ARCGIS SERVER TRONG HỆ THỐNG ARCGIS
1. Hệ thống phần mềm ArcGIS
ArcGIS là một hệ thống tích hợp các thông tin địa lý do viện nghiên cứu môi trường Mỹ là ESRI xây dựng. Hệ thống bao gồm 3 phần chính sau:
+ Bộ phần mềm ArcGIS Desktop là một tập các phần mềm ứng dụng chuyên xử lý các dữ liệu bản đồ cao cấp: tạo dữ liệu, xuất bản dữ liệu, chuyển đổi dữ liệu …
+ Cổng giao tiếp ArcSDE là một dịch vụ được xây dựng để quản lý dữ liệu bản đồ trong một hệ quản trị cơ sở dữ liệu như SQL, Oracle…
+ ArcGIS Server là một hệ thống phân phối gồm nhiều thành phần có thể triển khai trên nhiều máy khác nhau. Mỗi thành phần này nắm giữ một vai trò cụ thể trong quá trình quản lý, hoạt động hoặc ngừng hoạt động, cân bằng nguồn tài nguyên cung cấp cho một hay nhiều server.
Hình 3.1 Hệ thống phần mềm ArcGIS
Các thành phần của ArcGIS Server bao gồm:
+ Máy chủ GIS (GIS Server): lưu trữ và chạy các ứng dụng server. Máy chủ GIS bao gồm một máy chủ SOM (Server Object Manager) và một hoặc nhiều máy chủ SOC khác (Server Object Containers).
+ Máy chủ Web (Web Server): lưu trữ các ứng dụng và dịch vụ Web có sử dụng các thành phần chạy trên máy chủ GIS.
+ Trình duyệt Web: được dùng để kết nối đến các ứng dụng Web chạy trên máy chủ Web.
+ Các ứng dụng Desktop: kết nối theo giao thức truyền dẫn siêu văn bản (HTTP) đến các dịch vụ Web chạy trên máy chủ Web hoặc kết nối trực tiếp đến máy chủ GIS thông qua môi trường mạng LAN hay WAN.
ArcGIS cũng cung cấp một khung cho phép ta triển khai GIS trong cả môi trường đơn và đa người dùng, đồng thời đây cũng là một hệ phần mềm mở có thể tích hợp thêm các thành phần khác do ta tự thiết kế để phù hợp với mục đích.
2. Phạm vi ứng dụng
Vì ArcGIS được thiết kế như một hệ thống chung để quản lý dữ liệu không gian, nó có rất nhiều ứng dụng trong việc phát triển đô thị và môi trường tự nhiên như là quy hoạch đô thị, quản lý nhân lực, nông nghiệp, điều hành hệ thống công ích, lộ trình, nhân khẩu, bản đồ, giám sát vùng biển, cứu hoả và bệnh tật. Trong phần lớn lĩnh vực này, ArcGIS đóng vai trò như là một công cụ hỗ trợ quyết định cho việc lập kế hoạch hoạt động.
+ Môi trường: theo những chuyên gia GIS kinh nghiệm nhất thì có rất nhiều ứng dụng đã phát triển trong những tổ chức quan tâm đến môi trường. Với mức đơn giản nhất thì người dùng sử dụng ArcGIS để đánh giá môi trường, ví dụ như vị trí và thuộc tính của cây rừng. Ứng dụng ArcGIS với mức phức tạp hơn là dùng khả năng phân tích của ArcGIS để mô hình hóa các tiến trình xói mòn đất sư lan truyền ô nhiễm trong môi trường khí hay nước, hoặc sự phản ứng của một lưu vực sông dưới sự ảnh hưởng của một trận mưa lớn. Nếu những dữ liệu thu thập gắn liền với đối tượng vùng và ứng dụng sử dụng các chức năng phân tích phức tạp thì mô hình dữ liệu dạng ảnh (raster) có khuynh hướng chiếm ưu thế.
+ Khí tượng thuỷ văn: trong lĩnh vực này ArcGIS được dùng như là một hệ thống đáp ứng nhanh, phục vụ chống thiên tai như lũ quét ở vùng hạ lưu, xác định tâm bão, dự đoán các luồng chảy, xác định mức độ ngập lụt, từ đó đưa ra các biện pháp phòng chống kịp thời... vì những ứng dụng này mang tính phân tích phức tạp nên mô hình dữ liệu không gian dạng ảnh (raster) chiếm ưu thế.
+ Nông nghiệp: những ứng dụng đặc trưng trong lĩnh vực này là giám sát thu hoạch, quản lý sử dụng đất, dự báo về hàng hoá, nghiên cứu về đất trồng, kế hoạch tưới tiêu, kiểm tra nguồn nước.
+ Dịch vụ tài chính: ArcGIS được sử dụng trong lĩnh vực dịch vụ tài chính tương tự như là một ứng dụng đơn lẻ. Nó đã từng được áp dụng cho việc xác định vị trí những chi nhánh mới của Ngân hàng. Hiện nay việc sử dụng ArcGIS đang tăng lên trong lĩnh vực này, nó là một công cụ đánh giá rủi ro và mục đích bảo hiểm, xác định với độ chính xác cao hơn những khu vực có độ rủi ro lớn nhất hay thấp nhất. Lĩnh vực này đòi hỏi những dữ liệu cơ sở khác nhau như là hình thức vi phạm luật pháp, địa chất học, thời tiết và giá trị tài sản.
+ Y tế: ngoại trừ những ứng dụng đánh giá, quản lý mà ArcGIS hay được dùng, ArcGIS còn có thể áp dụng trong lĩnh vực y tế. Ví dụ như nó chỉ ra được lộ trình nhanh nhất giữa vị trí hiện tại của xe cấp cứu và bệnh nhân cần cấp cứu, dựa trên cơ sở dữ liệu giao thông. ArcGIS cũng có thể được sử dụng như là một công cụ nghiên cứu dịch bệnh để phân tích nguyên nhân bộc phát và lây lan bệnh tật trong cộng đồng.
+ Chính quyền địa phương: chính quyền địa phương là một trong những lĩnh vực ứng dụng rộng lớn nhất của ArcGIS, bởi vì đây là một tổ chức sử dụng dữ liệu không gian nhiều nhất. Tất cả các cơ quan của chính quyền địa phương có thể có lợi từ ArcGIS. ArcGIS có thể được sử dụng trong việc tìm kiếm và quản lý thửa đất, thay thế cho việc hồ sơ giấy tờ hiện hành. Nhà cầm quyền địa phương cũng có thể sử dụng ArcGIS trong việc bảo dưỡng nhà cửa và đường giao thông. ArcGIS còn được sử dụng trong các trung tâm điều khiển và quản lý các tình huống khẩn cấp.
+ Bán lẻ: phần lớn siêu thị vùng ngoại ô được xác định vị trí với sự trợ giúp của ArcGIS. ArcGIS thường lưu trữ những dữ liệu về kinh tế - xã hội của khách hàng trong một vùng nào đó. Một vùng thích hợp cho việc xây dựng môt siêu thị có thể được tính toán bởi thời gian đi đến siêu thị, và mô hình hoá ảnh hưởng của những siêu thị cạnh tranh. ArcGIS cũng được dùng cho việc quản lý tài sản và tìm đường phân phối hàng ngắn nhất.
+ Giao thông: ArcGIS có khả năng ứng dụng đáng kể trong lĩnh vực vận tải. Việc lập kế hoạch và duy trì cở sở hạ tầng giao thông rõ ràng là một ứng dụng thiết thực, nhưng giờ đây có sự quan tâm đến một lĩnh vực mới là ứng dụng định vị trong vận tải hàng hải, và hải đồ điện tử. Loại hình đặc trưng này đòi hỏi sự hỗ trợ của ArcGIS.
+ Các dịch vụ điện, nước, gas, điện thoại...: những công ty trong lĩnh vực này là những người dùng ArcGIS linh hoạt nhất, ArcGIS được dùng để xây dựng những cơ sở dữ liệu là cái thường là nhân tố của chiến lược công nghệ thông tin của các công ty trong lĩnh vự này. Dữ liệu vecto thường được dùng trong các lĩnh vực này. Những ứng dụng lớn nhất trong lĩnh vực này là Automated Mapping và Facility Management (AM-FM). AM-FM được dùng để quản lý các đặc điểm và vị trí của các cáp, valve... Những ứng dụng này đòi hỏi những bản đồ số với độ chính xác cao. Một tổ chức dù có nhiệm vụ là lập kế hoạch và bảo dưỡng mạng lưới vận chuyền hay là cung cấp các dịch vụ về nhân lực, hỗ trợ cho các chương trình an toàn công cộng và hỗ trợ trong các trường hợp khẩn cấp, hoặc bảo vệ môi trường, thì công nghệ GIS luôn đóng vai trò cốt yếu bằng cách giúp cho việc quản lý và sử dụng thông tin địa lý một cách hiệu quả nhằm đáp ứng các yêu cầu hoạt động và mục đích chương trình của tổ chức đó.
Phạm vi ứng dụng của hệ thống ArcGIS là rất lớn. ArcGIS có thể được triển khai tại bất kỳ quy mô tổ chức nào từ một cá nhân cho đến các tổ chức cấp quốc gia. Khi áp dụng đơn lẻ, hệ thống chỉ yêu cầu các phần mềm Desktop và một dữ liệu để thao tác. Khi áp dụng trong môi trường đa người dùng (một công ty, xí nghiệp) ta cần phải có một hệ quản trị cơ sở dữ liệu đa người dùng và cổng giao tiếp ArcSDE. Khi triển khai trên môi trường mạng, hệ thống yêu cầu thêm ArcGIS Server.
3. Mô hìng dữ liệu trong ArcGIS
ArcGIS sử dụng các mô hình dữ liệu ở mức cao để hiển thị các thông tin bản đồ dưới dạng vector, raster hay một số kiểu dữ liệu khác. Có hai mô hình dữ liệu thường được sử dụng là dữ liệu dưới dạng các file và dữ liệu trong cơ sở dữ liệu.
Mô hình dữ liệu ở dạng file bao gồm: coverage, shapfile, grid, image. Các file ở dạng này được tạo ra nhờ các chương trình chuyển đổi, bản thân dữ liệu bên trong chúng ban đầu được lấy từ trong cơ sở dữ liệu.
Mô hình dữ liệu được lưu trong cơ sở dữ liệu chúng ta quen gọi là geodatabase. Geodatabase hỗ trợ việc lưu và quản lý các thông tin đồ hoạ bên trong một hệ quản trị cơ sở dữ liệu quan hệ. Trong đó, mỗi bảng có thể lưu trữ một lớp trên bản đồ (feature class), mỗi dòng trong bảng lưu một đối tượng của lớp (feature). Trong mỗi bảng thường có một cột dùng để lưu trữ dữ liệu đồ hoạ.
4. Các phần mềm ArcGIS Desktop
ArcGIS Desktop là một hệ bao gồm 3 phần mềm được có quan hệ chặt chẽ là ArcMap, ArcCatalog và ArcToolbox.
Khi kết hợp sử dụng 3 ứng dụng trên, chúng ta có thể thực hiện bất kỳ công việc nào liên quan đến GIS, từ việc đơn giản đến phức tạp như tạo bản đồ, quản lý dữ liệu, phân tích địa lý, chỉnh sửa dữ liệu và xử lý bản đồ.
Có thể nói ArcGIS Desktop là một hệ thống tích hợp hoàn chỉnh được thiết kế để giải quyết các vấn đề của GIS.
+ ArcMap: là ứng dụng trung tâm, quan trọng nhất của ArcGIS Desktop. Nhiệm vụ của nó là xuất bản, phân tích và hiệu chỉnh dữ liệu bản đồ.
Chính vì vậy, đối tượng hay đầu vào của ứng dụng này là dữ liệu bản đồ được cho dưới dạng file hoặc bên trong cơ sở dữ liệu. ArcMap quản lý bản đồ theo từng lớp. Chúng ta dễ dàng cho hiển thị hoặc ẩn các lớp trên bản đồ, thay đổi các thuộc tính của từng đối tượng trên lớp như: mầu sắc, kiểu dáng, dữ liệu thuộc tính… Không chỉ với dữ liệu thuộc tính, ArcMap còn cho phép ta thao tác với các dữ liệu đồ hoạ. Chúng ta có thể thêm, xoá, kéo giãn, chèn ảnh hay ký tự vào bản đồ…
Nhưng đặc điểm quý nhất ở ArcMap là ta có thể thêm vào các module để phù hợp với mục đích của ta thông qua thư viện lập trình ArcObject của ESRI. Bản thân ArcMap cũng được xây dựng từ chính thư viện này. ArcMap cũng tích hợp môi trường VBA bên trong để hỗ trợ các lập trình viên. Tuy nhiên, chúng ta có thể dùng VB, VC để viết các lớp, biên dịch chúng ra các file .dll và đẩy vào trong ArcMap. Vì vậy, có thể gọi ArcMap là một bộ khung xây dựng sẵn và ta chỉ việc thêm vào đó các thành phần để biến ArcMap thành một ứng dụng phục vụ cho những mục đích cụ thể.
+ ArcCatalog: nếu ArcMap là một ứng dụng chuyên để xử lý bản đồ thì ArcCatalog lại có nhiệm vụ tổ chức và quản lý dữ liệu làm đầu vào cho ArcMap.
Để quản lý, ban đầu ArcCatalog phải kết nối đến cơ sở dữ liệu. Nếu là cơ sở dữ liệu đa người dùng ArcCatalog phải sử dụng ArcSDE để kết xuất dữ liệu. Khi kết xuất thành công, dữ liệu được hiển thị dưới dạng bảng như trong bất kỳ hệ quản trị cơ sử dữ liệu nào. Ta có thể chỉnh sửa đối với dữ liệu thuộc tính và hiển thị dữ liệu đồ hoạ như trong ArcMap.
ArcCatalog cung cấp tính năng tìm kiếm dữ liệu trên đĩa, trong cơ sở dữ liệu và trong mạng Intranet. Chúng ta có thể nhập các tiêu chí về dữ liệu trước khi tìm. Khi tìm thấy, một danh sách nguồn dữ liệu được liệt kê và chúng ta có thể chọn kết nối với nguồn dữ liệu mong muốn.
Không chỉ kết nối đến cơ sở dữ liệu có sẵn, ta còn có thể tạo ra chúng. Lúc này ta sẽ hoặc tự thiết lập tất cả các thông số bản đồ như: tỷ lệ, điểm mốc, hệ quy chiếu… hoặc ánh xạ những thông số từ một cơ sở dữ liệu khác. Kết hợp với ArcMap, ta có thể tạo nên một bộ dữ liệu bản đồ của riêng mình.
+ ArcToolbox: là một ứng dụng đơn giản bao gồm rất nhiều các công cụ hỗ trợ việc xử lý bản đồ - có khoảng hơn 100 công cụ như vậy. Vì thế, chúng ta phải xác định rõ công việc định làm để chọn được công cụ phù hợp.
Có hai phiên bản phần mềm ArcToolbox. Một đi kèm với ArcInfor và một đi kèm với ArcView và ArcEditor. Ba phần mềm trên cũng thuộc hệ thống phần mềm ArcGIS Desktop, chúng được phát triển từ ba phần mềm cơ bản ArcMap, ArcCatalog, ArcToolbox và đưa vào đó nhiều tính năng mới.
Các công cụ trong hộp ToolBox hay được dùng: công cụ xử lý bản đồ, chuyển đổi dữ liệu, quản lý mảnh bản đồ, phân tích overlay, thực hiện phép chiếu bản đồ, tạo và tích hợp các mảng dữ liệu vào trong cơ sở dữ liệu địa lý (geodatabase)…
5. Khái niệm ArcSDE
ArcSDE là cổng duy nhất để hệ thống GIS liên kết với các cơ sở dữ liệu quan hệ. Nó cho phép quản lý các thông tin đồ hoạ, cung cấp dữ liệu đến các ứng dụng ArcGIS Desktop, ArcGIS Server và các ứng dụng
Các file đính kèm theo tài liệu này:
- DATN Quan ly he thong cay xang ung dung cong nghe GIS.doc