Tài liệu Luận văn Nắn chỉnh biến dạng hình học và ứng dụng
72 trang |
Chia sẻ: hunglv | Lượt xem: 1440 | Lượt tải: 1
Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Nắn chỉnh biến dạng hình học và ứng dụng, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
§¹i häc Th¸i Nguyªn
khoa c«ng nghÖ th«ng tin
PHẠM ĐỨC HẬU
NẮN CHỈNH BIẾN DẠNG
HÌNH HỌC VÀ ỨNG DỤNG
LuËn v¨n th¹c sÜ : CÔNG NGHỆ THÔNG TIN
Th¸i Nguyªn - 2009
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
§¹i häc Th¸i Nguyªn
khoa c«ng nghÖ th«ng tin
PHẠM ĐỨC HẬU
NẮN CHỈNH BIẾN DẠNG
HÌNH HỌC VÀ ỨNG DỤNG
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60 48 01
LuËn v¨n th¹c sÜ : CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS ĐỖ NĂNG TOÀN
Th¸i Nguyªn - 2009
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
1
MỞ ĐẦU
Xử lý ảnh là một trong những ngành khoa học đã đem lại cho con người
những bước tiến vượt bậc mang tính cách mạng, nó đã đưa con người tiến sang
một kỉ nguyên mới. Một vài năm trở lại đây công nghệ thông tin cùng với sự
phát triển của nó đã kéo theo sự phát triển của hàng loạt các ngành khoa học
trong nhiều lĩnh vực khác nhau như sinh học, kinh tế, viễn thông, quân sự, giải
trí… có những bước tiến nhanh hơn so với đúng quy trình mà đáng ra phải trải
qua. Với sự phát triển ngày càng hoàn thiện của công nghệ phần cứng, công
nghệ phần mềm cũng đang có những bước tiến quan trọng đóng góp một phần
không nhỏ cho sự phát triển của xã hội loài người đặc biệt là lĩnh vực xử lý ảnh.
Trong thực tế đối tượng khi được thu nhận bởi các thiết bị điện tử và
quang học thường không thể hiện được bản chất thực (nguyên thủy) của mình
hay nói cách khác là bị biến dạng đi. Ví dụ: ảnh chụp cuốn sách thường có
một đầu to đầu nhỏ do cách đặt máy ảnh, ảnh chụp bề mặt trái đất từ vệ tinh
bị méo do bề mặt cong của trái đất v.v.. Nói đến xử lý ảnh người ta sẽ hiểu
ngay đây là quá trình hiệu chỉnh hay bằng cách nào đó để làm cho đối tượng
được thu nhận thể hiện được đúng bản chất của mình trên ảnh. Thông thường
khâu đầu tiên của quá trình xử lý ảnh được gọi là khâu tiền xử lý với mục
đích nắn chỉnh các điểm sai lệch trên ảnh sao cho kết quả được giống nhất so
với đối tượng được thu nhận. Nắn chỉnh biến dạng nhằm hiệu chỉnh các
khuyết điểm của đối tượng là khâu tiền xử lý quan trọng trong xử lý ảnh.
Khi sử dụng các thiết bị để thu nhận hình ảnh người ta đã phát hiện ra yếu
tố sai lệch ở kết quả của hình ảnh thu được và để khắc phục điều này người ta
đã tìm cách sửa chữa, nắn chỉnh nhằm có được kết quả tốt hơn. Như vậy nắn
chỉnh biến dạng ban đầu chỉ đơn thuần mang mục đích khắc phục các nhược
điểm của ảnh do thiết bị thu nhận gây ra. Sau đó nhờ chính những kết quả từ
khâu nắn chỉnh đã đem lại những hướng phát triển mới quan trọng trong nhận
dạng và đối sánh. Chẳng hạn nhận dạng tội phạm tự động trong ngành công an
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2
thay vì phải cầm ảnh của họ để đối chiếu với hàng trăm đối tượng đáng nghi
khác có trong máy tính, hoặc xác định độ trùng khớp của một đối tượng với tập
đối tượng cho trước trong khảo cổ học để nghiên cứu quá trình tiến hóa của sự
vật, hiện tượng v.v.. Ngày nay, người ta còn dùng nắn chỉnh biến dạng để “cố
tình” tạo ra các hình dạng theo ý muốn chủ quan. Điển hình là các nhà làm
phim, họ tạo ra các thước phim miêu tả sự thay đổi của một đối tượng theo thời
gian, hoặc quá trình biến đổi từ đối tượng này đến đối tượng khác v.v.. nhờ các
kỹ thuật nắn chỉnh biến dạng với chất lượng không thua kém gì các thước phim
sử dụng thiết bị thu nhận. Việc nghiên cứu các kỹ thuật nắn chỉnh biến dạng
hình học là một việc làm không chỉ có ý nghĩa khoa học và còn mang đậm tính
thực tiễn nhất là trong hoàn cảnh Việt Nam chưa có nhiều hệ thống xử lý ảnh
trong khi thực tế đang đặt ra những yêu cầu đòi hỏi.
Với mong muốn tìm hiểu và nghiên cứu về chủ đề này em đã mạnh dạn
lựa chọn đề tài: "Nắn chỉnh biến dạng hình học và ứng dụng".
Bố cục của luận văn bao gồm phần mở đầu, ba chương chính, phần kết
luận, tài liệu tham khảo và phụ lục. Nội dung các chương được tổ chức như sau:
Chương 1: Khái quát về xử lý ảnh và nắn chỉnh biến dạng. Chương này trình
bày một số khái niệm trong xử lý ảnh, các vấn đề cơ bản của xử lý ảnh. Trình bày
khái niệm, cách phân loại và các ứng dụng cơ bản của nắn chỉnh biến dạng.
Chương 2: Một số kỹ thuật nắn chỉnh biến dạng hình học. Các kỹ thuật
được trình bày dựa vào đặc trưng được xác định để phục vụ cho công việc nắn
chỉnh. Đặc trưng đó có thể dựa trên phân vùng ảnh, trên cơ sở tập các điểm
đặc trưng, dựa trên cơ sở vector, dựa trên kỹ thuật nắn chỉnh khung lưới, v.v..
Chương 3: Ứng dụng nắn chỉnh biến dạng. Phần này trình bầy ứng dụng
nắn chỉnh sách dựa trên các điểm đặc trưng. Kèm theo là một số kết quả.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
3
Chương 1
KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NẮN CHỈNH BIẾN DẠNG
1.1. Khái quát về xử lý ảnh
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một
ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát
triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc
biệt là máy tính chuyên dụng riêng cho nó.
Xử lý ảnh được đưa vào giảng dạy ở bậc đại học ở nước ta khoảng chục
năm nay. Nó là môn học liên quan đến nhiều lĩnh vực và cần nhiều kiến thức
cơ sở khác. Đầu tiên phải kể đến Xử lý tín hiệu số là một môn học hết sức cơ
bản cho xử lý tín hiệu chung, các khái niệm về tích chập, các biến đổi
Fourier, biến đổi Laplace, các bộ lọc hữu hạn…Thứ hai, các công cụ toán
như Đại số tuyến tính, Xác suất, thống kê. Một số kiến thức cần thiết như Trí
tuệ nhân tạo, Mạng nơ ron nhân tạo cũng được đề cập trong quá trình phân
tích và nhận dạng ảnh.
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: Nâng cao
chất lượng ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng cao
chất lượng ảnh báo được truyền qua cáp từ Luân Đôn đến New York từ
những năm 20 của thế kỉ XX. Vấn đề nâng cao chất lượng ảnh có liên quan
tới phân bố mức sáng và độ phân giải của ảnh. Việc nâng cao chất lượng ảnh
được phát triển vào khoảng những năm 50 của thế kỉ XX. Điều này có thể giải
thích được, vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện
cho quá trình xử lý ảnh số thuận lợi. Năm 1964, máy tính đã có khả năng xử
lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao
gồm: làm nổi đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương tiện xử
lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng. Các phương
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
4
pháp tri thức nhân tạo như mạng nơron nhân tạo, các thuật toán xử lý hiện đại
và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều
kết quả khả quan.
1.2. Một số khái niệm cơ bản trong xử lý ảnh
1.2.1. Ảnh số
Ảnh số được tạo nên từ hàng trăm ngàn cho đến hàng triệu ô vuông rất
nhỏ - được coi là những thành tố của bức ảnh và thường được biết dưới tên
gọi là pixels.
1.2.2. Điểm ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng.
Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh. Trong
quá trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông
qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần
giá trị mà về nguyên tắc bằng mắt thường không phân biệt được 2 điểm kề
nhau. Trong quá trình này người ta sử dụng khái niệm điểm ảnh được gọi từ
picture element. Như vậy, một ảnh là một tập hợp các pixel.
Điểm ảnh hay còn gọi là pixel (picture element, pels, image elements)
được xem như là dấu hiệu hay cường độ sáng tại một toạ độ trong không gian
của đối tượng.
Ảnh được xem như là một tập hợp các điểm ảnh. Khi được số hoá nó
thường được biểu diễn là ma trận 2 chiều a[i][j] mà mỗi phần tử có một giá trị
nguyên hoặc là một véc tơ cấu trúc màu.
1.2.3. Mức xám (gray level)
Mức xám là kết quả sự mã hoá tương ứng một cường độ sáng của mỗi
điểm ảnh với một giá trị số - kết quả của quá trình lượng hoá.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
5
Cách mã hoá thường dùng là 16, 32 hay 64 mức. Mã hoá 256 mức là phổ
biến nhất do lý do kỹ thuật. Vì, 28=256 (0,…,255) nên với 256 mức, mỗi
pixel sẽ được mã hoá bởi 8 bit.
1.2.4. Xử lý ảnh số là gì và tại sao chúng ta cần phải xử lý ảnh số
Trong các dạng truyền thông cơ bản: lời nói, văn bản, hình ảnh, âm
thanh thì hình ảnh là dạng truyền thông truyền tải thông tin mạnh mẽ nhất.
Bằng thị giác, con người có thể nhận biết và hiểu về thế giới xung
quanh chúng ta. Ví dụ: Những hình ảnh về trái đất, những hình ảnh trong
dự báo thời tiết…
Có tới 99% lượng thông tin đã biết về thế giới xung quanh được nhận
biết thông qua thị giác.
Việc trang bị cho máy tính có khả năng thị giác như con người không
phải là việc dễ dàng. Chúng ta đang sống trong một không gian 3D, khi máy
tính cố gắng phân tích đối tượng trong không gian 3D thì những bộ cảm biến
có sẵn (camera) lại thường cho ảnh 2D. Như vậy, việc mất mát thông tin của
hình ảnh sẽ xảy ra. Với những cảnh động thì sự di chuyển của đối tượng hay
sự di chuyển của camera, tất cả những việc đó làm cho việc mất mát và sai
lệch thông tin rất lớn.
Ngày nay, cùng với sự phát triển của ngành CNTT, chúng ta mong muốn
đưa được những hình ảnh mà con người có thể nhìn thấy được vào máy tính
để thực hiện các mục đích khác nhau như: phân tích ảnh, phục hồi ảnh...
Để máy tính có thể hiểu và phân tích ảnh thì ảnh cần được mã hoá và
biểu diễn dưới dạng số gọi là ảnh số. Việc xử lý ảnh trên máy tính nhằm mục
đích phân tích ảnh và phục hồi các thông tin bị sai lệch của ảnh trong quá
trình thu nhận.
Như vậy, xử lý ảnh số là thực hiện các phép xử lý đối với ảnh số trên
máy tính. Việc hiểu ảnh, phân tích ảnh và thị giác máy nhằm mục đích nhân
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
6
bản hiệu quả của thị lực con người, giúp chúng ta nhận biết tốt hơn về thế giới
xung quanh.
1.3. Các vấn đề chung liên quan đến xử lý ảnh số
Người ta chia xử lý ảnh thành 2 mức: Xử lý ảnh mức thấp và xử lý ảnh
mức cao (thị giác máy).
Phương pháp xử lý ảnh mức thấp thường sử dụng rất ít kiến thức
(knowledge) về nội dung hay ngữ nghĩa ảnh.
Xử lý ảnh mức cao dựa trên kiến thức, mục tiêu và kế hoạch trong việc
làm thế nào để hoàn thành những mục tiêu đó. Thị giác máy ở mức cao luôn
cố gắng mô phỏng nhận thức của con người và có thể đưa ra những quyết
định dựa vào những thông tin đã biết về ảnh.
Xử lý ảnh mức thấp và thị giác máy ở mức cao khác nhau trong việc sử
dụng dữ liệu ảnh. Dữ liệu ảnh mức thấp bao gồm các ảnh gốc được biểu diễn
dưới dạng ma trận ảnh, các phần tử của ma trận biểu diễn giá trị độ sáng của
điểm ảnh. Trong khi đó dữ liệu ảnh mức cao khởi đầu từ những ảnh tốt,
nhưng chỉ những dữ liệu có liên quan đến các mục đích ở mức cao mới được
đưa ra, việc giảm số lượng dữ liệu là đáng kể. Dữ liệu ở mức cao diễn tả các
thông tin về nội dung ảnh.
1.3.1. Xử lý ảnh mức thấp
Các kỹ thuật xử lý ảnh mức thấp được thực hiện với việc thao tác trên
các ảnh số. Các phương pháp xử lý ảnh mức thấp được đưa ra vào những năm
1970 của thế kỉ XX. Gần đây, các nhà nghiên cứu đang cố gắng tìm ra những
giải thuật có hiệu quả hơn và thực hiện các giải thuật đó trên nhiều thiết bị
tinh vi mang tính kỹ thuật cao. Ví dụ, các máy tương tự (Parallel machines)
đang được sử dụng giúp cho việc tính toán một khối lượng phép tính khổng lồ
của quá trình hoạt động trên tập hợp dữ liệu ảnh trở nên dễ dàng hơn.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
7
Một vấn đề phức tạp và chưa giải quyết được là thứ tự các bước trong
xử lý ảnh mức thấp như thế nào để giải quyết công việc được cụ thể và mục
tiêu tự động hoá vấn đề đó vẫn chưa được thực hiện. Những năm 1980 của
thế kỉ XX, nhiều đề án tập trung cho vấn đề này sử dụng các hệ thống
chuyên gia (expert systems), nhưng các hệ thống chuyên gia vẫn không giải
quyết được vấn đề của chính họ.
Trình tự các bước xử lý như sau đã được công nhận và phổ biến:
(1) Thu nhận ảnh: Một ảnh được thu vào bởi một bộ cảm biến (như TV
camera), từ vệ tinh qua các bộ cảm ứng (sensor) hay ảnh, tranh được quét trên
scanner. Ảnh có thể được thu nhận từ nhiều thiết bị và bằng nhiều cách. Sau
đó ảnh được số hoá để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy
mẫu) và số hoá bằng lượng hoá.
(2) Quá trình xử lý: Là quá trình xây dựng lại ảnh, phục hồi ảnh, khử
nhiễu và tăng cường ảnh.
(3) Mã hoá và nén ảnh: Là bước quan trọng trong việc truyền ảnh.
(4) Phân đoạn ảnh: Máy tính cố gắng tách các đối tượng ảnh riêng biệt ra
khỏi ảnh nền.
Mô tả và phân loại đối tượng trong một tổng thể ảnh đã được phân đoạn
cũng được hiểu là một phần của quá trình xử lý ảnh mức thấp.
1.3.2. Những khó khăn khi xử lý ảnh số
a. Sự hiểu biết về hệ thống thị giác của con người còn hạn chế
Chúng ta không có một sự hiểu biết rõ về vấn đề khi con người quan sát,
xử lý và lưu trữ thông tin trực quan như thế nào. Chúng ta thậm trí không biết
con người đo chất lượng ảnh trực quan và phân loại ảnh như thế nào. Với
cùng một bức ảnh thì sự quan sát ở mỗi người là khác nhau.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
8
Sự chú ý của bạn đến các vùng hay các đường viền khác nhau cũng có
xu hướng làm thay đổi cảm nhận của bạn về bức ảnh.
Thậm chí một ảnh được nhìn với một con mắt không thay đổi thì sự cảm
nhận về bức ảnh đó của con người vẫn thay đổi cho dù là rất ít. Các nhà
nghiên cứu đã làm ổn định hình ảnh trực tiếp trên võng mạc để loại trừ bất kỳ
một hiệu ứng nào xuất hiện từ sự di chuyển của mắt. Và ngay cả trong những
điều kiện đó, giác quan của con người cũng vẫn có thể thay đổi.
b. Sự diễn tả về bản chất của ảnh không thể hiểu được ngay lập tức
Ảnh tương tự được biểu diễn bằng một hàm 2 biến. Sau khi số hoá, ảnh
được biểu diễn dưới dạng ma trận ảnh 2 chiều và được gọi là ảnh số. Máy tính
có thể hiểu và xử lý ảnh số nhưng sự biểu diễn đó không thích hợp cho máy
móc có thể hiểu được. Những kiến thức về ảnh và những thông tin được rút
ra từ ảnh là cần thiết trong việc cố gắng để hiểu được những mảng số đó.
Ví dụ:
Đọc và hiển thị ảnh như một hàm 2 chiều (dùng matlab script)
Hiển thị ảnh dưới dạng ma trận ảnh (dùng matlab)
Hiển thị ảnh với các chương trình hiển thị ảnh (ACDsee trên hệ thống Windows)
Cả hai sự biểu diễn hình ảnh đều chứa những thông tin chính xác như
nhau, nhưng khi quan sát hình ảnh dưới 2 dạng biểu diễn đó thì rất khó để có
thể tìm ra sự tương đồng.
1.4. Ứng dụng của hệ thống xử lý ảnh
- Văn phòng: hệ thống nhận dạng chữ, nhận dạng tiếng Anh, tiếng Việt
nhận dạng được cả chữ, ảnh, bảng:
- Nhận dạng chữ OCR (Optical charater Recognition),
- Nhận dạng nhãn OMR (Optical Mark Recognition)
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
9
- Nhận dạng tiếng Anh
- Nhận dạng tiếng việt
- Kiểm tra sản phẩm
- So sánh mầu của sản phẩm mẫu với sản phẩm mới
- Kiểm tra độ tròn của chai/lọ
- Nhận dạng công nghiệp, y học, thương mại, điều tra khoáng sản
- Địa lý: véc tơ hoá bản đồ.
- Các phần mềm chuyển đổi ảnh Raster sang
ảnh vector: MapScan của Viện CNTT,
TrixSystem R2V và V2R.
- Hoạt hình: biến đổi hình học, bóp méo
hình học.
- Quân sự.
- Dự báo thời tiết, cháy rừng, lũ lụt, sâu
bệnh, khoáng sản.
- Thiên văn học, vật lý, sinh học.
- An ninh:
+ Nhận dạng vân tay, Water Marking.
+ Nhận dạng khuôn mặt người, Nhận dạng tội phạm.
+ Dấu thông tin trong ảnh.
+ Chống bạo lực: dùng camera để phát hiện ra sự an toàn ở nơi
công cộng, Siêu thị…
- Bar code: nhận dạng mã vạch.
- Các robot tự động phục vụ.
- Thư viện: Dùng camera để điều khiển robot.
Hình 1.1 Mô phỏng quá
trình biến đổi hình học
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
10
Ngoài ra có ứng dụng trong y học làm nổi các ảnh, trong thiên văn học
để khôi phục lại ảnh do tác động của khí quyển hay nén ảnh trong truyền đi xa
hoặc lưu trữ.
1.5. Quá trình xử lý ảnh số
a. Phần thu nhận ảnh (Image Acquisition)
Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua
camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh
25 dòng), cũng có loại camera đã số hoá (như loại CCD - Change Coupled
Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh. Camera thường
dùng là loại quét dòng; ảnh tạo ra có dạng hai chiều. Chất lượng một ảnh thu
nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh).
b. Tiền xử lý (Image Processing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào
bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc
nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn.
c. Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để
biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch)
trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về
địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt
để nhận dạng.
Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi,
làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào
công đoạn này.
Nếu thực hiện tách quá chi tiết thì bài toán nhận dạng các thành phần được
tách ra trở nên phức tạp, còn ngược lại nếu quá trình phân đoạn được thực hiện
quá thô hoặc phân đoạn sai thì kết quả nhận được cuối cùng sẽ không chính xác.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
11
d. Biểu diễn ảnh (Image Representation)
Biểu diễn ảnh là quá trình xử lý tiếp sau khâu phân đoạn hình ảnh. Các vật
thể sau khi phân đoạn có thể được mô tả dưới dạng chuỗi các điểm ảnh tạo nên
ranh giới một vùng, hoặc tập hợp tất cả các điểm ảnh nằm trong vùng đó.
Phương pháp mô tả thông qua ranh giới vùng thường được sử dụng khi cần tập
trung sự chú ý vào hình dạng bên ngoài của chi tiết ảnh như độ cong, các góc
cạnh v.v. Biểu diễn vùng thường được sử dụng khi chúng ta quan tâm tới đặc
tính bên trong của vùng ảnh như đường vân (texture) hay hình dạng (skeletal).
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân
đoạn) cộng với mã liên kết với các vùng lân cận. Việc biến đổi các số liệu này
thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn
các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection)
gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng
hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm
vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta
miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác.
e. Nhận dạng và nắn chỉnh bằng nội suy ảnh
Nhận dạng là quá trình phân loại vật thể dựa trên cơ sở các chi tiết mô tả
vật thể đó (ví dụ các phương tiện giao thông có trong ảnh). Nhận dạng ảnh
còn là quá trình xác định ảnh, quá trình này thường thu được bằng cách so
sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nắn chỉnh bằng nội suy
là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét
gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại. Có
nhiều cách phân loại ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các
mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:
- Nhận dạng theo tham số.
- Nhận dạng theo cấu trúc.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
12
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng
trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký
điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch,
nhận dạng mặt người…
f. Cơ sở tri thức (Knowledge Base)
Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ
sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo
nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các
phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt
chước quy trình tiếp nhận và xử lý ảnh theo cách của con người. Trong các
bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con
người. Vì vậy, ở đây các cơ sở tri thức được phát huy.
Các quá trình xử lý liệt kê ở trên đều được thực hiện dưới sự giám sát và
điều khiển dựa trên cơ sở các kiến thức về lĩnh vực xử lý ảnh. Các kiến thức
cơ bản có thể đơn giản như vị trí vùng ảnh nơi có những thông tin cần quan
tâm, như vậy có thể thu nhỏ vùng tìm kiếm.
Trường hợp phức tạp hơn, cơ sở kiến thức có thể chứa danh sách tất cả
những hư hỏng có thể gặp trong quá trình kiểm soát chất lượng thành phẩm
hoặc các ảnh vệ tinh có độ chi tiết cao trong các hệ thống theo dõi sự thay đổi
môi trường trong một vùng.
g. Mô tả (biểu diễn ảnh)
Ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp
theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ
nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ. Thông
thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các
đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên ảnh
(Boundary), vùng ảnh (Region). Một số phương pháp biểu diễn thường dùng:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
13
Biểu diễn bằng mã chạy (Run-Length Code)
Biểu diễn bằng mã xích (Chaine-Code)
Biểu diễn bằng mã tứ phân (Quad-Tree Code)
* Biểu diễn bằng mã chạy
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị
phân. Một vùng ảnh R có thể mã hoá đơn giản nhờ một ma trận nhị phân:
U(m, n) = 1 nếu (m, n) thuộc R
U( m, n) = 0 nếu (m, n) không thuộc R
Trong đó: U(m, n) là hàm mô tả mức xám ảnh tại tọa độ (m, n). Với cách
biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1.
Giả sử chúng ta mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ
độ (x, y) theo các chiều và đặc tả chỉ đối với giá trị “1” khi đó dạng mô tả có
thể là: (x, y)r; trong đó (x, y) là toạ độ, r là số lượng các bit có giá trị “1” liên
tục theo chiều ngang hoặc dọc.
* Biểu diễn bằng mã xích
Phương pháp này thường dùng để biểu diễn đường biên ảnh. Một đường
bất kỳ được chia thành các đoạn nhỏ. Nối các điểm chia, ta có các đoạn thẳng
kế tiếp được gán hướng cho đoạn thẳng đó tạo thành một dây xích gồm các
đoạn. Các hướng có thể chọn 4, 8, 12, 24,… mỗi hướng được mã hoá theo số
thập phân hoặc số nhị phân thành mã của hướng.
* Biểu diễn bằng mã tứ phân
Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh. Vùng ảnh
đầu tiên được chia làm bốn phần thường là bằng nhau. Nếu mỗi vùng đã đồng
nhất (chứa toàn điểm đen (1) hay trắng (0)), thì gán cho vùng đó một mã và
không chia tiếp. Các vùng không đồng nhất được chia tiếp làm bốn phần theo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
14
thủ tục trên cho đến khi tất cả các vùng đều đồng nhất. Các mã phân chia
thành các vùng con tạo thành một cây phân chia các vùng đồng nhất.
Trên đây là các thành phần cơ bản trong các khâu xử lý ảnh. Trong thực
tế, các quá trình sử dụng ảnh số không nhất thiết phải qua hết các khâu đó tùy
theo đặc điểm ứng dụng. Ảnh sau khi được số hóa được nén, lưu lại để truyền
cho các hệ thống khác sử dụng hoặc để xử lý tiếp theo. Mặt khác, ảnh sau khi
số hóa có thể bỏ qua công đoạn nâng cao chất lượng (khi ảnh đủ chất lượng
theo một yêu cầu nào đó) để chuyển tới khâu phân đoạn hoặc bỏ tiếp khâu
phân đoạn chuyển trực tiếp tới khâu trích chọn đặc trưng sau đó thực hiện
nâng cao chất lượng ảnh (tăng độ sáng, độ tương phản, lọc nhiễu) hoặc khôi
phục ảnh (hồi phục lại ảnh thật khi ảnh nhận được bị méo) v.v…
1.6. Các thành phần cơ bản của hệ thống xử lý ảnh
Hình 1.2 Các thành phần chính của hệ thống xử lý ảnh
- Thiết bị thu nhận hình ảnh: Là thiết bị biến đổi quang-điện, cho phép
biến đổi hình ảnh quang học thành tín hiệu điện dưới dạng analog hay trực
tiếp dưới dạng số. Có nhiều dạng cảm biến cho phép làm việc với ánh sáng
nhìn thấy hoặc hồng ngoại. Hai loại thiết bị biến đổi quang - điện chủ yếu
thường được sử dụng là đèn ghi hình điện tử và chip CCD (Charge Couple
Device - linh kiện ghép điện tích).
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
15
- Bộ nhớ trong và ngoài: Trong các hệ thống xử lý ảnh số thường có dung
lượng rất lớn dùng để lưu trữ ảnh tĩnh và động dưới dạng số. Ví dụ, để lưu một
ảnh số đen trắng kích thước 1024x1024 điểm, mỗi điểm được mã hóa bằng 8 bits
cần bộ nhớ ~ 1MB. Để lưu một ảnh màu không nén, dung lượng bộ nhớ phải
tăng lên gấp 3. Bộ nhớ số trong hệ thống xử lý ảnh có thể chia làm 3 loại:
1- Bộ nhớ đệm trong máy tính để lưu ảnh trong quá trình xử lý. Bộ nhớ
này phải có khả năng ghi/đọc rất nhanh (ví dụ: 25 hình/s);
2- Bộ nhớ ngoài có tốc độ truy cập tương đối nhanh, dùng để lưu thông
tin thường dùng. Các bộ nhớ ngoài có thể là ổ cứng, thẻ nhớ flash v.v..
3- Bộ nhớ dùng để lưu trữ dữ liệu. Loại bộ nhớ này thường có dung
lượng lớn, tốc độ truy cập không cao. Thông dụng nhất là đĩa quang ghi 1 lần
(ROM) hoặc nhiều lần (ROM) như đĩa DVD có dung lượng 4.7GB (một mặt).
Ngoài ra trong hệ thống xử lý ảnh còn sử dụng các thiết bị cho phép lưu
ảnh trên vật liệu khác như giấy in, giấy in nhiệt, giấy trong, đó có thể là máy
in phun, in laser, in trên giấy ảnh đặc biệt bằng công nghệ nung nóng v.v.
- Bộ xử lý ảnh chuyên dụng: Sử dụng chip xử lý ảnh chuyên dụng, có
khả năng thực hiện nhanh các lệnh chuyên dùng trong xử lý ảnh. Cho phép
thực hiện các quá trình xử lý ảnh như lọc, làm nổi đường bao, nén và giải nén
video số v.v.. Trong bộ xử lý ảnh thường tích hợp bộ nhớ đệm có tốc độ cao.
- Màn hình hiển thị: Hệ thống biến đổi điện - quang hay đèn hình (đen
trắng cũng như màu) có nhiệm vụ biến đổi tín hiệu điện có chứa thông tin của
ảnh (tín hiệu video) thành hình ảnh trên màn hình. Có hai dạng display được
sử dụng rộng rãi là đèn hình CRT (Cathode-Ray Tube) và màn hình tinh thể
lỏng LCD (Liquid Crystal Display). Đèn hình CRT thường có khả năng hiển
thị màu sắc tốt hơn màn hình LCD nên được dùng phổ biến trong các hệ
thống xử lý ảnh chuyên nghiệp.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
16
- Máy tính: Có thể là máy tính để bàn cũng như siêu máy tính có chức
năng điều khiển tất cả các bộ phận chức năng trong hệ thống xử lý ảnh số.
Một hệ thống xử lý ảnh cơ bản có thể gồm: Máy tính cá nhân kèm theo
vỉ mạch chuyển đổi đồ hoạ VGA hoặc SVGA, đĩa chứa các ảnh dùng để kiểm
tra các thuật toán và một màn hình có hỗ trợ VGA hoặc SVGA. Nếu điều kiện
cho phép, nên có một hệ thống như Hình 1.2 bao gồm một máy tính PC kèm
theo thiết bị xử lý ảnh. Nối với cổng vào của thiết bị thu nhận ảnh là một
video camera, và cổng ra nối với một màn hình. Thực tế, phần lớn các nghiên
cứu của chúng ta được đưa ra trên ảnh mức xám (ảnh đen trắng). Bởi vậy, hệ
thống sẽ bao gồm một thiết bị xử lý ảnh đen trắng và một màn hình đen trắng.
Ảnh mức xám được áp dụng trong nhiều lĩnh vực như sinh vật học hoặc
trong công nghiệp. Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh mức xám
cũng ứng dụng được trên ảnh màu. Với lý do đó, hệ thống ban đầu nên chỉ
bao gồm các thiết bị thu nhận và hiển thị ảnh đen trắng. Với ảnh màu, nên sử
dụng một hệ thống mới trừ trường hợp bạn cần một camera, TV màu và một
màn hình đa tần số (ví dụ như: NEC MultiSync, Sony Multiscan, hoặc
Mitsubishi Diamond Scan) để hiển thị ảnh màu. Nếu khả năng hạn chế, có thể
dùng PC kèm theo, vỉ mạch VGA và màn hình VGA, để dựng ảnh được.
1.7. Nắn chỉnh biến dạng
1.7.1. Khái niệm nắn chỉnh biến dạng
Nắn chỉnh biến dạng thực hiện việc biến đổi hình học giữa hai ảnh: ảnh
nguồn và ảnh đích. Sự biến đổi hình học định nghĩa mối quan hệ giữa các điểm
ảnh nguồn và điểm ảnh đích. Mối quan hệ này có thể được xác định bằng các
hàm toán học được áp dụng trên toàn bộ ảnh hoặc chỉ trên một vùng ảnh nào
đó. Trong nhiều trường hợp ngoài việc xác định các hàm toán học để nắn chỉnh
ảnh, còn phải xác định thêm các đặc trưng sử dụng trong quá trình nắn chỉnh.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
17
Xét về mặt tác động của thuật toán nắn chỉnh thì có hai khuynh hướng:
tác động toàn cục và tác động cục bộ. Để tạo ra tác động toàn cục ta áp dụng
thuật toán, tiêu chí như nhau đối với mọi điểm ảnh. Còn tác động cục bộ thì
việc nắn chỉnh chỉ áp dụng trên một số vùng ảnh, các vùng khác giữ nguyên.
Các thuật toán nắn chỉnh toàn cục có tốc độ xử lý tương đối nhanh. Tuy
nhiên chỉ áp dụng được đối với các yêu cầu đơn giản như co, giãn ảnh, bóp
méo cả ảnh thành tứ giác hay một số hiệu ứng khác như mắt cá, kính núp v.v..
Thuật toán nắn chỉnh cục bộ cho kết quả ấn tượng hơn. Tuy nhiên để có thể
nắn chỉnh theo từng vùng, phải xác định thêm tập các đặc trưng. Ngoài ra việc
xây dựng thuật toán cũng tương đối phức tạp.
Nắn chỉnh biến dạng bằng hình học thực chất là một khâu trong xử lý
ảnh. Với mỗi một dạng ảnh tuỳ theo mức độ, hiện trạng và chủng loại ảnh mà
người ta sử dụng ứng dụng nào phù hợp nhất để xử lý.
1.7.2. Một số kỹ thuật xử lý ảnh sử dụng trong nắn chỉnh biến dạng
Thông thường người ta phân kỹ thuật nắn chỉnh thành 4 loại cơ bản:
- Kỹ thuật nắn chỉnh dựa trên phân vùng ảnh.
- Kỹ thuật nắn chỉnh dựa trên các điểm đặc trưng.
- Kỹ thuật nắn chỉnh dựa trên vector.
- Kỹ thuật nắn chỉnh dựa trên khung lưới.
Hình 1.3 Ví dụ về nắn chỉnh biến dạng
a) Ảnh gốc b) Ảnh qua xử lý
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
18
a. Kỹ thuật dựa trên việc phân vùng ảnh: trước tiên miền không gian của
ảnh nguồn được chia thành một tập các vùng nhỏ. Tương tự như vậy, ảnh đích
cũng được chia thành tập các vùng nhỏ tương ứng. Sau đó ảnh được nắn
chỉnh bằng cách chuyển đổi tương ứng mỗi vùng của ảnh nguồn thành mảnh
của ảnh đích. Một trong những phương thức đầu tiên của kỹ thuật dựa trên
phân mảnh là thuật toán nắn chỉnh 2-pass mesh. Với phương thức này, mỗi
chuyển đổi 2-pass sẽ thay thế một chuyển đổi 2-D thành một dãy các chuyển
đổi 1-D trực giao. Ngoài ra còn có các phương thức nắn chỉnh dựa trên phân
vùng khác như phân vùng dựa trên phân hình tam giác v.v..
b. Kỹ thuật nắn chỉnh dựa trên các điểm đặc trưng: người ta dùng các
điểm quan trọng làm ánh xạ cơ sở, tức là đã xác định được trước ánh xạ của
các điểm đặc trưng. Từ các cặp điểm đặc trưng tương ứng ở trên ảnh nguồn
và ảnh đích ta xác định được ánh xạ của các điểm còn lại xuất phát từ vị trí
của nó trên ảnh gốc. Một số phương thức dựa trên điểm đặc trưng coi nắn
chỉnh như là một hàm nội suy dữ liệu thưa. Sử dụng hàm nội suy để nội suy
tất cả các điểm còn lại.
c. Kỹ thuật nắn chỉnh dựa trên vector: kỹ thuật này sử dụng các cặp
vector làm cơ sở để biến đổi ảnh. Beier và Neely là những người đầu tiên đề
xuất kỹ thuật này. Mỗi cặp vector định nghĩa một ánh xạ tọa độ giữa chúng.
Độ dịch chuyển của bất kỳ điểm nào trong ảnh sẽ bằng tổng trọng số của các
ánh xạ do tất cả các cặp vector đã được xác định.
d. Kỹ thuật nắn chỉnh dựa trên khung lưới: Sử dụng các hàm biến đổi
nhằm đưa ra cách thức xác định tất cả các điểm tương ứng với từng điểm ảnh
thuộc ảnh A có khung lưới là Ma trong ảnh N có khung lưới là Mb. Đây là
công việc cần thiết khi thực hiện nắn chỉnh một ảnh hay đối tượng ảnh bất kỳ.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
19
1.7.3. Các điểm đặc trưng để nắn chỉnh
Trước hết phải xác định các đặc trưng tương ứng giữa ảnh nguồn và ảnh
đích. Đặc trưng có thể là vector, điểm điều khiển, hoặc phân ảnh thành các
mảnh khác nhau v.v.. Đây là bước đầu tiên và cũng là bước rất quan trọng
trong nắn chỉnh biến dạng vì hiệu quả của quá trình nắn chỉnh phụ thuộc rất
nhiều vào việc xác định sự tương ứng giữa hai ảnh. Việc xác định các đặc
trưng của ảnh nhằm cung cấp các thông tin về đối tượng giúp cho sự việc nắn
chỉnh được thực hiện thuận lợi. Các công thức nắn chỉnh bao giờ cũng được
đưa ra dựa trên các đặc trưng và xây dựng các công thức nắn chỉnh là đại diện
cho một thuật toán nắn chỉnh biến dạng.
Để đạt được chất lượng nắn chỉnh hình tốt, chúng ta phải nội suy từng
phần của ảnh gốc sang các phần tương ứng bên ảnh đích. Điều này có nghĩa là
ta đã biểu diễn được thông tin của đối tượng và ánh xạ từng phần của chúng
cho nhau. Đây cũng chính là mục đích của giai đoạn xác định các đặc trưng.
1.8. Phép toán hình thái (Morphology) trong nắn chỉnh biến dạng
- Hình thái là thuật ngữ chỉ cấu trúc của một đối tượng ảnh trong đó có
phạm vi và mối quan hệ giữa các phần của đối tượng.
- Với ảnh nhị phân IMxN, điểm ảnh tại vị trí (x,y) là I(x,y) được xác định:
= 0 nếu đó là điểm nền
= 1 nếu đó là điểm ảnh
Gọi A là tập hợp các điểm ảnh, ta ký hiệu: A={(xi,yi) | I(xi,yi) = 1}
A
c
là tập hợp các điểm nền:
|cA A
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
20
Ví dụ:
0 0 1 1 0
1 0 0 1 0
0 1 0 0 0
A = {(0,2), (0,3), (1,0), (1,3), (2,1)}
+ Phép dịch:
Cho một vector x và tập hợp các điểm A, phép dịch A + x được xác
định bởi:
|A x x A
+ Các phép toán tập hợp Minkowski:
Cho A, B là các tập hợp điểm:
Phép cộng Minkowski:
B
A B A
Phép trừ Minkowski:
B
A B A
+ Phép giãn ảnh và co ảnh
Từ hai phép toán Minkowski, ta có phép toán hình thái cơ bản là phép
giãn ảnh và co ảnh :
Phép giãn ảnh (Dilation):
,
b
D A B A B A
Phép co ảnh (Erosion):
,
B
E A B A B A
Trong đó:
|B B
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
21
+ Một số tính chất:
Giao hoán:
, ,D A B A B B A D B A
Không giao hoán :
, ,E A B E B A
Kết hợp:
A B C A B C
Dịch chuyển bất biến:
A B x A B x
+ Ví dụ minh họa:
(a) Giãn ảnh D(A,B) (b) Co ảnh E(A,B)
Hình 1.4 Phép co và giãn ảnh
A và B có thể được xem là các đối tượng ảnh và B được gọi là phần tử
cấu trúc.
Thông thường, phép giãn ảnh làm tăng kích thước đối tượng ảnh trong
khi phép co ảnh làm giảm kích thước. Điều này tùy thuộc vào việc chọn phần
tử cấu trúc. Có hai phần tử cấu trúc phổ biến thường được dùng là tập hợp kề-
4 và tập hợp kề-8 trong hệ tọa độ Đềcác:
Ý nghĩa:
- Phép giãn ảnh biến đổi giá trị của các điểm nền kề-4 (hoặc kề-8) với
điểm ảnh thành các điểm ảnh, do vậy, nó làm tăng kích thước các điểm ảnh.
- Phép co ảnh biến đổi giá trị của các điểm ảnh kề-4 (hoặc kề-8) với
điểm nền thành các điểm nền, do vậy, nó làm giảm kích thước các điểm ảnh.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
22
Ví dụ:
(a) B = N4 (b) B= N8
Hình 1.5 Minh họa phép co và giãn ảnh
Các điểm ảnh gốc là các điểm màu xám, các điểm thêm vào là các điểm
có màu đen.
* Phép mở và đóng ảnh
Chúng ta có thể kết hợp phép giãn ảnh và co ảnh để tạo nên hai toán tử quan trọng hơn:
Mở ảnh:
, , ,O A B A B D E A B B
Đóng ảnh:
, , ,C A B A B E D A B B
+ Một số tính chất:
- Đối ngẫu:
, ,
, ,
C C
C C
C A B O A B
O A B C A B
- Dịch chuyển:
, ,
, ,
O A x B O A B x
C A x B C A B x
Ý nghĩa:
- Phép mở ảnh sẽ mở rộng những khoảng trống giữa các phần tiếp xúc
trong đối tượng ảnh, làm cho ảnh bớt gai hơn.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
23
- Phép đóng ảnh sẽ làm mất đi những khoảng trống nhỏ trong ảnh, làm
mất đi nhiễu trong ảnh.
* Một số kết quả
Các toán tử cấu trúc thường được áp dụng:
8
1 1 1
1 1 1
1 1 1
B N
1
- - -
- 1 -
- - -
B
2
- 1 -
1 - 1
- 1 -
B
(a) (b) (c)
a) Ảnh A b) Giãn ảnh với 2B c) Co ảnh với 2B
Hình 1.6 Kết quả phép co và giãn ảnh
d) Mở ảnh với 2B e) Đóng ảnh với 2B f) it-and-Miss với B1 và B2
Hình 1.7 Kết quả phép mở và đóng ảnh
* Phép toán HitAndMiss
Cho một ảnh A và hai phần tử cấu trúc B1 và B2, ta có:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
24
1 2
1 2 1 2
1 2
, ,
is , , ,
, ,
C CE A B E A B
HitM s A B B E A B E A B
E A B E A B
với B1 và B2 là giới hạn và rời rạc nhau
1 2B B
(phép toán này còn được gọi là xác định viền mẫu, mẫu B1 cho đối
tượng ảnh và mẫu B2 cho nền ảnh)
+ Đường viền các điểm kề 4:
8,A A E A N
+ Đường viền các điểm kề 8:
4,A A E A N
Cách biểu diễn khác:
Biểu diễn phần tử cấu trúc dưới dạng ma trận
(gồm B1 và B2)
+ Cách thực hiện: dịch chuyển điểm gốc của phần tử cấu trúc lần lượt
trên các điểm ảnh theo thứ tự từ trên xuống dưới, từ trái qua phải, nếu các
điểm nền và điểm ảnh của phần tử cấu trúc khớp với trên ảnh thì ta giữ lại
điểm ảnh đó, nếu không ta đặt thành điểm nền.
4 phần tử cấu trúc được sử dụng để tìm góc của ảnh trong phép toán
HitAndMiss (thực chất là một phần tử quay theo 4 hướng khác nhau)
Sau khi tìm được góc theo các phần tử cấu trúc trên, ta kết hợp chúng lại
để được kết quả là các góc lồi của ảnh.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
25
* Xương ảnh
Khái niệm: Xương ảnh là tập hợp các đường độ dày là 1, đi qua phần
giữa của đối tượng ảnh và bảo toàn được tính chất hình học của đối tượng ảnh.
Tuy nhiên, không dễ dàng để nhận ra xương ảnh:
Ví dụ:
Hình 1.9 Tìm kiếm xương ảnh
Trong ví dụ (a), ta không thể tìm được đường thẳng có độ dày 1 đi qua
giữa đối tượng mà phản ánh được tính chất đơn giản của đối tượng. Trong ví
dụ (b), ta không thể bỏ đi một điểm trong đối tượng kề 8 mà giữ được tính
chất hình học của đối tượng.
Công thức cơ bản:
- Các tập hợp con của xương ảnh Sk(A):
, , 0,1,...kS A E A kB E A kB B k K
với K là giá trị lớn nhất của k trước khi Sk(A) trở thành rỗng.
(a) (b)
Hình 1.8 Sử dụng phép toán HitAndMiss để tìm góc lồi của một ảnh
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
26
ta có:
, ,E A kB B E A kB
Xương ảnh là hợp của các tập con xương ảnh:
0
( ) ( )
K
k
k
S A S A
Như vậy, đối tượng ảnh ban đầu có thể được tái tạo lại từ các tập con
xương ảnh, phần tử cấu trúc B và giá trị K:
0
K
k
k
A S A kB
Tuy nhiên, công thức này không phải lúc nào cũng bảo toàn được tính
chất hình học của ảnh.
+ Phép toán làm gầy ảnh:
Công thức:
1 2 1 2, , itMis , ,Thin A B B A H s A B B
Tùy thuộc vào cách chọn B1, B2 mà ta có các thuật toán làm gầy ảnh khác nhau.
Một cách biểu diễn khác:
Phần tử cấu trúc được dùng để tìm xương ảnh (điểm gốc ở tâm của phần
tử cấu trúc). Tại mỗi bước lặp, ảnh sẽ được làm gầy bởi phần tử cấu trúc bên
trái, sau đó đến phần tử cấu trúc bên phải, tiếp theo với phép quay 90o hai
phần tử cấu trúc trên. Quá trình được lặp đi lặp lại cho đến khi phép toán làm
gầy không dẫn đến sự thay đổi nào nữa.
Hình 1.10 Ví dụ về phép toán làm gầy ảnh
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
27
Chương 2
MỘT SỐ KỸ THUẬT NẮN CHỈNH BIẾN DẠNG HÌNH HỌC
Như ta đã bàn trong chương 1, công việc nắn chỉnh thường có nhiều
bước, nhưng mục đích cuối cùng là nắn chỉnh bề mặt của một vật (đối tượng)
sao cho sau khi nắn chỉnh đối tượng sẽ không bị cong, bị vênh hay nhăn nheo,
và hình ảnh trông sẽ đẹp hơn.
Ta có thể định nghĩa: Nắn chỉnh ảnh là quá trình thao tác trên một đối
tượng ảnh số, sao cho khi ảnh ở bất kỳ hình dạng nào như cong, vênh, bị bóp
méo,… đều có thể được điều chỉnh.
Công việc của nắn chỉnh ảnh thực chất là đi thay đổi hay di chuyển các
Pixel (điểm ảnh) của hình ảnh từ vị trí này sang vị trí khác .
Sau quá trình nắn chỉnh chúng ta sẽ áp dụng kỹ thuật nội suy ảnh để thu
được ảnh có chất lượng tốt hơn cả về mầu sắc và độ tương phản.
2.1. Nắn chỉnh trên cơ sở phân vùng ảnh
Trong trường hợp các điểm đặc trưng được sắp xếp để tạo thành một
lưới bao phủ lên bề mặt ảnh, khi đó ảnh gồm nhiều phần ghép lại với nhau.
Để nắn chỉnh ảnh, chỉ cần nội suy các phần tương ứng của lưới. Tùy thuộc
vào lưới được tạo thành là lưới gì sẽ có kỹ thuật nắn chỉnh tương ứng. Nếu là
lưới tam giác ta có thuật toán biến đổi trên cơ sở phân hình tam giác, nếu là
lưới tứ giác ta có thuật toán biến đổi trên cơ sở phân hình tứ giác v.v..
Khi phân tích ảnh người ta dùng phương pháp phân vùng tam giác và phân
vùng tứ giác. Trong đó kỹ thuật nội suy thường sử dụng là nội suy tam giác
(Affine Interpolation) và nội suy tứ giác (Trilinear Interpolation và Bilinear).
a. Nội suy tam giác
Để biến đổi lưới tam giác này thành lưới tam giác kia ta thực hiện nội
suy từng tam giác tương ứng cho nhau. Cách đơn giản nhất là sử dụng kỹ
thuật ánh xạ dựa trên hệ toạ độ Barycentric.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
28
Ở giai đoạn xác định các điểm đặc trưng (phần sau) chúng ta tạo ra xây
dựng một lưới các tam giác cho ảnh gốc và ảnh đích thoả mãn điều kiện:
Trong đó:
Ti là diện tích của tam giác thứ i
S là diện tích của ảnh.
Đồng thời 3 đỉnh của tam giác là 3 điểm đặc trưng được xác định trên
đối tượng ảnh và có sự tham chiếu một - một giữa các điểm này.
Dựa trên lưới các đặc trưng vừa xây dựng được, ứng với mỗi điểm ảnh
cần nội suy, hàm biến đổi sẽ xác định toạ độ của nó rồi xác định hai điểm có
cùng toạ độ trên ảnh đích và ảnh gốc. Sau đó gán giá trị màu của điểm ảnh
đích bằng giá trị màu của điểm gốc tương ứng.
* Cơ sở lý thuyết
+ Khái niệm về toạ độ Barycentric
Với mỗi điểm M(xm,ym) nằm trong tam giác ABC thì chúng ta đều có
thể biểu diễn toạ độ của nó theo toạ độ các đỉnh của tam giác như sau:
Giải hệ phương trình này ta được một nghiệm duy nhất:
( - ) ( - ) - ( - ) ( - )
( - ) ( - ) - ( - ) ( - )
ya yc xa xm xa xc ya ym
v
ya yc xa xb xa xc ya yb
( - ) ( - ) - ( - ) ( - )
( - ) ( - ) - ( - ) ( - )
ya ym xa xb xa xm ya yb
w
ya yc xa xb xa xc ya yb
u = 1-v-w
Ti = S
i
Ti Tj =
xm = u xa + v xb + w xc
ym = u ya + v yb + w yc
u+v+ w = 1
u,v, w 0
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
29
Chúng ta nói rằng điểm M có toạ độ là (u, v, w) đối với tam giác ABC.
+ Một số đặc điểm cần chú ý của toạ độ Barycentric
Đối với mỗi điểm toạ độ của nó là duy nhất.
Toạ độ của một điểm phụ thuộc vào tỉ lệ các khoảng cách từ nó đến các
đỉnh của tam giác chứ không phải là khoảng cách tuyệt đối giữa chúng.
Nếu khoảng cách tương đối của điểm cần biểu diễn đến điểm cơ sở nhỏ
thì hệ số tương ứng với nó sẽ lớn. Hình 2.1 sẽ minh hoạ cho khái niệm hệ toạ
độ Barycentric.
Đến đây thuật toán đã hoàn toàn rõ ràng. Vậy các bước phải thực hiện
đối với thuật toán này là:
Xây dựng lưới tam giác cho ảnh gốc và ảnh đích
Đối với mỗi cặp tam giác tương ứng với ảnh gốc và ảnh đích ta nội suy
tam giác ở ảnh gốc thành tam giác ở ảnh đích.
Một vấn đề nảy sinh là làm sao có thể tìm được tất cả các điểm thuộc
tam giác ABC một cách hiệu quả?
Có nhiều phương án để giải quyết vấn đề này, phần sau đây sẽ giới thiệu
một phương pháp khá hiệu quả.
* Phương pháp xác định tất cả các điểm thuộc một tam giác
Phương pháp này gồm có các bước như sau:
Tìm các giá trị xmax, xmin, ymax, ymin đối với các đỉnh của tam giác.
(0,1,0)
(1,0,0) (0,0,1)
Hình 2.1 Hệ toạ độ Barycentric
M
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
30
For a = ymin to ymax do
- Tìm giao điểm của đường thẳng y=a với 3 cạnh của tam giác.
- Chỉ xét các giao điểm có hoành độ thuộc [xmin,xmax] và sắp xếp các
giao điểm theo chiều tăng dần của hoành độ.
- Các điểm nằm trên đường thẳng y=a và có hoành độ thuộc đoạn
[x_min,x_max] là thuộc tam giác (với x_ thể hiện hoành độ giao điểm).
Sử dụng thuật toán tam giác người ta có thể xác định được tọa độ các
điểm bị bóp méo dựa vào cặp điểm đặc trưng. Các điểm này được xác định
dựa vào việc xác định tam giác nào là cơ sở, cặp điểm nào là cơ sở. Việc xác
định cặp điểm đặc trưng có thể dựa vào thuật toán sau
Trước tiên định nghĩa một ánh xạ T cho các đỉnh của tam giác: M(A)=A',
M(B)=B', M(C)=C'. Các điểm còn lại sẽ được ánh xạ theo toạ độ Barycentric
(1, 2, 3) nghĩa là:
X= 1*A+2*B+3*C
Trong đó: i 0 và 1+ 2+ 3 =1
Khi đó điểm Y là ánh xạ của X qua M được tính toán như sau:
Y = M(X) = M(1*A+2*B+3*C)
= 1* M (A) +2*M(B) +3*M(C)
= 1*A'+2*B'+3*C'
y = ymin
y = ymax
x
=
x
m
ax
x
=
x
m
in
Hình 2.2 Tìm tất cả các điểm thuộc tam giác theo dòng quét
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
31
b. Phân vùng tứ giác
Nếu lưới xây dựng trên ảnh nguồn và đích tương ứng là lưới tứ giác, ta
cần nội suy các tứ giác cho nhau. Để thực hiện điều này ta dùng phép nội suy
Bilinear. Phép nội suy Bilinear xác định một hàm biến đổi từ một hình vuông
kích thước 0,1x0,1 tới một tứ giác trong không gian (tứ giác này không
nhất thiết phải đồng phẳng). Phép biến đổi được thực hiện tương đương với
hai việc: Thứ nhất là nội suy trên các cạnh AD và BC thu được điểm P và Q.
P = (1-v)A +vD
Q = (1-v)B +vC
Việc tiếp theo là nội suy trên đoạn PQ sử dụng thông số u:
B(u,v)=(1-u)P +uQ
2.2. Nắn chỉnh trên cơ sở tập các điểm đặc trưng
Thuật toán có hướng tiếp cận dựa trên cơ sở các cặp điểm đặc trưng
như đã trình bầy ở trên. Do vậy, điều quan trọng là làm sao có thể biểu diễn
được một điểm bất kỳ theo tập các đặc trưng khi mà lực lượng của tập lớn.
Tuy nhiên, thuật toán lợi dụng tính chất phân vùng của đối tượng ảnh để
Hình 2.4 Nội suy Bilinear
Hình 2.3. Nội suy tam giác
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
32
giảm nhẹ lực lượng hệ cơ sở từ tập các đặc trưng ban đầu giúp cho việc
biểu diễn là khả thi.
Việc xác định các điểm đặc trưng của ảnh nhằm cung cấp các thông tin về
đối tượng giúp cho sự việc nắn chỉnh được thực hiện thuận lợi. Các công thức
nắn chỉnh bao giờ cũng được đưa ra dựa trên các điểm đặc trưng và xây dựng
các công thức nắn chỉnh là đại diện cho một thuật toán nắn chỉnh hình học. Để
đạt được chất lượng nắn chỉnh hình tốt, chúng ta phải nội suy từng phần của
ảnh gốc sang các phần tương ứng bên ảnh đích. Điều này có nghĩa là ta đã biểu
diễn được thông tin của đối tượng và ánh xạ từng phần của chúng cho nhau.
Đây cũng chính là mục đích của giai đoạn xác định các điểm đặc trưng.
Thông thường nắn chỉnh hình dạng người ta dùng phương pháp bình
phương bé nhất hoặc giá trị trung bình nhỏ nhất trên cơ sở thông tin thu được
từ các điểm đặc trưng. Phương pháp bình phương nhỏ nhất (OLS) là một thủ
thuật toán học được sử dụng để ước lượng mối tương quan giữa các biến khác
nhau. Kiểu tương quan đơn giản nhất là:
0 1i i iY b b X e
Kết quả quá trình ước lượng các hệ số b0 và b1 được gọi là b0 mũ và b1
mũ. Các hệ số này được sử dụng để ước lượng biến phụ thuộc Yi mũ.
Chúng ta có thể nói rằng:
0 1i iY b b X
Chênh lệch giữa giá trị thực tế Yi và giá trị ước lượng iY là bằng yếu tố
sai số ei. Điều này có thể viết dưới dạng:
0 1i i i
ii i
Y b b X e
Y Y e
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
33
Minh họa lên đồ thị.
Minh họa ei lên đồ thị.
Mục đích của phương pháp OLS là tối thiểu hóa tổng
2 2
1 2,e e
và
2
3e
.
Hình 2.5 Đồ thị biểu diễn giá trị ước lượng Y
Hình 2.6 Đồ thị biểu diễn giá trị chênh lệch ei
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
34
Minh họa Yi lên đồ thị.
Đường tuyến tính liên hệ X và Y được tính bằng phương pháp OLS là
đáng tin cậy bởi vì nó tối thiểu hóa tổng bình phương các sai số. Nghĩa là nó
tối thiểu hóa:
2
ie
Tương đương với tối thiểu hóa: 2( )i iY Y
Điều này có ba đặc điểm cơ bản:
1. Đường hồi quy đi qua điểm
( , )X Y
, điểm này là trung bình các dữ liệu.
2. Tổng bình phương các sai số hay các phần dư là bằng 0.
3. Phương pháp OLS đưa ra những ước lượng "tốt nhất" phụ thuộc vào
các khái niệm cũng như các điều kiện.
Các Khái Niệm.
Sai Số Ước Lượng Chuẩn[2] (SEE).
1
2 2
EE
2
ie
S
n
Hình 2.7 Đồ thị biểu diễn giá trị thực Yi
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
35
Tổng bình phương tất cả các sai lệch[3] (TSS).
2( )iTSS Y Y
Ta có: TSS = RSS + ESS.
Mô hình giải thích bao nhiêu biến động của biến phụ thuộc! R2 sẽ giải
quyết vấn đề này. R2 là tỉ lệ giữa tổng bình phương tất cả các sai lệch của biến
giải thích với tổng bình phương tất cả các sai lệch, hay:
2 ES 1
S RSS
R
TSS TSS
R2 cao nghĩa là mô hình ước lượng được giải thích được một mức độ cao
biến động của biến phụ thuộc.
Nếu R2 bằng 0. Nghĩa là mô hình không đưa ra thông tin nào về biến phụ
thuộc và dự đoán tốt nhất về giá trị của biến phụ thuộc là giá trị trung bình của
nó. Các biến "giải thích" thực sự không đưa ra được một giải thích nào.
Hình 2.8 Đồ thị biểu diễn tổng bình phương tất cả các điểm sai lệch
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
36
Minh họa lên đồ thị.
Với phương pháp bình phương bé nhất ta có thể xây dựng được tọa độ
điểm cần nắn chỉnh như sau:
Với một điểm (x,y) ở ảnh gốc phải chuyển sang toạ độ (u,v) tương ứng ở ảnh
đích. Phép chuyển đổi này là xác định mối quan hệ giữa (x,y) và (u,v) và ngược lại.
Chuyển đổi ngược được biểu diễn như sau:
T
-1
(x,y) u,v (1.1)
Chuyển đổi thuận sẽ là:
T(u,v) x, y (1.2)
Giải pháp chung là xác định cặp hàm đa thức:
N N
aij Pi(x) Pj(y)
i=0 j=i
(1.3)
N N
bij Pi(x) Pj(y)
i=0 j=i
Hình 2.9 Đồ thị biểu diễn sự biến động của các biến
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
37
Trong đó, hàm P thông thường là đa thức Chebychev và các tham số aij
và bij được xác định bằng phương pháp bình phương bé nhất hoặc giá trị trung
bình nhỏ nhất.
Để xác định đa thức bậc N ta phải có ít nhất k=(N+1)(N+2)/2 điểm đặc
trưng. Trong bài toán này, hệ toạ độ được sử dụng là hệ toạ độ Đề các nên chỉ
cần ba hay nhiều hơn điểm đặc trưng cho đa thức bậc nhất (N=1). Quan hệ
(1.1) sẽ trở thành phương pháp đa thức.
T ([F(uc,vc)]k, [xc,yc]k, x, y) u,v (1.4)
Trong đó, cặp (uc , vc) và (xc, yc) là cặp toạ độ biểu diễn trường của các
điểm đặc trưng và (N+1)(N+2)/2 k.
Biến đổi Affine sáu tham số hay được sử dụng để mô hình hoá biến đổi
từ vị trí toạ độ ảnh gốc sang vị trí ảnh đích. Hình thức của chúng như sau:
u = 0 x + 1 y + 2
v = 3 x + 4 y + 5
Trong đó, (x,y) là điểm ở ảnh gốc cần ánh xạ sang ảnh đích.
(u ,v) là toạ độ ảnh đích.
Các hệ số được ước lượng bằng phương pháp bình phương tối thiểu.
Giả sử ta đã chọn n điểm đặc trưng trên ảnh gốc và ảnh đích, các giá trị
được tính toán như sau:
Đặt: 1 1;
i n i n
i i
i i
x y
x y
n n
;
1 1
2 2
1 1
( )( ) ( )( )
; và
( ) ( )
i n i n
i i i i
i i
i n i n
i i
i i
x x y y x x y y
p q
y y x x
-1
N
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
38
Ta có:
1
0 1
2
1
( )( )
1
( )
i n
i i i
i
i n
i
i
x x u x
q
x x
1 1
1
2
1 1
( )( ) ( )( )
( ) ( )( )
i n i n
i i i i i
i i
i n i n
i i i
i i
y y u x q x x y y
y y q x x y y
2 0 1
1
1
( )
i n
i i
i
u x x x y
n
1 1
3
2
1 1
( )( ) ( )( )
( ) ( )( )
i n i n
i i i i i i
i i
i n i n
i i i
i i
x x v y p y y v y
x x p x x y y
1
4 3
2
1
( )( )
1
( )
i n
i i i
i
i n
i
i
y y v y
p
y y
5 4 2
1
1
( )
i n
i i
i
v y y y y
n
Phương pháp này rất hiệu quả khi nắn chỉnh các vùng có diện tích không
lớn. Tuy nhiên không có giải pháp nào để xác định kích thước vùng đó là bao
nhiêu là phù hợp với phép biến đổi này mà chỉ phụ thuộc vào kinh nghiệm và
thực nghiệm. Nếu ảnh gốc có các mặt cần nắn chỉnh lớn thì chia thành các
vùng nhỏ hơn và thực hiện biến đổi riêng rẽ từng vùng con này.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
39
Để có được kết quả như vậy, ta cần có các phép biến đổi toạ độ của các
điểm ảnh, cụ thể theo thuật toán thì ta biến đổi toạ độ (x,y) thành (u,v). có thể
thể hiện bằng hình ảnh như sau:
Thực chất của việc biến đổi toạ độ x, y là thực hiện kéo x đi một góc α
khi đó: x = u + T*v , y = v
Khi kéo y đi một góc α thì x = u , y = v + T*u
Kết quả kéo sẽ được : x= fx(u,v) , y= fy(u,v)
Nắn chỉnh
Ảnh nguồn Ảnh đích
Hình 2.10 Ảnh gốc và ảnh bị nắn chỉnh
Hình 2.11 Nắn chỉnh bằng cách biến đổi tọa độ các điểm ảnh
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
40
Thuật toán có thể viết như sau:
For ( int u= 0; u< umax; u++) {
For (int v=0; v<vmax; v++) {
Float x = fx(u,v);
Float y=fy(u,v);
Dst (x,y) = Src (u,v);
}
}
Kết quả của thuật toán:
Như đã nói ở thuật toán trên trước khi để nắn chỉnh được ảnh gốc thì ta
cần xác định được các cặp điểm đặc trưng. Đây là bước đầu tiên cũng là bước
quan trọng trong nắn chỉnh ảnh.
Ảnh nguồn Ảnh đích
Hình 2.12 Mô tả sự biến đổi của tọa độ các điểm ảnh
Hình 2.13 Mô tả kết quả thuật toán biến đổi
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
41
2.3. Kỹ thuật nắn chỉnh dựa trên cơ sở vector
Trong trường hợp trên giữa các điểm điều khiển không có sự ràng buộc
nào. Khi các điểm đặc trưng được xác định sao cho chúng tạo thành từng cặp
điểm, tức là các vector, ta sẽ có phương thức nắn chỉnh trên cơ sở các vector.
a. Chuyển đổi với một cặp vector
Xét trường hợp chỉ có một cặp vector: PQ trên ảnh đích và P’Q’ trên ảnh
nguồn. Khi đó với mỗi điểm X trên ảnh đích, điểm X’ tương ứng với X trên
ảnh nguồn được tính như sau:
2
2
.
. ( )
PX PQ
u
PQ
PX perpendicular PQ
V
PQ
Đặt ' 'A B = perpendicular(
' 'P Q
)
)''()''('' ABvPQuPX
Trong đó: Perpendicular() trả lại vector vuông góc, cùng chiều dài với
vector vào. Hướng của perpendicular() có thể chọn một trong hai hướng:
Nếu quay perpendicular() một góc 900 theo chiều kim đồng hồ quanh
gốc của vector perpendicular() thì perpendicular() có hướng trùng với hướng
của vector vào.
Nếu quay perpendicular() một góc 900 ngược chiều kim đồng hồ quanh
gốc của vector perpendicular() thì perpendicular() có hướng trùng với hướng
của vector vào.
Nếu đã chọn hướng nào thì trong suốt quá trình thực hiện biến đổi phải
tuân theo hướng đã chọn.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
42
Giá trị u thể hiện chiều dài của đoạn thẳng và v là khoảng cách tới đường
thẳng. Giá trị của u tăng từ 0 đến 1 khi điểm ảnh tiến từ P đến Q và nhỏ hơn 0
hoặc lớn hơn 1 thì sẽ vượt qua vùng giới hạn. Giá trị của v là khoảng cách từ
điểm ảnh đến đoạn thẳng.
Nếu có một cặp vector thì thuật toán biến đổi được cho như sau:
Với mỗi điểm ảnh X trên ảnh đích:
Tìm cặp giá trị tương ứng (u,v)
Tìm điểm X’ trên ảnh nguồn dựa trên (u,v) vừa xác định
ImgDestination.X = ImgSource.X’
Hình 2.15 minh hoạ cho thuật toán, cách tìm điểm X’ khi biết PQ, P’Q’
và điểm ảnh X.
Trong đó ảnh góc trên bên trái là ảnh gốc, các ảnh còn lại là các ảnh kết
quả với đoạn thẳng được xác định tương ứng.
Hình 2.14 Cặp đoạn thẳng đơn
Hình 2.15 Một số kết quả minh họa của thuật toán
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
43
b. Chuyển đổi với nhiều cặp vector
Biến đổi với nhiều cặp vector sẽ phức tạp hơn so với một cặp vector. Trong
thuật toán này chúng ta sẽ tính toán thêm các giá trị weight cho sự biến đổi của
từng vector. Mỗi điểm X’ sẽ được tính toán cho từng cặp vector. Độ dịch chuyển
Di=Xi’-X đo sự sai khác giữa vị trí của điểm ảnh nguồn và đích. Một trọng số
dựa trên những độ dịch chuyển này sẽ được tính toán. Trọng số này sẽ được xác
định bởi khoảng cách từ X đến vector. Giá trị trọng số này được thêm với X để
xác định điểm X’ cần lấy trên ảnh nguồn. Trường hợp vector đơn sẽ là một
trường hợp đặc biệt của trường hợp nhiều vector nếu như giá trị weight không
bao giờ là 0 tại mọi điểm trên ảnh. Giá trị weight là lớn nhất nếu điểm ảnh nằm
đúng trên vector và sẽ là bé nhất nếu nó nằm xa vector nhất.
Công thức tính weight được cho như sau:
( )
b
plength
W
a dist
Trong đó:
Length là chiều dài của vector, dist là khoảng cách từ điểm ảnh đến
vector, a, b, p là các hằng số dùng để thay đổi quan hệ giữa các vector.
Nếu a tiến tới 0 và dist đúng bằng 0 thì weight tiến tới vô cực. Khi đó điểm
ảnh nằm trên vector gốc sẽ được ánh xạ đúng đến vị trí tương ứng trên vectơ
đích. Giá trị a lớn sẽ cho kết quả nắn chỉnh tốt hơn (trơn hơn). Giá trị b thể hiện
sự tác động của chiều dài vector đến các điểm ảnh. Nếu b lớn thì điểm ảnh chỉ bị
tác động bởi một vector có khoảng cách đến nó ngắn nhất. Nếu b=0 thì điểm ảnh
sẽ bị tác động như nhau đối với mọi vector. Giá trị hay sử dụng của b là [0.5;2].
Giá trị của p là [0;1]. Nếu p = 0 thì tất cả các weight không phụ thuộc vào chiều
dài vector. Nếu p=1 thì vector nào dài hơn sẽ có weight lớn hơn.
Thuật toán được cho như sau:
For mỗi điểm X trên ảnh đích
DSUM=(0,0)
Weightsum =0
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
44
For mỗi vector PiQi
Tính u, v dựa trên Pi,Qi
Tính X’i dựa trên u,v và Pi’Qi’
Di=Xi’-X
dist = khoảng cách từ X tới PiQi
weight= ((lengthp)/(a+dist))b
DSUM=DSUM+Di*weight
weightsum=weightsum+weight
X’=X+DSUM/weightsum
ImgDestination.X=ImgSource.X’
Hình 2.16 là một minh hoạ cho việc tính toán điểm X’ trên cơ sở biết X
và các cặp vector tương ứng.
Hình 2.16 Nhiều cặp vector
Hình 2.17 Kết quả của thuật toán
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
45
Với kỹ thuật vector khi thực hiện bóp méo một hình ảnh thì hình ảnh
không còn ở trạng thái ban đầu nữa, tuy nhiên khi các tọa độ ánh xạ sang ảnh
đích thì một số pixel ảnh sẽ không thể ánh xạ sang được, vì vật sẽ khó khăn
cho việc chuyển đổi màu của ảnh.
Việc xác định lại màu sắc cho ảnh lại phải sử dụng đến thuật toán tô màu
(theo làn, theo dòng,..). Nhưng để sử dụng được các thuật toán này thì việc
tìm tọa độ của các điểm ảnh là rất quan trọng. Hình 2.18 cho thấy khi bóp
méo ảnh thì tọa độ thay đổi phụ thuộc vào hàm chuyển đổi f, hàm này có thể
được xác định bằng thuật toán vector như đã trình bày ở trên.
2.4. Kỹ thuật nắn chỉnh dựa trên khung lưới
2.4.1. Xây dựng hàm biến đổi
Hàm biến đổi được trình bày sau đây sẽ chỉ ra cách thức xác định tất cả
các điểm tương ứng với từng điểm ảnh thuộc ảnh A có khung lưới là Ma
trong ảnh N có khung lưới là Mb. Đây là công việc cần thiết khi thực hiện nắn
chỉnh một ảnh hay đối tượng ảnh bất kỳ.
Công việc này được tiến hành qua hai giai đoạn: quét ngang và quét
dọc. Do hai giai đoạn này được thực hiện tương tự nhau nên chúng ta chỉ trình
bày đại diện một giai đoạn là giai đoạn quét ngang.
Hình 2.18 Tọa độ ảnh thay đổi khi bóp méo
x = fx(u,v)
y = fy(u,v)
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
46
Giả sử khung lưới Ma và Mb của hai ảnh A và B như hình vẽ:
Ở giai đoạn quét ngang chúng ta sẽ chỉ quan tâm đến các đường B-
Spline dọc trên cả hai ảnh và xếp chồng chúng với nhau. Chú ý rằng có một sự
tham chiếu một - một giữa các đường B-Spline dọc này. Chúng ta sẽ quét từng
dòng ngang từ trên xuống dưới, với mỗi dòng quét ngang chúng ta sẽ xác định
giao của nó với các đường B-Spline.
Các bước cần làm đối với đường quét ngang có phương trình y=a được
xác định như sau (xem minh hoạ trong hình 2.20):
Xây dựng một hệ trục toạ độ hai chiều.
Xây dựng các điểm, mỗi điểm này nhận giá trị hoành độ giao điểm của
đường quét ngang với các đường B - Spline của ảnh A làm hoành độ và hoành
độ giao điểm với đường B-Spline tương ứng với nó trên ảnh B làm tung độ.
Xây dựng một đường cong đi qua tất cả các điểm này.
Hình 2.19 Khung lưới B-Spline của hai ảnh
Hình 2.20 Xác định các điểm tương đương cho mỗi dòng quét
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
47
Đường cong trong hình 2.20 là ánh xạ hoành độ của các điểm có tung
độ là a của hai ảnh A và B.
Với cách xác định tọa độ điểm như thuật toán khung lưới thì ta có thể
xác định được tọa độ của các điểm ảnh khi ánh xạ sang ảnh đích.
Theo công thức cosi thì tọa độ đó có thể xác định theo công thức sau:
Quay một góc Θ :
x = ucosΘ - vsinΘ
y = usinΘ + vcosΘ
Mô tả bằng hình ảnh như sau:
2.4.2. Nhận xét kết quả
Đây là thuật toán có chất lượng đầu tiên, tuy nhiên nó cũng chưa thật tốt.
Thời gian chạy tương đối lâu do phải làm việc với các đường cong
phức tạp là B-Spline.
Cần nhiều tương tác của người sử dụng trong việc xây dựng khung lưới.
Trong nhiều trường hợp mô hình khung lưới không phù hợp.
2.5. Xây dựng khung nắn chỉnh
Vấn đề đặt ra ở đây là phải xác định được các cặp mặt tương ứng giữa
ảnh gốc được chụp vào cần nắn chỉnh và ảnh đích. Cũng giống như việc xác
Quay
300
Hình 2.21 Cách xác định tọa độ mới
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
48
định các cặp điểm đặc trưng, ta chưa có một phương pháp hiệu quả nào để
cho phép tự động nhận biết các mặt này. Vì thế không còn phương pháp nào
khác là nhờ sự trợ giúp của con người một cách thủ công. Việc xác định các
mặt đồng nghĩa với việc chia ảnh thành các vùng đa giác mà các đỉnh của đa
giác là các điểm đặc trưng.
Thực tế người ta cũng có thể nắn chỉnh được mà không cần bước xác
định các mặt của đối tượng cần nắn chỉnh. Vì trên cơ sở các điểm đặc trưng
đã chọn, dùng phương pháp nội suy dựa trên lưới tam giác và tập các điểm
đặc trưng là tìm ra ngay được công thức biến đổi đối với mỗi điểm ảnh cần
nội suy. Tuy nhiên sẽ gặp phải một số khó khăn sau:
Khối lượng tính toán tăng lên.
Bởi vì: Đối với mỗi điểm ảnh bất kỳ cần nội suy thì ta phải xét ảnh
hưởng của tất cả các điểm đặc trưng của ảnh đối với điểm đó. Nghĩa là, một
điểm ảnh của vùng này thực chất chỉ cần xét sự ảnh hưởng của các điểm đặc
trưng thuộc vùng đó đến nó nhưng làm theo cách không phân vùng thì phải
xét đến cả những điểm đặc trưng của các vùng còn lại.
Việc nội suy thiếu chính xác. Do đó hiệu quả nắn chỉnh không cao.
Chính vì những nhược điểm trên khi không định nghĩa rõ ràng các
mặt cần nội suy nên ở đây sẽ sử dụng phương pháp chia ảnh thành các
vùng cần nội suy riêng biệt nhằm mục đích xây dựng khung cho đối tượng
cần nắn chỉnh.
2.6. Các mô hình nắn chỉnh sử dụng trong phần mềm IrasC
2.6.1. Các mô hình nắn chỉnh trong IrasC
Nói chung mục đích của quá trình nắn là chuyển đổi các ảnh quét đang
ở toạ độ hàng cột của các pixel về toạ độ trắc địa (toạ độ thực - hệ toạ độ địa
lý hoặc toạ độ phẳng). Đây là bước quan trọng nhất trong quá trình thành lập
ảnh số vì nó ảnh hưởng tới toàn bộ độ chính xác của ảnh sau khi được số hoá
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
49
dựa trên nền ảnh. Quá trình này được dựa trên toạ độ của các điểm khống chế
ảnh, toạ độ của các điểm khống chế tương ứng trên file.dgn và mô hình được
chọn để nắn. Các mô hình nắn được viết sẵn trong phần mềm IrasC.
Phần mềm IrasC nhằm phục phụ các thao tác xử lý ảnh raster, cho phép
hiển thị, xử lý nâng cao chất lượng hình ảnh và xuất ra các dữ liệu raster phục
vụ cho các ứng dụng khác nhau. Phần mềm này cho phép xử lý ảnh hàng
không, vệ tinh hoặc bất kì loại dữ liệu dạng raster đã được quét và lưu trữ
dưới dạng tệp tin. Các điểm ảnh trong các tệp tin này được hiển thị với phạm
vi màu rộng và độ đậm nhạt khác nhau. Có thể hiển thị đơn sắc (đen trắng),
ảnh đa phổ màu hoặc ảnh tổ hợp màu.
* Mô hình Hermert: Là mô hình chuyển đổi tuyến tính có khả năng
hiệu chỉnh được sự xoay, sự dịch chuyển, tỷ lệ chiều dài trên hai trục x và y
là một hằng số. Phép lấy mẫu trong mô hình này là tự lựa chọn. Mô hình
nắn chuyển này chỉ sử dụng nắn file quét từ bản đồ, tuy nhiên cũng ít được
sử dụng:
* Mô hình Affine: Là mô hình chuyển đổi tuyến tính có khả năng hiệu
chỉnh sự xoay, sự dịch chuyển nghiêng và tỷ lệ. Mô hình chuyển đổi này
thường được áp dụng khi nắn file quét từ bản đồ. Phép lẫy mẫu trong mô hình
này là tuỳ chọn.
* Mô hình Projective: Là mô hình chuyển đổi theo nguyên lý hình học
chiếu, tức là áp và gắn một hệ thống lưới không song song vào một hệ thống
lưới song song. Mô hình chuyển đổi này thường áp dụng cho ảnh hàng không.
Phép lấy mẫu trong mô hình này là bắt buộc.
* Polynomial Equations: Là mô hình chuyển đổi xây dựng trên các
công thức toán học phức tạp. Mô hình chuyển đổi này được phân thành nhiều
bậc khác nhau trên cơ sở số mũ cao nhất của các đa thức chuyển đổi bậc hai,
bậc ba, bậc bốn và bậc năm.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
50
2.6.2. Quá trình nắn chỉnh ảnh
Quá trình nắn ảnh được tiến hành qua các bước sau:
- Mở file.dgn: Được mở trong môi trường MicroStation khi dùng để
nắn ảnh cần thoả mãn các yêu cầu sau:
+ File.dgn được tạo trên cơ sở file seed để được khai báo chuẩn về hệ
thống toạ độ
+ Toàn bộ các tham số khác như đơn vị đo độ dài, đo góc... đơn vị đo
trên toạ độ phẳng, toạ độ địa lý được khai báo rõ ràng và đầy đủ
- Thu thập các điểm khống chế vào file.dgn: Sau khi mở hoặc tạo file
mới, ta lần lượt nhập các điểm khống chế toạ độ.
- Mở hiển thị file ảnh
- Lựa chọn phương pháp nắn ảnh: Modul IrasC cung cấp cho người sử
dụng bảy phương pháp nắn, ta có thể chọn phương pháp nắn phù hợp từ nút
tuỳ chọn Model trong hộp hội thoại Residual. Sau khi chọn xong phương
pháp nắn, kết quả nắn sẽ được xuất ra File*.itm, ta cần ghi file này vào bộ nhớ
để tiện xử lý sau này
- Lựa chọn phương pháp lẫy mẫu: Đối với phương pháp nắn được lựa
chọn là phi tuyến tính thì việc lẫy mẫu là bắt buộc còn đối với phương pháp
nắn là tuyến tính thì việc lẫy mẫu là tuỳ chọn.
- Tiến hành nắn ảnh: Sau khi chọn xong phương pháp lấy mẫu ta sẽ tiến
hành nắn ảnh. Quá trình nắn được tiến hành theo hai bước là nắn sơ bộ và nắn
chính xác.
+ Nắn sơ bộ được lựa chọn theo phương pháp nắn Affine hoặc Project.
Trong sản xuất hiện nay người ta thường hay sử dụng phương pháp nắn
Affine vì theo như phương pháp này thì khi nắn ta chỉ cần nắn ba điểm cũng
có thể đạt độ chính xác cần thiết
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
51
+ Nắn chính xác được lựa chọn theo phương pháp nắn Affine vì
phương pháp nắn này cho độ chính xác rất cao. Số lượng điểm cần nắn tối đa
là 25 điểm gồm 4 điểm mấu khung, các mắt lưới và các điểm dàn trải đều trên
khung bản đồ.
- Đánh giá sai số của các điểm khống chế của các điểm thu nhận: Sai số
vị trí toạ độ và vị trí trên ảnh của các điểm khống chế.
- Lưu file ảnh: Sau khi thực hiện các sửa đổi trên ảnh như điều chỉnh độ
sáng tối và tương phản xoay ảnh, ghép ảnh, nắn ảnh, ta sẽ lưu ảnh sửa đổi vào
file ảnh gốc đã mở.
* Với phần mềm nắn chỉnh, các bước cụ thể như sau:
- Mở ảnh bằng phần mềm. Người sử dụng cần cập nhật toạ độ thực (toạ
độ ảnh) của điểm khống chế để kết thúc việc chọn điểm khống chế thứ nhất.
- Tiến hành các bước chọn điểm khống chế như vậy cho tới khi số
lượng điểm khống chế đạt yêu cầu kỹ thuật.
- Khi số lượng điểm khống chế đạt 4 điểm trở lên, sai số trung bình
RMS sẽ được chương trình tính toán tự động cho mỗi điểm và cho tập hợp
điểm. Sai số này được hiển thị. Trong trường hợp này độ chính xác tối
thiểu cho việc nắn chỉnh hình học cần đạt phải nhỏ hơn hoặc bằng 1.0,
tương đương với sai số vị trí cực đại là một pixel ảnh. Các điểm khống chế
phải được chọn ở những vị trí ít có biến đổi như ngã ba đường, hoặc địa vật
rõ nét như toà nhà.
- Sau khi lựa chọn các điểm khống chế, hiển thị danh sách các điểm
khống chế người sử dụng có thể xem lại các vị trí điểm khống chế đã chọn
trên ảnh bằng cách chọn điểm đó trong danh sách.
- Đôi khi một số điểm khống chế có sai số lớn quá thì người sử dụng có
thể thay đổi lại vị trí điểm bằng cách chọn điểm đó trên ảnh rồi Update. Giá
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
52
trị toạ độ (hàng - cột) mới sẽ được cập nhật tức thời và sai số RMS cũng sẽ
được tính toán lại.
- Người sử dụng có thể xoá điểm khống chế có sai số lớn bằng cách
chọn điểm khống chế rồi xóa.
- Trong trường hợp không muốn xoá điểm khống chế nhưng loại bỏ
điểm này khỏi danh sách tính toán, và nắn chỉnh ảnh, người sử dụng có thể
“giấu” điểm đó đi.
- Ngược lại với thao tác này, người sử dụng có thể nạp lại các điểm
khống chế đã lựa chọn trước đây từ file đã lưu.
- Để bắt đầu việc nắn chỉnh hình học ảnh, chương trình sẽ hiển thị để
người sử dụng lựa chọn ảnh cần nắn.
- Khai báo phương pháp nắn Warp Method theo bậc 1, 2 hoặc 3; lựa
chọn tên tập tin lưu ảnh sẽ nắn. Nếu bộ nhớ được chọn, ảnh kết quả sẽ được
lưu tạm trong bộ nhớ của máy và sẽ bị xoá đi khi kết thúc chương trình sau đó
người dùng có thể bắt đầu quá trình nắn ảnh.
- Kết quả chất lượng của ảnh phụ thuộc rất nhiều vào công đoạn lựa
chọn điểm khống chế ảnh. Để hạn chế sai số, thông thường, các điểm khống
chế được lựa chọn sao cho chúng phân bố đều trên toàn bộ diện tích sẽ nắn,
đồng thời, bao phủ được tới đường biên (theo khung hình) của ảnh. Sai số sẽ
chọn điểm nắn RMS Error càng nhỏ thì độ chính xác của kết quả sẽ càng cao.
Tổng số điểm khống chế cho một cảnh ảnh tối thiểu phải từ 15 điểm. Lựa
chọn bậc nắn ảnh là 2.
- Sau khi kết thúc quá trình nắn ảnh, ảnh mới đã nắn sẽ được lưu vào
một tập tin (như trong trường hợp đang trình bầy, có thể thấy, với sai số RMS
Error = 0.931164, ảnh kết quả đạt độ chính xác khá cao. Các đối tượng trên
ảnh trùng khít với nhau.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
53
- Khi phải ghép nhiều cảnh ảnh với nhau để tạo một ảnh lớn hơn, các
ảnh thành phần cần được nắn chỉnh hình học từ trước. Ảnh sau khi đã nắn
chỉnh hình học có thể được sử dụng trong việc phân loại giải đoán các đối
tượng hoặc tạo bình đồ ảnh cho khu vực
Phương trình chuyển đổi toạ độ có dạng:
Bậc 1: x’ = a0 + a1x + a2 y, (1)
y’ = b0 + b1y + b2 y
Bậc 2: x’ = c0 + c1x + c2y + c3xy + c4x2 + c5y2, (2)
y’ = d0 + d1x + d2y + d3xy + d4x2 + d5y2,
Bậc 3: x’ = g0 + g1x + g2y + g3xy + g4x2 + g5y2 + g6xy2 + g7xy2 + g8x3+ g9y3 (3)
y’=h0+h1x+ h2y + h3xy + h4x2 + h5y2 + h6xy2 + h7xy2 + h8x3+h9y3
Trong đó, x’, y’ là toạ độ của ảnh chưa nắn, x,y là toạ độ của ảnh nắn.
a0... h9 là các hệ số của phương trình chuyển đổi.
Tóm lại:
Trong khi một ảnh có thể bị thay đổi với nhiều cách khác nhau. Nắn
chỉnh có thể hiều là ta đi thay đổi các điểm ảnh bằng việc ánh xạ từ điểm ảnh
này tới điểm ảnh khác mà không thay đổi màu sắc. Điều này có thể dựa vào
các thuật toán có sẵn như thuật toán nội suy, thuật toán tô màu,..bản thân các
pixel ảnh có thể được thay đổi bằng việc ánh xạ. Nếu các chức năng là song
ánh thì có thể thay đổi ngược lại với các ảnh nguồn.
Các phương pháp nắn chỉnh cho thấy:
Hình ảnh bị bóp méo có thể mô phỏng bằng quang học
Hình ảnh có thể được xem nếu chiếu lên một bề mặt cong hoặc được
nhân đôi (điều này thường được thấy rõ khi kéo giãn hình ảnh) .
Hình ảnh có thể được phân chia thành từng đa giác và đa giác méo.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
54
Hình ảnh có thể được sử dụng phương pháp nội suy.
Có ít nhất hai cách được sử dụng để tạo ra một hình ảnh bằng cách lựa
chọn bất kỳ một phương pháp bóp méo nào:
- Cách 1: Phương pháp chuyển tiếp (lập bản đồ): một bản đồ có thể có
được từ cách chuyển tiếp các hình ảnh từ vệ tinh sau đó thực hiện nắn chỉnh
và nội suy.
- Cách 2: Ước tính loại cong vênh diễn ra giữa những hình ảnh liên
tiếp. Có thể sử dụng các kỹ thuật dự đoán luồng quang học.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
55
Chương 3
ỨNG DỤNG NẮN CHỈNH BIẾN DẠNG
Như đã nói trong chương 2. Các phương pháp nắn chỉnh đều cho ra hình
ảnh sau nắn chỉnh có chất lượng khá tốt. Ứng với mỗi điểm của ảnh gốc đều
tìm được vị trí tương ứng của nó bên ảnh đích. Sau khi điều này được thực hiện
với tất cả các điểm cần xét ở ảnh gốc thì ảnh đích thu được có hình hài thoả
mãn điều kiện đầu bài yêu cầu nhưng có nhiều điểm trong ảnh đích chưa có
điểm nào từ ảnh gốc ánh xạ sang nên các điểm đó vẫn mang mầu nền. Những
điểm ở ảnh đích mà không có điểm ảnh ở ảnh gốc ánh xạ sang gọi là những “lỗ
hổng”. vì vậy chúng ta phải sử dụng thêm thuật toán tô màu và thuật toán nội
suy để nhằm lấp đi những khuyết điểm sau khi nắn chỉnh. Vậy hình ảnh sau khi
nắn chỉnh sẽ có hình dạng như ban đầu nhờ vào các phương pháp nắn chỉnh
như phương pháp bình phương bé nhất,…Sau đây chúng ta đi vào ứng dụng cụ
thể của một vài phương pháp nắn chỉnh ảnh nói chung và phương pháp bình
phương bé nhất nói riêng. Đó là đi nắn chỉnh một cuốn sách.
3.1. Nắn chỉnh một cuốn sách
Đối tượng cần nắn chỉnh là ảnh của một cuốn sách (đối tượng có dạng hình
hộp) được chụp vào sao cho nhìn thấy được ba mặt của nó (dưới dạng hình 3D).
Công việc cần nắn chỉnh là:
- Nắn chỉnh các mặt của cuốn sách (vật hình hộp) sao cho sau khi nắn
chỉnh các mặt của cuốn sách không bị cong (có dạng hình bình hành), các
mép không bị nhăn và hình ảnh của các mặt nhìn rõ hơn.
- Sau khi nắn chỉnh các mặt, áp dụng các kỹ thuật làm đẹp ảnh để thu
được ảnh có mầu sắc, đường nét rõ và đẹp hơn.
Yêu cầu đặt ra là:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
56
Ta mong muốn các mặt của sách sau khi nắn chỉnh sẽ là các hình bình
hành. Vì thế phải có một mẫu ảnh làm khung để biến đổi ảnh ban đầu về hình
dạng như mẫu đã chọn. Mẫu ảnh làm khung phải thỏa mãn:
Là khung của một hình hộp có hình dạng gần với hình dạng của cuốn sách.
Được thu nhận vào ở tư thế nhìn thấy ba mặt tương ứng với ba mặt của cuốn
sách.
Có kích thước không sai khác nhiều so với kích thước của cuốn sách.
Ba mặt của cuốn sách (hình hộp) chụp vào sẽ được nắn chỉnh thành ba
mặt tương ứng của một hình hộp có kích thước tương tự. Như vậy, vấn đề đặt
ra là phải xác định được các cặp mặt tương đương giữa sách và hình hộp,
công việc này dựa vào thuật toán xác định các điểm đặc trưng chúng ta đã
trình bày ở chương 2 của luận văn. Cũng giống như việc xác định các cặp
điểm đặc trưng, ta chưa có một phương pháp hiệu quả nào để cho phép tự
động nhận biết các mặt của cuốn sách. Vì thế không còn phương pháp nào
khác là nhờ sự trợ giúp của con người một cách thủ công. Việc xác định các
mặt đồng nghĩa với việc chia ảnh thành các vùng đa giác mà các đỉnh của đa
giác là các điểm đặc trưng. Trong bài toán cụ thể này ta phải xác định được ba
đa giác tương ứng với ba mặt của cuốn sách.
Hình 3.1 Ảnh gốc và mô hình khung mẫu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
57
Thực tế người ta cũng có thể nắn chỉnh được mà không cần bước xác
định các mặt của nó. Vì trên cơ sở các điểm đặc trưng đã chọn, dùng phương
pháp nội suy dựa trên lưới tam giác và tập các điểm đặc trưng là tìm ra ngay
được công thức biến đổi đối với mỗi điểm ảnh cần nội suy (các phương pháp
nội suy đã trình bày ở chương 2 của luận văn). Tuy nhiên, nếu làm như vậy
đối với bài toán cụ thể này thì sẽ gặp phải một số khó khăn đó là khối lượng
tính toán sẽ tăng lên, việc nội suy thiếu chính xác do hiệu quả nắn chỉnh
không cao. Vì thế khi nắn chỉnh cuốn sách trong luận văn đã trình bày rất rõ
việc tìm các mặt đặc trưng dựa vào thuật toán tìm điểm đặc trưng.
Sau khi nắn chỉnh, hình ảnh của cuốn sách sẽ có hình dạng giống như
khung mẫu, các khuyết điểm như cong vênh, lỗ hổng sẽ không còn. Để cuốn
sách trở nên đẹp và rõ nét hơn có thể làm trơn ảnh bằng phương pháp nội suy,
khi đó ta thu được hình ảnh cuốn sách như mong muốn.
Hình 3.2 Xác định các điểm đặc trưng trên ảnh và khung mẫu
Hình 3.3 Ảnh gốc và ảnh được nắn chỉnh
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
58
3.2. Giới thiệu chương trình
3.2.1. Mô tả các chức năng trong chương trình
3.2.1.1. Chức năng quản lý các Style (ảnh mẫu)
Chức năng này trong phần mềm cài đặt đã đưa ra một số khung ảnh làm
mẫu nắn chỉnh. Người dùng phải chọn khung làm mẫu cho phù hợp mới có
thể thực hiện nắn chỉnh một cách chính xác. Các bước thực hiện như sau:
B1: Mở một ảnh làm mẫu đã có sẵn.
B2: Tạo các điểm đặc trưng để định nghĩa khung đối tượng bằng việc tạo
các điểm đặc trưng tương ứng trên khung ảnh làm mẫu .
B3: Định nghĩa các mặt nhìn thấy của đối tượng trong ảnh. Ở đây phải
định nghĩa 3 mặt của cuốn sách hoặc hình hộp. Mỗi mặt được xác định bởi
bốn điểm đặc trưng tương ứng với bốn góc của mặt.
B4: Lưu mẫu vừa định nghĩa: lưu ảnh mẫu cùng với các điểm đặc trưng.
Các Style được lưu có phần mở rộng là sty. Vì vậy mà ta có chức năng quản
lý style.
3.2.1.2. Chức năng quản lý các điểm đặc trưng
Như đã nói đến ở chương 2. Để thực hiện nắn chỉnh được ảnh gốc, thì ta
phải tìm ra được các điểm đặc trưng. Các điểm đặc trưng ảnh hưởng trực tiếp
đến chất lượng nắn chỉnh. Vì vậy việc quản lý các điểm đặc trưng là cần thiết.
B1: Thêm các điểm đặc trưng vào ảnh cần nắn chỉnh (ảnh gốc).
Hình 3.4 Ảnh nắn chỉnh và được làm trơn
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
59
B2: Xoá một điểm đặc trưng bất kỳ trong ảnh cần nắn chỉnh.
B3: Xoá tất cả các điểm đặc trưng.
B4: Thay đổi toạ độ điểm đặc trưng bằng cách kéo thả chuột hoặc điều
khiển bàn phím.
B5: Thay đổi mầu điểm đặc trưng để nó không bị lấp bởi mầu nền.
Khi đã thực hiện đủ các bước như trên, phần mềm cho phép thực hiện
nắn chỉnh một cách tự động dựa vào thuật toán xác đinh điểm đặc trưng, và
thực hiện nắn chỉnh.
3.2.1.3. Chức năng nâng cao chất lượng ảnh
Nâng cao chất lượng ảnh là chức năng phụ trong chương trình, chức
năng này cho phép tạo ra ảnh sau nắn chỉnh có chất lượng tốt.
Trong chương 2 ta đã giới thiệu phương pháp nội suy nhằm nâng cao
chất lượng ảnh sau khi nắn chỉnh.
Như đã biết sau nắn chỉnh, một số điểm ảnh khi ánh xạ không ánh xạ
được hết sang ảnh đích, nên trong ảnh thu được có hiện tượng vỡ hạt gây ra
các lỗ hổng. Nội suy sẽ giúp lấp các lỗ hổng, làm cho ảnh đẹp hơn, mịn hơn.
Trong phần mềm ta đã chỉ ra 2 phương pháp nội suy đó là nội suy tam
giác và nội suy song tuyến tính, nhưng trong phần mềm do hạn chế về thời
gian và hạn chế về mặt kiến thức, tác giả mới chỉ đưa ra được phương pháp
nội suy tam giác có sử dụng hệ tọa độ Barycentric.
3.2.1.4. Chức năng lưu file ảnh sau khi thực hiện nắn chỉnh
Chức năng này cho phép ta ghi trạng thái phiên làm việc ra đĩa hoặc tải
thông tin từ đĩa lên. Các thông tin này bao gồm: ảnh mẫu (style) và các ảnh
cần nắn chỉnh, tập các điểm đặc trưng và một số thông tin về tuỳ chọn. Các
file làm việc có phần mở rộng là wrk. Các chức năng gồm có:
B1: Tạo một phiên làm việc mới bằng cách mở một ảnh gốc và mở chọn
một Style đã được định nghĩa trước đó.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
60
B2: Ghi lại trạng thái làm việc lên file cũ.
B3: Sao chép trạng thái phiên làm việc ra một file khác.
B4: Mở file.
Trong chức năng lưu file ảnh người dùng có thể tự do đặt tên file, và đặt
đường dẫn mà không cần phải chỉ rõ.
Ngài ra trong chương tình cài đặt còn nhiều chức năng khác, nhưng chức
năng chủ yếu trong chương trình vẫn là chức năng quả lý style và chức năng
quản lý các điểm đặc trưng.
3.2.2. Giao diện chính của chương trình
- Khởi động chương trình Microsoft Visual Basic 6.0
- Chạy file chương trình ứng dụng nắn chỉnh xuất hiện giao diện
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
61
- Mở ảnh nguồn (ảnh cần nắn chỉnh): C:\Ungdung_nanchinhanh\work\
- Mở form khung mẫu để nắn chỉnh: C:\Ungdung_nanchinhanh\work\
Tệp dữ liệu
ảnh gốc
Tệp khung
form mẫu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
62
- Giao diện trước khi nắn chỉnh
- Giao diện khi thực hiện nắn chỉnh
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
63
3.2.3. Kết quả của một số chức năng trong chương trình
Hình 3.5 Ảnh gốc và ảnh được nắn chỉnh
Hình 3.6 Ảnh nắn chỉnh và được làm trơn
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
64
KẾT LUẬN
Một vài năm trở lại đây công nghệ thông tin cùng với sự phát triển của
nó đã kéo theo sự phát triển của hàng loạt các ngành khoa học trong nhiều
lĩnh vực khác nhau như sinh học, kinh tế, viễn thông, quân sự, giải trí… có
những bước tiến nhanh hơn so với đúng quy trình mà đáng ra phải trải qua.
Trong sự phát triển chung đó, xử lý ảnh cũng là ngành khoa học phát triển với
tốc độ vượt bậc. Người ta đã tìm ra nhiều kỹ thuật xử lý cho phép thay đổi,
quay ảnh, phóng to, thu nhỏ… mà hình ảnh vẫn đẹp và trông rất tự nhiên.
Trong thực tế đối tượng khi được thu nhận bởi các thiết bị điện tử và
quang học thường không thể hiện được bản chất thực (nguyên thủy) của mình
hay nói cách khác là bị biến dạng đi. Vì thế đề tài thực hiện miêu tả quá trình
nắn chỉnh hình học của một đối tượng vật thể được thực hiện.
Trong đề tài thực hiện việc hiệu chỉnh hình ảnh ba chiều bị biến dạng khi
thu nhận, tức là thực hiện nắn chỉnh hình học các loại ảnh 3 chiều, nhằm đưa
các ảnh này về trạng thái ban đầu, tức là trạng thái khi chưa bị biến dạng.
Tuy nhiên do hạn chế về mặt tìm tài liệu, hạn chế về mặt kiến thức của
bản thân và hạn chế về thời gian. Nên trong luận văn em mới chỉ thực hiện
đưa được các ảnh mẫu, các khung mẫu đã có sẵn vào phần mềm, chứ phần
mềm không tự tạo ra được các khung cần nắn chỉnh.
Kỹ thuật mà đề tài đề xuất gồm 2 pha chính:
Nắn chỉnh hình dạng.
Biểu diễn bề mặt.
Các kỹ thuật đề xuất đã được cài đặt trong phần mềm BookMorphing.
Hướng phát triển của đề tài:
Do trong đề tài cong nhiều mặt hạn chế nên đề tài còn nhiều hướng mở như:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
65
Tìm hiểu cách để quản lý style (tạo các style) ngay trong phần mềm mà
không phải thực hiện thủ công.
Tìm hiểu phương pháp để xử lý hàng loạt ảnh đầu vào cùng lúc với một mẫu
chọn trước dựa trên cơ sở sự tương đương về hình dạng của các ảnh đầu vào.
Tìm hiểu phương pháp để mở rộng phạm vi các đối tượng được áp dụng.
Điều này là có thể thực hiện được vì như đã phân tích ở trên, một đối tượng
bất kỳ đều có hai thành phần: khung và bề mặt.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
66
TÀI LIỆU THAM KHẢO
[1] Lương Mạnh Bá, Nguyễn Thanh Thủy, “Nhập môn xử lý ảnh số”, NXB
khoa học và kỹ thuật.
[2] Lê Thị Thủy (2004), "Nắn chỉnh hình học và ứng dụng trong sách
thương mại điện tử", Khóa luận tốt nghiệp đại học - Trường ĐH Hồng
Đức Thanh Hóa, 2004.
[3] Lương Chi Mai, Huỳnh Thị Thanh Bình, “Nhập môn đồ họa máy tính”,
NXB khoa học và kỹ thuật.
[4] Đặng Văn Đức, “Hệ thống thông tin địa lý”, NXB KH&KT, 2001.
[5] Greg Hunetneys (2003), “Image Warping, Compositing and Morphing”,
University of Veginia, CS 445.
[6] Hermann Birkholz, Dietmar Jackel, “Image Warping with Feature Curves”,
Departmentof Computer, University of Rostock, Germany.
[7] Michael Hoch, Georg Fleischmann, Bernd Girod (1994), “Modeling and
Animation of Facial Expressions based on B-Splines”, Dept. Computer
Science/ Audio-Visual Media, University Erlangen-Nuremberg, Germany.
[8] T. Beier, B. Costa, L. Darsa, L. Velho, “Warping and Morphing of
Graphical Objects”, SIGGRAPH, 1997.
[9]
[10]
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
67
MỤC LỤC
MỞ ĐẦU ...................................................................................................... 1
Chương 1. KHÁI QUÁT VỀ XỬ LÝ VÀ NẮN CHỈNH ẢNH.................. 3
1.1. Khái quát về xử lý ảnh ............................................................................ 3
1.2. Một số khái niệm cơ bản trong xử lý ảnh ................................................ 4
1.2.1. Ảnh số ............................................................................................. 4
1.2.2. Điểm ảnh ......................................................................................... 4
1.2.3. Mức xám (gray level) ....................................................................... 4
1.2.4. Xử lý ảnh số là gì và tại sao chúng ta cần phải xử lý ảnh số ............. 5
1.3. Các vấn đề chung liên quan đến xử lý ảnh số ......................................... 6
1.3.1. Xử lý ảnh mức thấp ......................................................................... 6
1.3.2. Những khó khăn khi xử lý ảnh số .................................................... 7
1.4. Ứng dụng của hệ thống xử lý ảnh ........................................................... 8
1.5. Quá trình xử lý ảnh số .......................................................................... 10
1.6. Các thành phần cơ bản của hệ thống xử lý ảnh ..................................... 14
1.7. Nắn chỉnh biến dạng ............................................................................. 16
1.7.1. Khái niệm nắn chỉnh biến dạng ..................................................... 16
1.7.2. Một số kỹ thuật xử lý ảnh sử dụng trong nắn chỉnh biến dạng ....... 17
1.7.3. Các điểm đặc trưng để nắn chỉnh ................................................... 19
1.8. Phép toán hình thái (Morphology) trong nắn chỉnh biến dạng .............. 19
Chương 2. MỘT SỐ KỸ THUẬT NẮN CHỈNH BIẾN DẠNG HÌNH HỌC .... 27
2.1. Nắn chỉnh trên cơ sở phân vùng ảnh ..................................................... 27
2.2. Nắn chỉnh trên cơ sở tập các điểm đặc trưng ........................................ 31
2.3. Kỹ thuật nắn chỉnh dựa trên cơ sở vector .............................................. 41
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
68
2.4. Kỹ thuật nắn chỉnh dựa trên khung lưới ................................................ 45
2.4.1. Xây dựng hàm biến đổi ................................................................. 45
2.4.2. Nhận xét kết quả ........................................................................... 47
2.5. Xây dựng khung nắn chỉnh ................................................................... 47
2.6. Các mô hình nắn chỉnh sử dụng trong phần mềm IrasC ........................ 48
2.6.1. Các mô hình nắn chỉnh trong IrasC ............................................... 48
2.6.2. Quá trình nắn chỉnh ảnh ................................................................ 50
Chương 3. ỨNG DỤNG NẮN CHỈNH BIẾN DẠNG .............................. 55
3.1. Nắn chỉnh một cuốn sách ...................................................................... 55
3.2. Giới thiệu chương trình ........................................................................ 58
3.2.1. Mô tả các chức năng trong chương trình ....................................... 58
3.2.1.1. Chức năng quản lý các Style (ảnh mẫu) .............................. 58
3.2.1.2. Chức năng quản lý các điểm đặc trưng ................................ 58
3.2.1.3. Chức năng nâng cao chất lượng ảnh .................................... 59
3.2.1.4. Chức năng lưu file ảnh sau khi thực hiện nắn chỉnh ............ 59
3.2.2. Giao diện chính của chương trình .................................................. 60
3.2.3. Kết quả của một số chức năng trong chương trình ......................... 63
KẾT LUẬN ................................................................................................ 64
TÀI LIỆU THAM KHẢO .......................................................................... 66
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
69
DANH MỤC CÁC HÌNH
Hình 1.1: Mô phỏng quá trình biến đổi hình học ......................................... 9
Hình 1.2: Các thành phần chính của hệ thống xử lý ảnh ............................ 14
Hình 1.3: Ví dụ về nắn chỉnh biến dạng ..................................................... 17
Hình 1.4: Phép co và giãn ảnh ................................................................... 21
Hình 1.5: Minh họa phép co và giãn ảnh ................................................... 22
Hình 1.6: Kết quả phép co và giãn ảnh ...................................................... 23
Hình 1.7: Kết quả phép mở và đóng ảnh .................................................... 23
Hình 1.8: Sử dụng phép toán HitAndMiss để tìm góc lồi của một ảnh ....... 25
Hình 1.9: Tìm kiếm xương ảnh .................................................................. 25
Hình 1.10: Ví dụ về phép toán làm gầy ảnh ................................................ 26
Hình 2.1: Hệ toạ độ Barycentric ................................................................ 29
Hình 2.2: Tìm tất cả các điểm thuộc tam giác theo dòng quét .................... 30
Hình 2.3: Nội suy tam giác ........................................................................ 31
Hình 2.4: Phép nội suy Bilinear ................................................................. 31
Hình 2.5: Đồ thị biểu diễn giá trị ước lượng Y .......................................... 33
Hình 2.6: Đồ thị biểu diễn giá trị chênh lệch ei .......................................... 33
Hình 2.7: Đồ thị biểu diễn giá trị thực Yi ................................................... 34
Hình 2.8: Đồ thị biểu diễn tổng bình phương tất cả các điểm sai lệch ........ 35
Hình 2.9: Đồ thị biểu diễn sự biến động của các biến ................................ 36
Hình 2.10: Ảnh gốc và ảnh bị nắn chỉnh ...................................................... 39
Hình 2.11: Nắn chỉnh bằng cách biến đổi tọa độ các điểm ảnh .................... 39
Hình 2.12: Mô tả sự biến đổi của tọa độ các điểm ảnh ................................. 40
Hình 2.13: Mô tả kết quả thuật toán biến đổi ............................................... 40
Hình 2.14: Cặp đoạn thẳng đơn ................................................................... 42
Hình 2.15: Một số kết quả minh họa của thuật toán ..................................... 42
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
70
Hình 2.16: Nhiều cặp vector ........................................................................ 44
Hình 2.17: Kết quả của thuật toán................................................................ 44
Hình 2.18: Tọa độ ảnh thay đổi khi bóp méo ............................................... 45
Hình 2.19: Khung lưới B-Spline của hai ảnh ............................................... 46
Hình 2.20: Xác định các điểm tương đương cho mỗi dòng quét .................. 46
Hình 2.21: Cách xác định tọa độ mới ........................................................... 47
Hình 3.1: Ảnh gốc và mô hình khung mẫu ................................................ 56
Hình 3.2: Xác định các điểm đặc trưng trên ảnh và khung mẫu ................. 57
Hình 3.3: Ảnh gốc và ảnh được nắn chỉnh ................................................. 57
Hình 3.4: Ảnh nắn chỉnh và được làm trơn ................................................ 58
Hình 3.5: Ảnh gốc và ảnh được nắn chỉnh ................................................. 63
Hình 3.6: Ảnh nắn chỉnh và được làm trơn ................................................ 63
Các file đính kèm theo tài liệu này:
- 17LV09_CNTT_PhamDucHau.pdf