Tài liệu Luận văn Nhận dạng ảnh mặt người trong điều kiện ánh sáng thay đổi: đại học quốc gia hà nội
khoa công nghệ
Vũ Đình Hoàng
Nhận dạng ảnh mặt ng−ời
trong điều kiện ánh sáng thay đổi
Ngành: Công nghệ thông tin
Cán bộ h−ớng dẫn: TS. Hà Quang Thụy
TS. Nguyễn Thanh Tùng
Hà nội 2002
1
Mục lục
lời nói đầu.......................................................................................................................3
ch−ơng 1. Tổng quan về nhận dạng ảnh mặt ng−ời ............................5
1.1 Bài toán nhận dạng ảnh mặt ng−ời ............................................................5
1.1.1 Bài toán và các yêu cầu nhận dạng.....................................................................5
1.1.2 Giải quyết bài toán từ quan điểm của lý thuyết nhận dạng..................................8
1.2 giải quyết vấn đề trong bài toán nhận dạng ảnh mặt ng−ời......9
1.2.1 Thu nhận dữ liệu.................................................................................................10
1.2.2 Biểu diễn đối t−ợng.................
41 trang |
Chia sẻ: hunglv | Lượt xem: 1305 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Nhận dạng ảnh mặt người trong điều kiện ánh sáng thay đổi, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
đại học quốc gia hà nội
khoa công nghệ
Vũ Đình Hoàng
Nhận dạng ảnh mặt ng−ời
trong điều kiện ánh sáng thay đổi
Ngành: Công nghệ thông tin
Cán bộ h−ớng dẫn: TS. Hà Quang Thụy
TS. Nguyễn Thanh Tùng
Hà nội 2002
1
Mục lục
lời nói đầu.......................................................................................................................3
ch−ơng 1. Tổng quan về nhận dạng ảnh mặt ng−ời ............................5
1.1 Bài toán nhận dạng ảnh mặt ng−ời ............................................................5
1.1.1 Bài toán và các yêu cầu nhận dạng.....................................................................5
1.1.2 Giải quyết bài toán từ quan điểm của lý thuyết nhận dạng..................................8
1.2 giải quyết vấn đề trong bài toán nhận dạng ảnh mặt ng−ời......9
1.2.1 Thu nhận dữ liệu.................................................................................................10
1.2.2 Biểu diễn đối t−ợng.............................................................................................12
1.2.3 Lập luận kết quả.................................................................................................14
1.3 hệ thống kỹ thuật nhận dạng ảnh mặt ng−ời ....................................14
1.3.1 Qui trình công nghệ xử lý thông tin ....................................................................15
1.3.2 Các vấn đề trong triển khai thực tế ....................................................................16
1.3.3 Các ứng dụng điển hình......................................................................................17
ch−ơng 2. nhận dạng ảnh mặt ng−ời trong điều kiện ánh sáng
thay đổi .........................................................................................................................19
2.1 Phân tích các yếu tố ảnh h−ởng đến quá trình nhận dạng .......19
2.1.1 á nh sáng..............................................................................................................19
2.1.2 Các thay đổi hình học.........................................................................................19
2.1.3 Sai số do hệ thống...............................................................................................20
2.2 Các kỹ thuật giải quyết..................................................................................20
2.2.1 Đ−a các thông tin về điều kiện môi tr−ờng vào mô tả đối t−ợng........................20
2.2.2 Cách giải quyết dựa trên kỹ thuật khoảng cách tiếp xúc....................................24
2.2.3 Kết hợp các cách biểu diễn đối t−ợng khác nhau...............................................26
Ch−ơng 3. thuật toán nhận dạng trong điều kiện ánh sáng
thay đổi .........................................................................................................................32
3.1 Thuật toán so sánh khuôn mẫu dựa theo khoảng cách tiếp xúc
................................................................................................................................32
3.2 Thuật toán so sánh điểm đặc tr−ng dựa theo khoảng cách tiếp
xúc ................................................................................................................................35
3.3 Kết hợp hai thuật toán so sánh trên ......................................................37
2
Kết luận ........................................................................................................................39
Tài liệu tham khảo.................................................................................................40
3
lời nói đầu
Nhận dạng mặt ng−ời bằng mắt là một ph−ơng thức thông dụng rất hiệu quả và đạt
độ chính xác cao ngay cả trong tr−ờng hợp có các thay đổi lớn bởi các tác nhân kích thích
trực quan do các điều kiện quan sát, diễn cảm, lão hóa và các tiêu khiển nh− kính hoặc các
thay đổi kiểu tóc. Tuy nhiên việc xây dựng các hệ thống tự động thực hiện nhiệm vụ nhận
dạng này thông qua ảnh là rất khó khăn vì gặp phải các biến đổi quan trọng trong quá trình
định dạng ảnh.
D−ới đây là một số bài toán có liên quan tới nhận dạng mặt ng−ời:
- Phát hiện đ−ờng biên của mặt ng−ời trong một ảnh chụp toàn cảnh nào đó (tách
ảnh mặt ng−ời),
- Xác định ng−ời qua ảnh đã đ−ợc tách nhờ đối sánh ảnh với ảnh của một tập hợp
ng−ời đã đ−ợc quản lý nào đó (định danh ảnh),
- Phân tích các diễn cảm của mặt để biết đ−ợc tình trạng của ng−ời trong ảnh tại
thời điểm chụp ảnh
Nhận dạng mặt ng−ời tự động là một công việc khó khăn bởi vì khả năng thay đổi
vốn có của quá trình định dạng ảnh trong giới hạn về chất l−ợng ảnh và trắc quang, hình
học, che lấp, thay đổi, và cải trang. Ngày nay tất cả các hệ thống nhận dạng mặt tự động
đang sử dụng chỉ có thể thực hiện trên các cở sở dữ liệu ảnh hạn chế trong giới hạn về cỡ,
tuổi, giới tính, và/hoặc chủng tộc và tuy nhiên, nhận dạng mặt tự động đ−ợc thừa nhận là
tốt trong các môi tr−ờng đ−ợc điều khiển.
Khoá luận "Nhận dạng mặt ng−ời trong điều kiện ánh sáng thay đổi" có nội dung
khảo sát một số ph−ơng pháp và kỹ thuật trong lĩnh vực nhận dạng ảnh, đ−ợc chia thành ba
ch−ơng:
Ch−ơng 1 "Tổng quan về nhận dạng ảnh mặt ng−ời" trình bày một cách tổng quan
về các nhiệm vụ của hệ thống nhận dạng mặt: Mô tả bài toán, cách giải quyết bài toán theo
quan điểm của lý thuyết nhận dạng và các hệ thống triển khai thực tế. Nội dung của
ch−ơng đ−ợc chia làm 3 phần. Phần thứ nhất mô tả bài toán nhận dạng ảnh mặt ng−ời,
trình bày các điều kiện bài toán, các yêu cầu nhận dạng và giải quyết bài toán theo quan
điểm của nhận dạng. Phần thứ hai giải quyết các vấn đề trong bài toán nhận dạng, đ−a ra
các quy trình mà một hệ thống nhận dạng tuân theo. Phần thứ ba mô tả hệ thống kỹ thuật
trong bài toán nhận dạng ảnh mặt ng−ời, trình bày các quy trình xử lý thông tin, các vấn đề
triển khai thực tế và các ứng dụng điển hình.
Ch−ơng 2 "Phân tích các yếu tố ảnh h−ởng đến quá trình nhận dạng và các cách tiếp
cận để giải quyết bài toán." trình bày các yếu tố ảnh h−ởng đến nhận dạng ảnh và hai cách
4
tiếp cận nhằm giải quyết bài toán. Khóa luận xem xét cách tiếp cận dựa trên khuôn mẫu,
cách tiếp cận dựa trên điểm đặc tr−ng và kết hợp cả hai cách tiếp cận này để thu đ−ợc kết
quả tốt nhất.
Ch−ơng 3 "Một số thuật toán giải quyết bài toán dựa trên hai cách tiếp cận nhận
dạng ảnh mặt". Ch−ơng này trình bày các thuật toán nhận dạng một ảnh dựa trên thuật toán
khoảng cách tiếp xúc.
Phần kết luận nêu tóm tắt lại nội dung chính đ−ợc đề cập đến trong khóa luận, một
số kết quả và khiếm khuyết của khóa luận và định ra ph−ơng h−ớng nghiên cứu tiếp theo.
Phần tài liệu tham khảo trình bày các tài liệu nghiên cứu gần đây của một số tác giả
n−ớc ngoài. Mỗi tài liệu đều nêu đ−ợc khía cạnh nào đó của nội dung đang nghiên cứu.
Do thời gian và trình độ còn hạn chế, việc triển khai thuật toán nhận dạng ảnh mặt
ng−ời trong các điều kiện thay đổi của ánh sáng còn ở mức độ nhất định và ch−a đ−ợc cài
đặt trong thực tế. Hy vọng rằng nếu thời gian và củng cố thêm sự hiểu biết tôi sẽ tiến hành
nghiên cứu sâu hơn về vấn đề này.
5
ch−ơng 1. Tổng quan về nhận dạng ảnh mặt ng−ời
Công nghệ nhận dạng ảnh đ−ợc ứng dụng trong nhiều miền ứng dụng khác nhau và
tác động đến nhiều khía cạnh của đời sống con ng−ời:
- Trong công nghiệp: Nhận dạng ảnh mặt ng−ời tự động đ−ợc áp dụng cho các hệ
thống bảo mật nh− kiểm soát truy cập truyền thông trạm làm việc, truy cập ngân hàng.
- Trong chính phủ: Hệ thống nhận dạng mặt ng−ời tự động đ−ợc dùng trong kiểm
soát xuất nhập cảnh, kiểm soát vùng biên giới và bảo mật an ninh sân bay, hải cảng. Nhận
dạng ảnh mặt ng−ời tự động có thể hỗ trợ cho việc xác định tội phạm đối với mục đích của
pháp lý và các kỹ thuật chống khủng bố.
- Trong y học: Nhận dạng mặt ng−ời tự động có thể hữu ích trong việc nghiên cứu
hệ thống thần kinh, sự phản ứng tâm lý của bệnh nhân.
Để xây dựng một hệ thống nhận dạng mặt ng−ời tự động, tr−ớc hết cần xem xét các
khái niệm và bài toán liên quan trong hệ thống nói trên.
1.1 Bài toán nhận dạng ảnh mặt ng−ời
Trong bài toán nhận dạng ảnh mặt ng−ời cần quan tâm đến các yếu tố ngoại cảnh
tác động đến quá trình và quan tâm đến các cách tiếp cận để giải quyết bài toán nhận dạng
sao cho hệ thống nhận dạng là bền vững với các yếu tố tác động đến quá trình nhận dạng.
Tr−ớc hết một số khái niệm đ−ợc giải thích nh− d−ới đây:
- ảnh mặt ng−ời: Một ảnh chụp mặt của một ng−ời nào đó đang có trong hệ thống,
- Lớp ảnh mặt ng−ời: Do ảnh chụp mặt ng−ời phụ thuộc vào điều kiện ngoại cảnh và
nội tâm của ng−ời đó khi chụp ảnh nên với mỗi một ng−ời, hệ thống cần có một tập hợp
ảnh mặt của cùng một ng−ời đó song thể hiện đ−ợc nhiều trạng thái khác nhau. Chúng ta
gọi tập hợp đó là tập ảnh mẫu của ng−ời đó. Khi nói đến một lớp ảnh mặt ng−ời là nói đến
tập ảnh mẫu của cùng một ng−ời.
1.1.1 bài toán và các yêu cầu nhận dạng
Bài toán nhận dạng ảnh mặt ng−ời có thể đ−ợc phát biểu nh− sau: Cho tr−ớc một tập
hữu hạn (nhóm ng−ời), danh tính và các thông tin tùy thân có thể đ−ợc biết tr−ớc, x là ảnh
mặt ng−ời cần nhận dạng thì bài toán thực hiện theo các nhiệm vụ nh− sau:
- Xác định danh tính của ng−ời trong ảnh khi đã biết ng−ời đó thuộc vào nhóm
ng−ời đã biết. Đây chính là bài toán phân loại N lớp.
- Xác định xem ng−ời trong ảnh thuộc vào nhóm ng−ời cho tr−ớc hay không.
6
- Giả thiết rằng ng−ời trong ảnh là một ng−ời thuộc nhóm ng−ời biết tr−ớc, cần
kiểm tra xem giả thiết đó có đúng không.
- Nhận dạng đầy đủ tức là tr−ớc tiên ta xem ng−ời trong ảnh có thuộc nhóm ng−ời
cho tr−ớc hay không, sau đó xác định xem ảnh đó là của ng−ời nào trong nhóm.
Tr−ớc hết cần làm rõ khái niệm ảnh đ−ợc quản lý trong hệ thống nhận dạng ảnh. Hệ
thống quản lý ảnh quan tâm tới hai yếu tố sau đây:
- Đặc tr−ng ảnh của đối t−ợng đ−ợc quản lý. Theo lý thuyết nhận dạng ảnh, mỗi một
loại ảnh đối t−ợng có một số đặc tr−ng nào đó chẳng hạn nh− nhận dạng mặt ng−ời thì có
các loại đặc tr−ng hiểu mặt: trái xoan, chữ điền, tỷ lệ khoảng cách hai mắt ... hoặc nhận
dạng chữ cái là số thành phần liên thông viết nên chữ cái đó .... Các đặc tr−ng này đ−ợc
phân thành hai loại: các đại l−ợng bất biến (không bị thay đổi trong mọi thao tác với ảnh)
và các đặc tr−ng khác. Gọi n1 là số các đặc tr−ng thuộc loại này.
- Yếu tố tác động của môi tr−ờng vào ảnh khi chụp. ảnh chụp của một đối t−ợng
phụ thuộc vào môi tr−ờng chụp ảnh (ánh sáng, góc chụp...) vì vậy để nhận dạng ảnh cần
tính đến tác động của môi tr−ờng đối với ảnh chụp. Các ảnh h−ởng môi tr−ờng mạnh nhất
đó là ánh sáng, góc chụp (yếu tố hình học) ... Để hệ thống nhận dạng ảnh hoạt động tốt cần
biểu diễn đ−ợc sự tác động nói trên tới ảnh. Giải pháp đầu tiên đ−ợc nghĩ đến là cần nắm
bắt đ−ợc "toàn bộ" các điều kiện môi tr−ờng là không thể thực thi đ−ợc vì khả năng vô hạn
về tác động của môi tr−ờng đối với ảnh chụp. Một hệ thống rất khó thực hiện tốt nếu nh−
không gian hoạt động là quá lớn (đ−a quá nhiều ảnh h−ởng môi tr−ờng) hoặc quá bé (đ−a
quá ít điều kiện môi tr−ờng). Điều đó buộc chúng ta phải tạo ra một không gian đủ để hệ
thống có thể hoạt động. Vì vậy, con ng−ời th−ờng chọn ra những đặc tr−ng cơ bản nhất của
môi tr−ờng tác động vào ảnh chụp với miền giá trị hạn chế để tập hợp ảnh nắm bắt là nằm
trong thực thi các hệ thống nhận dạng ảnh. Gọi n2 là số các đặc tr−ng của môi tr−ờng tác
động vào ảnh chụp.
Kết hợp một đối t−ợng cùng
với một điều kiện môi tr−ờng cụ thể
thì tạo ra một ảnh của một đối t−ợng
đ−ợc thể hiện thông qua một vector
n = n1 + n2 thành phần, chẳng hạn
ảnh x đ−ợc biểu diễn thông qua một
vector (x1 , x2 , ..., xn). Tập hợp các
vector biểu diễn ảnh nói trên đ−ợc
gọi là không gian ảnh.
x
Hình 1.1 Mô tả không gian biểu diễn ảnh
7
Hình 1 mô tả không gian biểu diễn ảnh và vị trị một đối t−ợng trong không gian đó.
Đối t−ợng quan sát là đối t−ợng x bao gồm các h−ớng biểu hiện các đặc điểm của
đối t−ợng x. Nếu đối t−ợng x càng nhiều đặc điểm thì số chiều của không gian trên càng
tăng. Ta gọi số chiều của không gian là d thì không gian đ−ợc biểu diễn Sd (không gian S
có d chiều). Đến đây x đ−ợc coi là một đối t−ợng của Sd (x ∈ Sd).
Đối với bài toán nhận dạng, đối t−ợng nhận dạng là kết quả của một quá trình quan
sát. Cụ thể trong bài toán nhận dạng này, hệ thống đ−ợc thực hiện qua các quá trình nh−:
thu giữ ảnh, biểu diễn ảnh và cuối cùng là lập luận ảnh đã biểu diễn để thu đ−ợc kết quả
mong muốn. Bài toán nhận dạng đ−ợc trình bày nh− sau:
- x ∈ Sd: là một vector d-chiều thể hiện kết quả quan sát đ−ợc các số đo từ một quá
trình hay một đối t−ợng đang nghiên cứu nào đó.
- C ={C1…Cn}: tập hợp hữu hạn tên đ−ợc gán cho các quá trình hay đối t−ợng
nghiên cứu và các tập Ci (i=1..n) đ−ợc gọi là các lớp.
- g(x): Sd → {C1…Cn}: thuật toán nhận dạng là hàm xác định phép ánh xạ từ không
gian Sd sang tập hợp C. Mục tiêu của bài toán nhận dạng sử dụng hàm g(x) để xác định
một kết quả quan sát đ−ợc x ∈ Sd có thuộc về lớp Ci ∈ C hay không. Để thực hiện đ−ợc
nhiệm vụ này đòi hỏi phải có thuật toán tốt nhất nào đó và thuật toán đ−ợc xác định bằng
cách tối thiểu hàm xác suất nhận dạng sai tức là P[g(x) # Ci] → min.
Nh− vậy ta nhận thấy bài toán nhận dạng bao gồm các vấn đề cần đ−ợc giải quyết
sau đây:
- Thu đ−ợc kết quả quan sát.
- Xác định không gian Sd biểu diễn đối t−ợng.
- Xác định thuật toán nhận dạng tốt nhất.
Thông th−ờng từng đối t−ợng nhận dạng cho phép chúng ta xác định đ−ợc không
gian Sd sao cho các đại diện của đối t−ợng này khác so với các đại diện của đối t−ợng khác.
Tuy nhiên trong bài toán nhận dạng ảnh mặt ng−ời rất khó có thể biểu diễn đ−ợc đối t−ợng
tại vì các đại diện thu đ−ợc trong các điều kiện khác nhau đối với mặt của một ng−ời nh−:
độ tuổi làm biến đổi sắc thái mặt, ánh sáng tác động, diễn cảm của mặt, góc chụp ảnh mặt,
tóc, kính và các yếu tố khác có thể ảnh h−ởng đến sự trích ra các mẫu. Các ảnh thu đ−ợc
còn phải trải qua các quá trình biến đổi nh− sự quay, sự co dãn và các dịch chuyển. Các
yếu tố tác động trên không dễ dàng chuẩn hóa để đ−a vào không gian biểu diễn mà trong
đó sự mô tả các lớp là tách biệt.
8
Các nhiệm vụ trong nhận dạng ảnh mặt ng−ời đ−ợc minh họa nh− hình sau:
Trong các hình minh hoạ trên cho thấy không gian biểu diễn ảnh đ−ợc phân chia
thành các vùng khác nhau, mỗi vùng biểu diễn một đối t−ợng nhận dạng. Các đ−ờng kẻ
trên không gian biểu diễn ảnh cho ta đ−ợc các luật phân loại ảnh. Quan sát ảnh ta thấy ảnh
biểu diễn 3 ng−ời khác nhau và mối ng−ời ứng với một ký hiệu khác nhau. Hình trên cho
biết một hệ thống nhận dạng ảnh phải thực hiện đ−ợc đầy đủ các vấn đề đặt ra trong quá
trình nhận dạng.
1.1.2 Giải quyết bài toán từ quan điểm của lý thuyết nhận
dạng
Phân lớp không gian biểu diễn ảnh
Bài toán này là một bài toán phân loại N lớp t−ơng ứng với tập các lớp đã có:
C1…CN trong đó Ci là một lớp ảnh nào đó và tất cả các lớp đó đều đ−ợc mô hình hóa. Lớp
đ−ợc giải quyết bởi biểu diễn dữ liệu của từng lớp và ứng dụng một trong nhiều kỹ thuật
phân loại mẫu. Khả năng xảy ra sai số phân loại một mặt x đ−ợc giảm tới mức tối thiểu bởi
việc gán nó tới lớp Ck với xác suất hậu nghiệm P(Ck⏐x) lớn nhất, trong đó
)(
)()(
)(
xp
CPCxp
xCP kkk = (1)
p(x) là mật độ tuyệt đối, p(x⏐Ck) là mật độ xác suất phụ thuộc lớp và P(Ck) là xác
suất tiên nghiệm đối với lớp Ck. Vì p(x) là giống nhau đối với mọi lớp nên nó không đ−ợc
định giá để làm tăng xác suất hậu nghiệm. Do đó, một cách tiếp cận tới nhiệm vụ phân loại
là mô hình hóa các mật độ xác suất phụ thuộc lớp p(x⏐Ck).
Hình 1.2 Chia không gian ảnh thành các vùng khác nhau, các vùng biểu hiện của 3
ng−ời khác nhau và biểu hiện của mỗi một ảnh t−ơng ứng với một nhiệm vụ trên.
9
Xác minh danh tính của một ng−ời cho tr−ớc theo nghĩa là kiểm tra xem ng−ời đó có
thuộc một lớp ảnh mặt ng−ời đã biết hay không
Sự xác minh này có thể đ−ợc xem xét nh− một bài toán phân loại 2 lớp. Giả sử đã có
hai lớp C0 và C1 t−ơng ứng với các tr−ờng hợp danh tính đó là đúng hoặc là sai. Để làm
tăng xác suất hậu nghiệm, x sẽ đ−ợc gán cho Co nếu và chỉ nếu
)(
)()(
)(
0
11
0 CP
CPCxp
CxP > (2)
trong đó mật độ p(x ⎜C1) miêu tả sự phân tán các mặt ng−ời khác so với danh ttính
đ−ợc yêu cầu.
Xác định ng−ời trong ảnh có thuộc nhóm ng−ời cho tr−ớc hay không
Đối với bài toán này có hai cách giải quyết đó là:
Cách thứ nhất: Giải quyết nh− một bài toán phân loại 2 lớp C0 và C1 với lớp C0 đại
diện cho một tập tất cả các lớp trong nhóm còn C1 đại diện cho không gian không chứa lớp
nào trong nhóm đó (tập còn lại). Tất cả các lớp đ−ợc cụm lại đ−ợc gọi là lớp C0 và xác định
đối t−ợng nhận dạng có thuộc trong lớp C0 này hay không, ng−ợc lại thì đối t−ợng nằm
trong lớp C1.
Cách thứ hai: Một cách tiếp cận khác bao gồm việc xây dựng một trình xác định
danh tính đối với mỗi một ng−ời trong S. Nhiệm vụ này đ−ợc thực hiện bởi việc đ−a ra N
sự xác minh danh tính t−ơng ứng với N lần kiểm tra đối t−ợng x có thuộc một lớp nào đó
hay không. Nếu không thuộc vào lớp nào thì kết luận không xác định đ−ợc ng−ời đó,
ng−ợc lại thì xác minh đ−ợc ảnh đó.
Sự nhận dạng đầy đủ
Nhiệm vụ này phải thực hiện đầy đủ các nhiệm vụ ở trên, tr−ớc tiên phải phân định
đ−ợc các danh tính của đối t−ợng nhận dạng (phân loại các lớp) và sau đó xác định xem
đối t−ợng đó là thuộc về lớp nào trong các lớp thu đ−ợc. Nhiệm vụ này đ−ợc thực hiện bởi
sự liên kết N trình xác minh danh tính, t−ơng tự nh− cách tiếp cận xác định đối t−ợng là
thuộc về lớp nào trong nhóm S.
1.2 giải quyết vấn đề trong bài toán nhận dạng ảnh mặt
ng−ời
Các vấn đề quan trọng trong nhận dạng ảnh mặt ng−ời đ−ợc thể hiện nh− sau:
Sự thu nhận (Acquisition): đâu là các nhân tố quan trọng trong cách thu thập thông
tin mặt ng−ời?
10
Sự biểu diễn (Representation): cách biểu diễn các nhân tố thu đ−ợc trong quá trình
thu nhận các thông tin về ảnh.
Sự lập luận (Reasoning): cách mà một hệ thống nhận dạng mặt có thể làm để so
sánh các mặt ng−ời nhằm đạt hiệu quả nhất.
Mỗi từ các mục con d−ới đây trình bày chi tiết ba vấn đề đã đ−ợc nêu trên đây.
1.2.1 Thu nhận dữ liệu
Các vấn đề quan trọng trong nhận dạng ảnh mặt ng−ời đ−ợc thể hiện nh− sau:
Sự thu nhận (Acquisition): đâu là các nhân tố quan trọng trong cách thu thập thông
tin mặt ng−ời?
Sự biểu diễn (Representation): cách biểu diễn các nhân tố thu đ−ợc trong quá trình
thu nhận các thông tin về ảnh.
Sự lập luận (Reasoning): cách mà một hệ thống nhận dạng mặt có thể làm để so
sánh các mặt ng−ời nhằm đạt hiệu quả nhất.
Mỗi từ các mục con d−ới đây trình bày chi tiết ba vấn đề đã đ−ợc nêu trên đây.
1.2.2 Thu nhận dữ liệu
Phần này xem xét cách mà dữ liệu gốc đ−ợc thu nhận tr−ớc khi các vấn đề của sự
biểu diễn đ−ợc thực hiện. Câu hỏi đặt ra là: Có bao nhiêu kiểu ảnh mặt là cần thiết và kiểu
đó là gì?. Có bao nhiêu kiểu thay đổi sẽ đ−ợc mô tả trong các ảnh và các kiểu đó là gì?.
Trong vấn đề về bắt giữ dữ liệu ta cần chú ý tới các vấn đề nh− là xây dựng đ−ợc cơ
sở dữ liệu ảnh, trình phát hiện mặt, phân đoạn và chuẩn hoá ảnh. Mục đích của việc xây
dựng một cơ sở dữ liệu ảnh là nhằm phục vụ cho việc phân tích thuật toán và cho việc kiểm
Đối
t−ợng
Phân
đoạn
Phát
hiện mặt
Chuẩn
hoá
DataBas
e
Thông tin Vùng thông tin
Các mặt thu
đ−ợc L−u trữ
Hình 1.3. Mô phỏng các giai đoạn thực hiện của vấn đề bắt giữ dữ liệu
11
nghiệm hệ thống ngoài ra cơ sở dữ liệu còn đ−ợc khai thác trong các hệ thống nhận dạng.
Mô tả vấn đề bắt giữ dữ liệu biểu diễn trong hình 1.3.
Việc xây dựng cơ sở dữ liệu phải thoả mãn đ−ợc sự biểu diễn các biến thể của môi
tr−ờng. Ngoài ra cơ sở dữ liệu phải thể hiện đ−ợc sự mô tả các thông tin về bề mặt, các
diễn cảm của mặt và các ảnh h−ởng của điều kiện bên ngoài tác động đến quá trình nhận
dạng. Các hệ thống nhận dạng chúng không thể thực hiện đ−ợc trên các dữ liệu lớn, chúng
chỉ có thể thực hiện trên cơ sở dữ liệu hữu hạn. Với bài toán nhận dạng ảnh mặt ng−ời, yêu
cầu cơ sở dữ liệu phải l−u trữ đ−ợc các thông tin quan trọng của mặt nh−: mắt, mũi, mồm,
các thông tin có liên quan khác và phải loại bỏ đ−ợc các thông tin không cần thiết. Thay
vào việc l−u trữ toàn bộ ảnh mặt của ng−ời nào đó ta thiết lập một cơ sở dữ liệu chuẩn mà
nó chỉ l−u các thông tin quan trọng của mặt ng−ời mà thôi. Cơ sở dữ liệu chuẩn này cho ta
hai lợi ích đó là: giúp cho hệ thống thực hiện một cách dễ dàng và giảm tối thiểu không
gian l−u trữ dữ liệu. Các cơ sở dữ liệu chuẩn hay đ−ợc dùng ngày nay đó là: ORL – cơ sở
dữ liệu này đ−ợc phát triển tại phòng thí nghiệm nghiên cứu Olivetti n−ớc Anh, nó thỏa
mãn các sự biến đổi nh− hình dáng, ánh sáng và diễn cảm của mặt. Cơ sở dữ liệu thứ hai
đó là FERET đ−ợc phát triển bởi phòng thí nghiệm nghiên cứu quân sự Mỹ.
Sự phân loại giữa ảnh mặt với ảnh nền là rất khó bởi vì sự đa dạng trong các lớp mặt
(nòi giống, các diễn cảm mặt, kiểu tóc, trang điểm, kính, ria mép,..). T−ơng tự nh− vậy
trong việc định vị các đặc điểm của mặt cũng là rất khó bởi vì mỗi một ng−ời có một
khuôn mặt khác nhau. Hơn nữa, có nhiều ảnh h−ởng khác tới ảnh nh− sự chiếu sáng và
h−ớng chụp.
Với mặt của con ng−ời các thông tin quan trọng về bề mặt sẽ đ−ợc l−u trữ trong cơ
sở dữ liệu. Các thông tin đó có thể là các đặc điểm cấu thành lên bề mặt con ng−ời nh−: hai
mắt, mũi và mồm. Để thu đ−ợc các thông tin cần thiết từ một ảnh gốc, hệ thống thực hiện
các quá trình phân đoạn ảnh thành các vùng con và mục tiêu của quá trình phân đoạn này
nhằm loại bỏ đ−ợc các vùng thông tin không cần thiết. Trong ảnh mặt ng−ời, các phần
không cần thiết có ảnh h−ởng rất nhiều đến quá trình thu thập thông tin đó là các vùng của
tóc, ảnh nền, và các thay đổi về hình học của ảnh mặt ng−ời.
Dựa vào các thông tin của bề mặt và tiến hành phân đoạn ảnh mặt. Việc phân đoạn
giúp cho quá trình phát hiện mặt đ−ợc tốt hơn tại vì ảnh nền có rất nhiều yếu tố khác tác
động trên ảnh. Do đó phải phân đ−ợc các vùng khác nhau của ảnh, các vùng trở nên cô lập
và mỗi vùng miêu tả một số đặc tr−ng của ảnh. T−ơng ứng với các vùng có thể hình thành
nên các ảnh mặt. Tiếp sau quá trình phân đoạn ảnh là quá trình phát hiện mặt thông qua
các vùng thu đ−ợc của quá trình phân đoạn.
12
Có rất nhiều ph−ơng pháp đã và đang đ−ợc sử dụng trong việc phát hiện mặt. ở đây,
tôi xin giới thiệu 3 cách tiếp cận giải quyết bài toán. Thứ nhất: cách tiếp cận từ d−ới lên,
cách này sử dụng các ràng buộc hình học dựa trên điểm đặc tr−ng. Các đặc điểm của bề
mặt đ−ợc hiển thị bằng cách sử dụng bộ lọc sau đó các đặc điểm đ−ợc kết hợp với nhau để
tạo thành một mặt dự tuyển. Cách thứ hai: phát hiện mặt bất biến trong phép quay và co
giãn, các mặt dự tuyển đ−ợc phát hiện bằng cách gom các vùng với nhau cho đến khi độ
sắc nét xấp xỉ hình ellipsis. Cách thứ ba: hầu hết các thuật toán phát hiện mặt sử dụng việc
tìm kiếm nhiều mức với sự phân loại kích th−ớc cố định.
Hầu hết các kỹ thuật nhận dạng mẫu đã sử dụng các l−ợc đồ phát hiện nhiều mức
cho việc phát hiện mặt. Cách tiếp cận dễ dàng hơn đó là sử dụng quy tắc quyết định dựa
trên c−ờng độ ảnh của các ảnh dự tuyển từ sự biểu diễn nhiều mức của ảnh nhập vào.
Ngoài ra còn có các kỹ thuật khác trong việc phát hiện mặt nh−: các mô hình Gaussian ứng
dụng trên một không gian con các thành phần chính, ứng dụng máy vector cũng thành
công trong việc phát hiện mặt trong ảnh nền phức tạp và hệ thống dựa trên mạng Neural đã
sử dụng thành công trong việc phát hiện mặt và bất biến với phép quay.
Việc phát hiện mặt có thể đ−ợc giải quyết bằng sự phân loại hai lớp đó là: lớp ảnh
mặt và lớp ảnh nền. Sự phân loại giữa lớp ảnh mặt và các đối t−ợng ảnh nền là rất khó bởi
vì các sự biến đổi trong các mặt ảnh h−ởng đến quá trình phát hiện mặt ng−ời (các ảnh
h−ởng nh−: quan điểm về chủng tộc, các diễn cảm bề mặt, kiểu tóc, cặp kính…). T−ơng tự
nh− vậy, việc xác định vị trí các đặc điểm cũng rất khó vì sự thay đổi giữa các cá nhân
(chủng tộc, các kiểu cấu thành, các diễn cảm mặt…) cũng khác nhau.
Sau khi thu đ−ợc ảnh trong một ảnh nền hệ thống tiến hành chuẩn hoá ảnh, thông
th−ờng việc chuẩn hóa đ−ợc thực hiện trên các giá trị mức độ xám. Đối với bề mặt của con
ng−ời thì việc chuẩn hóa th−ờng dựa vào vị trí của hai mắt hoặc là mũi hoặc là mồm.
Các ảnh mặt sau khi chuẩn hoá đ−ợc l−u trữ trong cơ sở dữ liệu và kết quả này đ−ợc
sử dụng cho các quá trình tiếp theo có sử dụng kết quả bắt giữ đ−ợc này.
1.2.3 Biểu diễn đối t−ợng
Đối với một hệ thống nhận dạng ảnh mặt ng−ời để thực hiện có hiệu quả, thì hệ
thống phải tách và trích ra các điểm đặc tr−ng trong dữ liệu nhập vào và từ đó biểu diễn
các đặc tr−ng của mặt ng−ời hiệu quả nhất. Các phần tử của sự biểu diễn có thể đ−ợc tạo
nên trong nhiều cách khác nhau, và nó phụ thuộc vào nhiệm vụ mà cách tiếp cận nào là
thích hợp nhất.
13
Vấn đề quan trọng của quá trình biểu diễn dữ liệu là làm giảm kích th−ớc của ảnh
bằng cách loại bỏ hầu hết các thông tin không cần thiết trong ảnh gốc, làm giảm độ thô
của ảnh.
Một số cách sử dụng phổ biến hiện nay trong quá trình tách và trích đ−ợc các điểm
đặc tr−ng của ảnh dữ liệu nh−: cách tiếp cận dựa trên đặc điểm, cách tiếp cận dựa trên
khuôn mẫu, phân tích các thành phần chính và thông qua các bộ lọc.
Cách tiếp cận dựa trên đặc điểm nhằm phát hiện và đo đạc các điểm nổi bật của bề
mặt, sử dụng khoảng cách hình học và góc giữa các đặc điểm chính của bề mặt nh− là: hai
mắt, mũi, mồm và nhằm mục đích phân loại các mặt trong đó các phần tử dựa trên mối
quan hệ vị trí và các kích cỡ của chúng. Với cách tiếp cận dựa trên khuôn mẫu sử dụng
thông tin xác đáng của điểm ảnh nh− là mức độ xám gốc hoặc xử lý các khía cạnh nổi bật
của dữ liệu. Khuôn mẫu có thể là toàn bộ ảnh hoặc là các vùng t−ơng ứng với các vị trí của
đặc điểm (vị trí của hai mắt hoặc mồm). Nói chung với cách tiếp cận này chỉ cho ta đ−ợc
một số đặc điểm của đối t−ợng, nó không đủ để có thể ứng dụng trong thực tế nh−ng đối
với sự hiệu chỉnh hình học hoặc bộ lọc thì có thể cải tiến đ−ợc các kết quả này.
Cách tiếp cận phân tích các thành phần chính: cách tiếp cận này có thể trích ra đ−ợc
thông tin quan trọng nhất đ−ợc trình bày bằng cách thống kê đối với một tập các ảnh nh−
là một tập các vector riêng. Các vector riêng có thể đ−ợc đánh giá nh− là tập các điểm đặc
tr−ng chung và định rõ đ−ợc các đặc điểm thay đổi của ảnh trong cơ sở dữ liệu. Mỗi ảnh
đ−ợc biểu diễn một cách chính xác qua một sự liên kết tuyến tính của những vector riêng
này. Để quyết định kích th−ớc của không gian mặt chúng ta dựa vào số các vector riêng.
Kỹ thuật này phân tích các đặc điểm của ảnh, thu thập các thông tin quan trọng và loại bỏ
đ−ợc các thông tin d− thừa không cần thiết cho hệ thống nhận dạng. Do đó nó có thể tìm
đ−ợc sự biểu diễn tối −u kích th−ớc của ảnh nh−ng kỹ thuật này có thể hữu ích đối với việc
xây dựng lại cấu trúc ảnh hơn là đối với việc nhận dạng. Hơn nữa, ph−ơng thức mặt riêng
(vector riêng) là không bất biến với sự thay đổi hình học của ảnh nh− là sự co giãn, dịch
chuyển hoặc phép quay trong dữ liệu gốc.
Cách tiếp cận tiêp theo là sử dụng bộ lọc: hệ thống cho ảnh đi qua bộ lọc và qua bộ
Bộ lọc
* *
* * *
* *
Hình 1.4 Mô phỏng bộ lọc để lấy đ−ợc các điểm đặc tr−ng
14
lọc đó các thông tin đặc tr−ng quan trọng sẽ đ−ợc thu lại và làm giảm không gian l−u trữ
ảnh. Kết quả là ta thu đ−ợc các thông tin quan trọng của ảnh. Có thể mô tả nh− hình 1.4
trên đây.
Hình trên cho thấy khi cho qua bộ lọc các thông tin d− thừa sẽ bị loại bỏ chỉ để lại
các thông tin quan trọng tạo nên ảnh mặt.
Nói tóm lại: các cách tiếp cận trên nhằm mục đích phân loại đ−ợc các điểm đặc
tr−ng và biểu diễn chúng sau đó thực hiện việc tối −u các thông tin đó sao cho kích th−ớc
không gian l−u trữ điểm đặc tr−ng là nhỏ nhất.
1.2.4 Lập luận kết quả
Hệ thống so sánh hai ảnh với nhau sao cho có hiệu quả nhất, sụ phù hợp của hai ảnh
đ−ợc tính bằng cách nh−: sử dụng cách tiếp khoảng cách tiếp xúc và sử dụng các ng−ỡng
để đánh giá.
Trong không gian mặt hệ thống so sánh khoảng cách từ một mặt cần tìm đến một
tập hợp các mặt, kết quả là ta thu đ−ợc tập các số đo. Nếu một trong tập các số đo thỏa
mãn yêu cầu về khoảng cách nhận dạng thì đó chính là mặt mà chúng ta cần tìm. Các
khoảng cách chuẩn đ−ợc sử dụng: khoảng cách Euclidean hoặc khoảng cách Mahalanobits
(đối với không gian vector riêng).
Bên cạnh việc sử dụng các khoảng cách để đánh giá sự phù hợp của hai ảnh, chúng
ta còn có thể sử dụng các ng−ỡng để đánh giá mức độ chính xác của một số cách tiếp cận
khác. Tỷ số nhận dạng sai của các cách tiếp cận khác nhau không thể v−ợt quá một ng−ỡng
nào đó. Nếu v−ợt quá thì kết luận hai mặt đó không phù hợp còn ng−ợc lai thì hai mặt là
phù hợp và ta tiến hành đánh giá nhận dạng chúng.
1.3 hệ thống kỹ thuật nhận dạng ảnh mặt ng−ời
Nhận dạng ảnh mặt đã đ−ợc nghiên cứu trong nhiều năm và đang đ−ợc ứng dụng
trong thực tế nh− là: các hệ thống bảo mật, sự xác định tội phạm và hỗ trợ các hệ thống
nhận dạng giọng nói. Nhận dạng mặt rất quan trọng đối với con ng−ời bởi vì bề mặt đóng
một vai trò lớn trong giao tiếp với cộng đồng, các biểu hiện của tình cảm, cảm xúc, suy
nghĩ và cảm nghĩ.
Hệ thống nhận dạng ảnh mặt tự động có thể đ−ợc chia thành các phần nh−: quy
trình công nghệ xử lý thông tin, các vấn đề triển khai trong thực tế và các ứng dụng điển
hình.
15
1.3.1 Qui trình công nghệ xử lý thông tin
Quy trình thiết kế một hệ thống nhận dạng ảnh mặt tự động là một quá trình xử lý
đa giai đoạn. Những giai đoạn này về cơ bản là các b−ớc giống nhau. Các giai đoạn có thể
đ−ợc mô tả nh− sau:
B−ớc 1: Giai đoạn cảm biến
Các nghiên cứu đ−ợc đ−a ra để xác định tác nhân đem lại các thuộc tính của đối
t−ợng (cỡ, hình dáng, màu sắc, kết cấu, …). Các giá trị và các mối quan hệ giữa các thuộc
tính của đối t−ợng đ−ợc sử dụng để biểu thị đặc điểm của một đối t−ợng trong cách thức
của một vector mẫu. Phạm vi giá trị của thuộc tính đ−ợc hiểu nh− là độ lớn của không
gian. Một vấn đề quan trọng là độ chính xác của sự xuất hiện khung cảnh thực đ−ợc thu
bởi vector mẫu nh− thế nào. Các vấn đề nhiễu trong ảnh phải d−ới mức độ cho phép và
không làm mất thông tin chủ yếu.
Các thông tin của đối t−ợng đ−ợc biểu diễn nh− thế nào trong vào giai đoạn cảm
biến này và kết quả thu đ−ợc của giai đoạn nàylà các kết quả đo thông tin của đối t−ợng,
kết quả đo này đ−ợc đ−a vào giai đoạn tiền xử lý để thực hiện việc loại bỏ nhiễu, nâng cao
khía cạnh chắc chắn của ảnh…
B−ớc 2: Giai đoạn tiền xử lý
Giai đoạn tiền xử lý đ−ợc thực hiện để loại bỏ nhiễu, nâng cao khía cạnh chắc chắn
của ảnh, và gây ra các thay đổi khác làm đơn giản hóa các b−ớc xử lý ở mức độ cao hơn.
Đối
t−ợng
Dấu hiệu
Cảm biến
Giai đoạn
cảm biến
Kết quả đo tín hiệu
Giai đoạn
tiền xử lý
Trình trích chọn thông tin
đặc tr−ng
Sự trích
chọn đăc
tr−ng
Không gian biểu diễn
Giai đoạn
phân loại
Nhóm mẫu
Xử lý thông
tin khung
cảnh
Hình 1.5 Quá trình nhận dạng mẫu
16
Để ngăn ngừa sự loại ra các cạnh của ảnh đã tồn tại hoặc đ−a ra các cạnh lỗi, thao tác tiêu
biểu đ−ợc sử dụng đó là: tách ng−ỡng và làm mịn. Tách ng−ỡng biến đổi một ảnh cấp độ
xám thành một ảnh nhị phân, trong đó mỗi một điểm có thể là đen hoặc trắng. Làm mịn
ảnh đ−ợc dùng để làm giảm nhiễu, để nâng cao sự lựa chọn các điểm đặc tr−ng của ảnh, và
để làm giảm các chi tiết ảnh không mong muốn. Do đó, ảnh đ−ợc phân chia thành các đối
t−ợng cô lập nhau. Kết quả là thu đ−ợc không gian điểm đặc tr−ng và nó giúp cho giai
đoạn trích chọn điểm đặc tr−ng đ−ợc thực hiện.
B−ớc 3: Trích chọn điểm đặc tr−ng
Sau khi có đ−ợc không gian điểm đặc tr−ng, hệ thống tiến hành trích chọn các điểm
đặc tr−ng của đối t−ợng trong không gian đó. Việc trích ra các đặc tr−ng của đối t−ợng
thông qua nhiều cách khác nhau nh−ng ý nghĩa chính của nó vần là phải sử dụng một bộ
lọc để loại bỏ các thông tin không cần thiết và giữ lại đ−ợc các thông tin quan trọng. Các
điểm đặc tr−ng của đối t−ợng đ−ợc lọc và kết quả đó giúp cho quá trình nhận dạng thuận
tiện. Quá trình lọc này có thể thống kê thành các thuộc tính nh−: màu sắc, kết cấu, c−ờng
độ, khoảng cách, chuyển động… Các điểm đặc tr−ng hình thành nên không gian biểu diễn
điểm đặc tr−ng. Kết quả của không gian biểu diễn giúp cho quá trình phân loại các điểm
đặc tr−ng đ−ợc tốt hơn.
B−ớc 4: Giai đoạn phân loại
Tiến hành phân loại không gian biểu diễn điểm đặc tr−ng để thu đ−ợc các thông tin
mẫu bằng cách sử dụng các giá trị điểm đặc tr−ng đã chọn. Kết quả là các đối t−ợng hoặc
các lớp mẫu biểu thị đặc điểm đ−ợc học bởi các miêu tả sự hình thành mẫu chung, các
chuẩn phân loại, hoặc các hàm quyết định.
B−ớc 5: Trình xử lý thông tin khung cảnh
Trình xử lý khung cảnh làm tăng độ chính xác của nhận dạng bởi việc cung cấp
thông tin thích hợp có liên quan đến môi tr−ờng xung quanh đối t−ợng (bằng cách làm phù
hợp các đặc điểm của đối t−ợng với các mô hình đã đ−ợc l−u trữ, hoặc bằng cách phân loại
dựa trên tiêu chuẩn phân loại).
1.3.2 Các vấn đề trong triển khai thực tế
Thành công của một ứng dụng nhận dạng mặt th−ờng phụ thuộc vào cách mà các
thông tin (dấu hiệu) đ−ợc mô tả. Sự thụ thuộc vào ứng dụng, sự biểu diễn thích hợp sẽ đ−ợc
thực hiện để tạo ra quá trình biểu diễn thông tin mà các thông tin là xác đáng nhất đ−ợc
nhấn mạnh cho ứng dụng. Hai ràng buộc đáng chú ý đó là:
- Kích th−ớc của trình phân loại mà đ−ợc liên kết với số liên thông trong mạng
Neural.
17
- Số tập các ví dụ đào tạo (cỡ của tập dữ liệu).
Các quyết định phải đ−ợc đ−a ra để làm giảm cỡ của vector mẫu mà đ−ợc mô tả
trong mạng Neural. Thông th−ờng kích th−ớc của các vector mẫu phụ thuộc vào miền của
quang phổ mà quá trình thu ảnh gặp phải. Kích th−ớc của các vector mẫu có thể đ−ợc giảm
bằng cách sử dụng một số mối quan hệ giữa các vùng quang phổ với nhau.
Sự thay đổi sóng là một kỹ thuật phổ biến khác đ−ợc sử dụng trong quá trình biểu
diễn ảnh, ở đó một dấu hiệu nhất thời đ−ợc biểu diễn trong giới hạn của hàm cơ sở:
∑∑=
j k
jkjk thCtX )()( (3)
trong đó X(t) là chuỗi thời gian gốc, Cjk là các hệ số sóng, hjk(t) là các nhân sóng, chỉ
số j là các vị trí biểu thị thời gian của nhân, và chỉ số k là sự chia của nhân. Sau đó sự thay
đổi các hệ số sóng Cjk đ−ợc sử dụng cho việc cung cấp dữ liệu tới mạng Neural.
1.3.3 Các ứng dụng điển hình
Quá trình nhận dạng ảnh mặt ng−ời tự động có thể đ−ợc chia thành hai nhiệm vụ
chính:
- Tìm một mặt hoặc các mặt trong một ảnh nền và
- Sự nhận dạng các đặc điểm của mặt
Nhiệm vụ thứ nhất: tìm một mặt trong một ảnh giống nh− là việc đăng ký mặt
hoặc việc xác định vị trí của mặt. Nhiệm vụ này phụ thuộc vào các nhân tố sau:
+ Điều khiển màu sắc và ảnh nền
+ Các ảnh màu hoặc đơn màu và các ảnh tĩnh hoặc các ảnh video.
Nếu ánh sáng ảnh nền đ−ợc điều khiển thì việc xác định các mặt là dễ dàng. Do đó,
sự phụ thuộc vào điều khiển thông qua các nhân tố sẽ dẫn đến việc xác định vị trí của mặt
có thể là một bài toán dễ hoặc một bài toán khó. Do ảnh h−ởng của các yếu tố và các loại
ảnh nên việc tìm mặt cũng trở nên khó khăn hơn. Sự biến đổi của ánh sáng cũng nh− sự
biến đổi của ảnh cơ sở đều ảnh h−ởng rất lớn đến quá trình tìm kiếm mặt.
Nhiệm vụ thứ hai: sự nhận dạng và sự xác minh mặt là hai kiểu của bài toán nhận
dạng mặt, cụ thể là bài toán nhận dạng và bài toán xác minh mặt. Trong bài toán xác minh
mặt ng−ời ta phải kiểm tra mặt đã cho là của ai và do đó việc kiểm tra này làm phù hợp đặc
tính của ảnh đối với một mô hình đơn. Trong bài toán nhận dạng mặt, đây là bài toán tìm
sự phù hợp nhất của một ảnh ch−a biết dựa vào một cơ sở dữ liệu các mẫu mặt hoặc là định
rõ nó không phù hợp với bất kỳ ảnh nào đó trong cơ sở dữ liệu. Điều quan trọng trong thực
tế đó là sự khác nhau của hai bài toán này về tốc độ: nói chung, nếu ta có N ng−ời trong
18
một cơ sở dữ liệu thì quá trình nhận dạng sẽ chậm hơn N lần so với quá trình xác minh. Tại
vì quá trình nhận dạng phải so sánh N lần còn quá trình xác minh chỉ phải so sánh một lần.
Các cơ sở dữ liệu đã và đang đ−ợc phát triển
Phòng thí nghiệm nghiên cứu Olivetti (Olivetti Research Laboratory – ORL) ở Anh
đã phát triển một cơ sở dữ liệu mặt mà có thể cung cấp nh− một điểm chuẩn tốt đối với sự
kiểm tra một hệ thống nhận dạng mặt.
Cơ sở dữ liệu ảnh mặt FERET đ−ợc phát triển tại Mỹ. Cơ sở dữ liệu này đ−ợc kiểm
tra bởi phòng thí nghiệm nghiên cứu quân đội Mỹ.
Hình d−ới đây mô tả một cơ sở dữ liệu ảnh, trong đó các ảnh biến đổi theo các điều
kiện của ánh sáng:
Hình 1.6. Biểu diễn các ảnh theo các điều kiện thay đổi của ánh sáng
19
ch−ơng 2. nhận dạng ảnh mặt ng−ời trong điều kiện ánh sáng
thay đổi
Ch−ơng hai này phân tích các yếu tố ảnh h−ởng đến quá trình nhận dạng và các
cách tiếp cận để giải quyết các yếu tố ảnh h−ởng đó.
1.4 Phân tích các yếu tố ảnh h−ởng đến quá trình nhận dạng
Bất cứ một quá trình nhận dạng nào cũng chịu ảnh h−ởng của nhiều yếu tố không
thuận lợi tới quá trình. Các yếu tố có thể làm giảm tính chính xác của hệ thống, làm giảm
tốc độ nhận dạng,… . Có thể kể đến các yếu tố d−ới đây:
- Môi tr−ờng,
- Biểu diễn khía cạnh hình học của bề mặt (sự quay ảnh, co giãn, thay đổi vị trí,…),
- Các sai số do hệ thống.
Các đặc tr−ng bất động của ảnh là những yếu tố cần thiết để khắc phục đ−ợc ảnh
h−ởng của những yếu tố này song tập những đặc tr−ng bất động không đủ để trình bày ảnh
mặt ng−ời, vì vậy việc nghiên cứu, phân tích ảnh h−ởng của các yếu tố đó là quan trọng.
Trong các mục d−ới đây, các yếu tố ảnh h−ởng đến hệ thống nhận dạng ảnh tự động
đ−ợc phân tích và một số giải pháp khắc phục đ−ợc giới thiệu.
2.1.1. ánh sáng
Các yếu tố của môi tr−ờng ảnh h−ởng tới quá trình nhận dạng mặt nh−: các yếu tố
về ánh sáng, các thiết bị thu nhận ảnh và khung cảnh mà ảnh đ−ợc thu nhận. ánh sáng làm
biến đổi mức độ xám của ảnh và c−ờng độ các điểm ảnh do đó nó làm cho ảnh hoàn toàn
biến đổi qua các vùng khác nhau và các yếu tố đó làm cho hệ thống nhận dạng rất khó có
thể nhận dạng ảnh một cách chính xác. Để khắc phục vấn đề đó đòi hỏi phải đ−a ra cho hệ
thống một số kỹ thuật để loại bỏ các hạn chế đó. ánh sáng làm thay đổi hoàn toàn các dấu
hiệu của ảnh, ngoài ra ánh sáng còn tạo nên các lớp bóng của chính đối t−ợng nhận dạng
hoặc tạo nên các sự che lấp của bản thân nó.
2.1.2. Các thay đổi hình học
Bên cạnh các yếu tố môi tr−ờng ảnh h−ởng tới quá trình nhận dạng, hệ thống còn
chịu ảnh h−ởng của các yếu tố hình học nh−: sự quay, sự dịch chuyển và sự co giãn… Các
yếu tố này ảnh h−ởng rất nhiều đến hệ thống nhận dạng tại vì ảnh h−ởng của nó làm thay
đổi cấu trúc của ảnh, thay đổi h−ớng chụp, góc chụp và thay đổi kích th−ớc của ảnh.
20
2.1.3. Sai số do hệ thống
Một hệ thống nhận dạng ảnh dựa vào các điểm đặc tr−ng thì không thể tránh khỏi
các sai số khi một hệ thống xác định vị trí đó gây ra. Nh−ng mức độ gây ra ở đây là nhiều
hay ít, nó phụ thuộc vào quá trình xác định vị trí đó mà thôi. Ví dụ hệ thống xác định vị trí
hai mắt của tác giả [Mariani], hệ thống nhận dạng này phụ thuộc rất nhiều vào vị trí chính
xác của mắt, nếu hệ thống trả lại kết quả sai thì hệ thống nhận dạng cũng nhận sai. Các sai
số nh− là sai số về sự quay, sự so giãn và sự dịch chuyển, các sai số về phép đo này cho hệ
thống những thông tin lệch lạc về vị trí của ảnh so với ảnh gốc, điều đó dẫn đến hệ thống
nhận dạng không chính xác và cho kết quả không nh− mong muốn. Do đó cần phải khắc
phục các điều kiện đó bằng cách sử dụng các kỹ thuật có liên quan đến tính chất hình học
và biểu diễn hình học của bề mặt.
1.5 Các kỹ thuật giải quyết
Phần này trình bày một số yếu tố môi tr−ờng ảnh h−ởng tới quá trình nhận dạng,
yếu tố này ảnh h−ởng rất nhiều đến sự đăng ký mặt và sự nhận dạng mặt. Với một mặt của
một ng−ời, tr−ớc khi thu ảnh để đăng ký, đã có các điều kiện môi tr−ờng ảnh h−ởng đến
ảnh khi đăng ký và lúc nhận dạng thì điều kiện môi tr−ờng cũng lại ảnh h−ởng đến ảnh cần
nhận dạng. Trong phạm vi của mục này bao gồm các phần sau: (1) Đ−a các thông tin về
điều kiện môi tr−ờng vào mô tả đối t−ợng, (2) Kỹ thuật dựa trên khoảng cách tiếp xúc, (3)
Sử dụng nhiều cách biểu diễn đối t−ợng khác nhau
2.1.1 Đ−a các thông tin về điều kiện môi tr−ờng vào mô tả đối
t−ợng
Trong môi tr−ờng có rất nhiều yếu tố ảnh h−ởng đến quá trình nhận dạng ảnh và
quá trình đăng ký ảnh. Các yếu tố môi tr−ờng nh−: yếu tố ánh sáng, góc chụp ảnh và các
thiếp bị thu ảnh khác nhau. Ta thấy để xác định đ−ợc tính phù hợp của hai ảnh khác nhau
không phải là dễ dàng tại vì hai ảnh tuy là của cùng một đối t−ợng nh−ng chúng lại đ−ợc
chụp ở các thời điểm khác nhau. Do đó các điều kiện này ảnh h−ởng rất nhiều đến chất
l−ợng cũng nh− ảnh h−ởng đến các yếu tố hình học và mức xám của ảnh. Ta có thể mô tả
cách mà so sánh hai ảnh của cùng một đối t−ợng nh− hình sau.
21
Hình 2.1 Mô tả cách so sánh hai ảnh với nhau do các tác động của môi tr−ờng
Tại vì hai ảnh lúc chụp khác nhau nên khi so sánh sụ phù hợp của hai ảnh đ−ợc thực
hiện bằng cách ảnh chụp ban đầu đ−ợc phát sinh thành tất cả các mẫu ảnh mà nó đáp ứng
đ−ợc các tác động của môi tr−ờng. Mỗi mẫu t−ơng ứng với một điều kiện của môi tr−ờng
khác nhau. Để so sánh ảnh cần nhận dạng với ảnh ban đầu ta không thể thực hiện so sánh
hai ảnh trực tiếp mà ta tiến hành so sánh ảnh đó với tất cả các mẫu mà ảnh ban đầu phát
sinh. Sự phù hợp của ảnh này với một mẫu ảnh nào đó cho ta biết đ−ợc sự phù hợp t−ơng
ứng với điều kiện môi tr−ờng. Kết quả của việc so sánh này cho ta nhận ra đ−ợc các yếu tố
nào của môi tr−ờng đã tác động đến ảnh.
Việc phát sinh các mẫu mặt t−ơng ứng với các điều kiện của ánh sáng đ−ợc thực
hiện trong quá trình đăng ký mặt mẫu và quá trình phát sinh các mặt nhân tạo nh− sau:
* Phát sinh các mẫu mặt t−ơng ứng với các điều kiện thay đổi của ánh sáng
Trong quá trình phát sinh các mẫu mặt, hiện nay có rất nhiều kỹ thuật để tạo ra các
mẫu mặt nh− là sử dụng các mặt nạ về sự thay đổi của hình học và sự thay đổi của quang
học. Với sự thay đổi về hình học cho ta đ−ợc các mẫu mặt chụp trực diện và nó đ−ợc phát
sinh từ một mặt nghiêng. Nh−ng các mặt nghiêng đó cũng cần giới hạn trong một góc thay
đổi nào đó. Nếu góc nghiêng v−ợt quá một ng−ỡng cho phép nào đó thì hệ thống không thể
thực hiện đ−ợc. Vấn đề quan tâm chủ yếu trong phần này là các thay đổi của quang học
ảnh h−ởng đến mặt trong quá trình phát sinh các mẫu mặt và giả sử các thay đổi của hình
học là không ảnh h−ởng nhiều đến quá trình phát sinh mặt và đăng ký mặt.
đối t−ợng
ban đầu
đối t−ợng cần
nhận dạng
Tập các mẫu t−ơng ứng với
điều kiện tác động
22
Sự thay đổi về quang học chỉnh xửa độ xám của một điểm ảnh sử dụng một hàm phi
tuyến, và có thể phụ thuộc vào vị trí của điểm ảnh. Các sự thay đổi tuyến tính không đ−ợc
mô hình hoá nh− là các quá trình chuẩn hoá lớp ảnh (cân bằng histogram) đã tồn tại để loại
bỏ những điểm không hiệu quả. Các mặt nạ ánh sáng mô tả d−ới đây đ−ợc sử dụng trong
quá trình phát sinh và đăng ký mẫu mặt. Những mặt nạ này xấp xỉ với các điều kiện ánh
sáng thực và tỏ ra rất có hiệu quả đối với các ứng dụng nhận dạng mặt. Quá trình này sử
dụng 3 kiểu mặt nạ khác nhau để mô tả các thay đổi của ánh sáng nh−ng nó có thể dễ dàng
mở rộng ra thành nhiều mặt nạ khác nhau:
Mặt nạ 1: Hàm logarit trên các mức xám
Mục đích của việc ứng dụng mặt nạ này để thu đ−ợc một ảnh sáng hơn từ một ảnh
gốc. Một bảng tra cứu đ−ợc tạo thành để thực hiện nhiệm vụ này. Toàn bộ bảng đ−ợc tính
toán nh− sau:
255
)255(
)log()255log(
)log()log(
255)(
min
min
min
min
kw
kv
k
kv
wL
−+=
⎟⎟⎠
⎞
⎜⎜⎝
⎛
−
−=
(4)
trong đó w là mức xám của ảnh và thay đổi trong [0,255], v là mức xám đ−ợc biến
đổi trong phạm vi [kmin,255] với kmin ≥ 0, và L(w) là mức xám thu đ−ợc trong phạm vi
[0,255] và kmin là một ng−ỡng tối thiểu nào đó giới hạn sự thay đổi của mức xám, cho phép
mức xám biến thổi không thấp hơn ng−ỡng kmin.
Kết quả của thuật toán này đ−ợc minh hoạ nh− hình sau:
Hình 2.2 Biểu diễn ảnh sáng hơn so với ảnh gốc
23
Mặt nạ 2: Hàm số mũ trên các mức xám
Mục đích của ứng dụng mặt nạ này trên các mức xám để thu đ−ợc một ảnh tối hơn
từ một ảnh gốc. Nhiệm vụ này đ−ợc thực hiện bằng cách tạo ra một bảng tra cứu và toàn bộ
bảng đ−ợc tính toán nh− sau:
⎟⎟
⎟⎟
⎠
⎞
⎜⎜
⎜⎜
⎝
⎛
−
−
=
1)exp(
1)
255
*
exp(
255)(
max
max
k
kw
wL (5)
trong đó w ∈ [0,255] là mức xám của ảnh, kmax > 0, và L(w) ∈ [0,255] là mức xám
sau khi thực hiện. kmax là giới hạn mà mức xám biến đổi cực đại.
Kết quả của thuật toán đ−ợc minh hoạ nh− hình sau:
Hình 2.3 Biểu diễn ảnh tối hơn so với ảnh gốc.
Mặt nạ 3: Sự phát sinh các mặt nạ bóng ngang và dọc
ý t−ởng cơ bản sau sự phát sinh các mặt nạ bóng ngang và dọc là giống nhau, do đó
chỉ cần mô tả cách tiếp cận để phát sinh hình bóng đứng theo trực hoành x. Nhiệm vụ này
chỉnh xửa giá trị mức xám của một điểm mà phụ thuộc vào không gian vị trí của điểm đó
trong ảnh. Quá trình này đ−ợc thực hiện theo từng dòng.
Giả sử đặt độ rộng của ảnh là x và λ là một hệ số thực trong đó 0 < λ < 1. Đặt
m=λ*X. Khi đó chúng ta có thể định nghĩa hàm f(x) với x ∈ [0,X] nh− sau:
(6)
⎪⎪⎩
⎪⎪⎨
⎧
−
−+
=
)(
)(1
)(
mX
mx
m
x
xf
Nếu x ∈ [0,m]
Nếu x ∈ ]m,X]
24
Nếu cho một điểm p=(x,y) có mức xám là v thì chúng ta có thể tính toán giá trị xám
của điểm t−ơng ứng w ở vị trí (x,y) là w=v*f(x). Bằng cách làm nh− vậy, chúng ta có thể
phát sinh một ảnh trong đó m điểm đầu tiên của nó là tối hơn và các điểm còn lại là sáng
hơn. Các mặt nạ bóng ngang đ−ợc phát sinh trong một cách t−ơng tự bằng cách xem xét
toạ độ điểm y, và chiều cao của ảnh là Y. Cuối cùng, kết quả thu đ−ợc là một ảnh đã đ−ợc
chuẩn hoá. Các ảnh d−ới đây minh hoạ quá trình bóng đứng với 5 giá trị của λ.
Hình 2.4 Các hình bóng đứng
Nh− vậy với quá trình thay đổi trắc quang, hệ thống thu đ−ợc các ảnh biến đổi theo
ánh sáng, theo các mức xám. Bên cạnh các kỹ thuật phát sinh các ảnh nhân tạo thông qua
sự thay đổi trắc quang, còn có kỹ thuật phát sinh ảnh thông qua sự thay đổi của hình học.
Cả hai kỹ thuật này đều cho đ−ợc các mặt nạ mà các mặt nạ này dùng để phát sinh ra các
mẫu mặt và nó là dữ liệu cho quá trình đăng ký mặt.
Nói tóm lại, các kỹ thuật trên cho chúng ta đ−ợc tập các mẫu mặt t−ơng ứng với các
điều kiện khác nhau của ánh sáng, nhằm giúp cho quá trình đăng ký một mặt mới. Sau khi
đăng ký hoàn thành, cơ sở dữ liệu l−u trữ các mẫu mặt này giúp cho việc nhận dạng về sau
của hệ thống.
2.1.2 Cách giải quyết dựa trên kỹ thuật khoảng cách tiếp xúc
Tr−ớc hết trong thực tế, ph−ơng pháp khoảng cách tiếp xúc đ−ợc sử dụng rất thành
công trong bài toán nhận dạng chữ viết tay. Trong đó hình thái của từng chữ cái là xác
định nh−ng do ng−ời viết khác nhau nên hình thái của một chữ cái cũng khác nhau.
Nh−ng đối với mắt th−ờng thì việc phân biệt sự khác nhau này là không đáng kể. Với cùng
một chữ cái, cho dù ng−ời nào đó có viết nh− thế nào thì mắt th−ờng vẫn nhận đ−ợc tại vì
hình thái của chữ cái là xác định.
Cũng t−ơng tự nh− vậy, trong việc nhận dạng ảnh mặt ng−ời nếu đối với mắt th−ờng
thì không có gì phải bàn đến nh−ng đối với hệ thống nhận dạng tự động thực sự thì thế nào.
Đây là một bài toán khó mà không phải hệ thống nào cũng có thể làm đ−ợc, tại vì các sự
thay đổi của môi tr−ờng và sai số do hệ thống nhận dạng. Để khắc phục một số ảnh h−ởng
25
của môi tr−ờng đến quá trình nhận dạng, theo tác giả [Mariani] cách giải quyết bài toán
này dựa vào khoảng cách tiếp xúc mà kỹ thuật này đã thực hiện rất thành công trong hệ
thống nhận dạng chữ viết tay. Kỹ thuật này đ−ợc sử dụng để khắc phục các sự thay đổi
hình học, các thay đổi diễn cảm của mặt, và để bền vững với các thay đổi của trắc quang
đ−ợc tạo bởi các điều kiện ánh sáng. Các công việc đ−ợc dùng đối với các sự thay đổi của
hình học trên ảnh gốc nh−: các phép quay, sự co giãn trong khuôn khổ của khoảng cách
tiếp xúc.
Giả sử cho một ảnh là i và đặt t(I,α) một sự biến đổi của ảnh mà nó phụ thuộc vào
vector tham số L-chiều α. Sự thay đổi này có thể là các thay đổi của hình học nh− sự hiệu
chỉnh vị trí của các điểm hoặc là các thay đổi của quang học nh− thay đổi c−ờng độ của
các điểm, hoặc là cả hai. Trên thực tế, một ảnh tổng hợp có thể thu đ−ợc từ ảnh gốc bằng
cách áp dụng một liên kết tuyến tính của các sự thay đổi cơ bản này. Đặt MI là tập tất cả
các ảnh tổng hợp thu đ−ợc từ ảnh gốc thì
{ } ⎭⎬
⎫
⎩⎨
⎧ ℜ∈=+=Μ ∑
=
L
l
L
LllI ITI
1
21 ,...,,:)(. ααααα (7)
MI đ−ợc định nghĩa nh− là không gian con chứa trong không gian đầy đủ
M={t(I,α): α ∈ ℜL}, và các vector {T1(I), T2(I),…, TL(I)} mở rộng không gian con tiếp
xúc. MI ⊂ M tại vì, M là không gian ảnh đầy đủ, nó chứa đựng tất cả các ảnh thoả mãn tất
cả các thay đổi của môi tr−ờng còn MI chỉ có các ảnh thoả mãn một số yếu tố nào đó của
môi tr−ờng, cụ thể các yếu tố đó là các thay đổi về hình học và các thay đổi về ánh sáng.
Các vector {T1(I), T2(I),…, TL(I)} biểu thị sự thay đổi của các điều kiện tác động đến ảnh
nhận dạng và T1(I) = t1(I,α), T2(I) = t2(I,α),…, TL(I) = tL(I,α)
Khoảng cách tiếp xúc một cạnh D(I,à) giữa một ảnh i và một ảnh tham chiếu à
đ−ợc định nghĩa nh− khoảng cách nhỏ nhất giữa à và không gian con tiếp xúc MI,
⎪⎭
⎪⎬
⎫
⎪⎩
⎪⎨
⎧ −+= ∑
=
2
1
)(min),(
L
l
ll ITIID àαà α (8)
Các vector tiếp xúc {T1(I), T2(I),…, TL(I)} có thể đ−ợc tính toán bằng cách sử dụng
hữu hạn sự khác nhau giữa ảnh gốc i và một thay đổi nhỏ của I. Chúng ta đã định nghĩa các
vector tiếp xúc nh− là các mặt nạ hình học và mặt nạ quang học song song với sự dịch
chuyển, sự quay và sự co giãn, đ−ợc biểu diễn trực tiếp trong phạm vi sai số vị trí mắt do
hệ thống xác định vị trí mặt sinh ra.
Trên đây cho ta thu đ−ợc khoảng cách từ một ảnh này tới một ảnh cần so sánh, hai
ảnh là phù hợp nếu khoảng cách giữa hai ảnh có giá trị nhỏ nhất.
26
2.1.3 Kết hợp các cách biểu diễn đối t−ợng khác nhau
Trong hệ thống nhận dạng có rất nhiều cách tiếp cận khác nhau để giải quyết bài
toán này, mỗi kỹ thuật có một tính năng đặc biệt riêng và phù hợp với các yêu cầu riêng
của hệ thống nhận dạng ảnh tự động. Tại vì trong thực tế khi tiến hành nhận dạng một ảnh
nào đó thì hệ thống phải thu đ−ợc ảnh cần nhận dạng, nh−ng ảnh này ch−a phải là ảnh
chuẩn. Do đó ảnh cần nhận dạng còn chịu ảnh h−ởng của nhiều yếu tố nh−: ánh sáng, thay
đổi kiểu dáng khi thu ảnh và các thiết bị thu ảnh…. Chính vì vậy hệ thống nhận dạng ảnh
tự động phải đ−ợc kết hợp từ các cách tiếp cận khác nhau nhằm mục đích giúp cho hệ
thống bền vững với các yếu tố tác động đến ảnh. Mục này bao gồm các nội dung nh− sau:
(1) Các thuật toán bền vững với các điều kiện môi tr−ờng.
(2) Các kiến thức về nhân chủng học,
(3) Kỹ thuật so sánh dựa trên khuôn mẫu,
(4) Kỹ thuật so sánh dựa trên điểm đặc tr−ng
(5) Kết hợp hai kỹ thuật so sánh dựa trên khuôn mẫu và dựa trên điểm đặc tr−ng.
Các thuật toán bền vững với các điều kiện của môi tr−ờng
Nh− đã mô tả ở trên do các điều kiên môi tr−ờng tác động khác nhau đến quá trình
nhận dạng nên đòi hỏi phải có các thuật toán làm phù hợp, khắc phục các yếu tố tác động
của môi tr−ờng. Các yếu tố tác động đến hệ thống đó là: các yếu tố về ánh sáng, các yếu tố
hình học và sai số do hệ thống. Các thuật toán nhận dạng bền vững với các thay đổi của
hình học nh−: Phân tích các thành phần chính (Principal Components Analysis – PCA) –
kỹ thuật này hiệu chỉnh từng điểm ảnh của ảnh bằng cách thực hiện một sự thay đổi có liên
quan. Đối với các thay đổi của ánh sáng hệ thống sử dụng ph−ơng pháp trộn Gaussian dựa
trên lớp màu của ảnh và sử dụng ph−ơng pháp phân tích thành phần chính (giống nh− với
các điều kiện thay đổi của hình học).
Các kiến thức về nhân chủng học
Sự hiểu biết về cấu trúc của mặt ng−ời giúp cho con ng−ời xác minh đ−ợc chính xác
ng−ời nào đó, nó không chịu ảnh h−ởng của các điều kiện môi tr−ờng khác nhau. Mặc dù
ảnh đó thu đ−ợc trong điều kiện nh− thế nào đi chăng nữa (trong phạm vi cho phép) thì với
con ng−ời, họ vẫn nhận ra đ−ợc đâu là mặt ng−ời và ảnh đó là của ai trong tập các mẫu đã
thu đ−ợc. Do đó, sự nhận dạng theo ph−ơng pháp nhân chủng học bền vững với các điều
kiện thay đổi của môi tr−ờng. Sự hiểu biết về nhân chủng học cũng giúp cho ta biết đ−ợc
đâu là điểm đặc tr−ng của bề mặt, đâu không phải là điểm đặc tr−ng và từ đó trên hệ thống
thực ta dựa vào các điểm đặc tr−ng đó để có đ−ợc các thuật toán giải quyết sự thay đổi của
các điều kiện môi tr−ờng.
27
Kỹ thuật so sánh dựa trên khuôn mẫu
Với kỹ thuật này, hệ thống nhận dạng ảnh mặt ng−ời khắc phục đ−ợc các thay đổi
của ánh sáng và các thay đổi của hình học dựa trên các mặt nạ. Các mặt nạ này đ−ợc dùng
để phát sinh các mẫu mặt phù hợp với các điều kiện thay đổi của môi tr−ờng.
Từ một cơ sở dữ liệu đã thu thập và một ảnh của đối t−ợng cần nhận dạng. Kỹ thuật
so sánh dựa trên khuôn mẫu cho ta thu đ−ợc K mặt tốt nhất có trong cơ sở dữ liệu bằng
cách so ảnh cần nhận dạng với các mẫu ảnh trong cơ sở dữ liệu ảnh. Kết quả của kỹ thuật
này là thu đ−ợc một nhóm các mặt tốt nhất, mỗi mặt tốt nhất thu đ−ợc từ một lớp mẫu mặt
t−ơng ứng có trong cơ sở dữ liệu. Nhóm mặt tốt nhất này đ−ợc dùng làm dữ liệu cho kỹ
thuật nhận dạng dựa vào điểm đặc tr−ng.
So sánh một ảnh x với tất cả các ảnh có trong cơ sở dữ liệu đ−ợc thực hiện nh− sau:
Tr−ớc hết tiến hành chuẩn hoá ảnh cần nhận dạng và các ảnh có trong cơ sở dữ liệu
với cỡ chuẩn là 75x75 pixel. Tiếp theo tiến hành phân ảnh thành các mẫu con có kích
th−ớc là 15x15 pixel (gọi mẫu con là R = 15x15 pixel). Mục tiêu của việc phân chia này
nhằm giúp cho quá trình so sánh các mẫu con của ảnh đ−ợc tốt hơn. Kỹ thuật dựa trên
khuôn mẫu so sánh từng mẫu con với nhau của hai ảnh bất kỳ do đó nó không chịu ảnh
h−ởng của bất kỳ điều kiện ngoại cảnh nào tác động đến hệ thống nhận dạng nh− là các
thay đổi của ánh sáng, các thay đổi diễn cảm của bề mặt… Trong các mẫu con giá trị xám
của mỗi điểm ảnh đ−ợc định giá là giá trị nhỏ nhất của cửa sổ có kích th−ớc 5x5 trong mẫu
ảnh 75x75 pixel.
+ ảnh gốc (cỡ 75x75 pixel):
75 pixel
1 2 1 5 3 7 2 ………..2 1 6 2 7 2 4
6 3 8 9 3 0 3 ………..6 2 1 3 5 3 6
1 0 2 1 4 0 1 ………..1 2 4 2 0 1 0
…………………………………..
I = ………………………………….. 75 pixel
…………………………………..
1 5 1 0 3 7 2 ………..0 1 2 2 7 3 4
2 3 7 0 3 0 3 ………..4 2 1 3 5 3 5
1 0 6 1 3 1 2 ………..1 3 4 2 0 1 1
28
+ ảnh mẫu con R (cỡ 15x15 pixel):
Kỹ thuật so sánh hai ảnh mặt dựa vào khuôn mẫu theo ph−ơng pháp khoảng cách:
Cho một nhóm mặt p = {f1,f2,…,fN} với N hữu hạn và một mặt cần so sánh f. Vậy
thì sự giống nhau giữa mặt cần so sánh f và nhóm p đ−ợc tính nh− sau:
(9)
Trong đó R là các mẫu con có kích th−ớc 15x15 pixel và các mức xám đ−ợc chuẩn
hoá giữa [0,1]. Kỹ thuật này đ−ợc chứng minh là bền vững và làm tốt hơn sự t−ơng quan
bằng cách thống kê các điểm ảnh khác nhau hay giống nhau có trong ảnh. ở đây, tiến
hành đếm số điểm có các mức xám khác nhau. Hai điểm là khác nhau nếu sự khác nhau
mức xám của chúng v−ợt quá ng−ỡng T. Còn hai điểm là giống nhau nếu sự khác nhau
mức xám của chúng nhỏ hơn ng−ỡng T, nằm trong khoảng [0,1] và giá trị đó càng thấp
càng tốt.
Sau kỹ thuật này ta thu đ−ợc một mẫu fi nào đó có trong p mẫu là tốt nhất. Cũng
làm t−ơng tự việc so sánh trên giữa mặt cần so sánh f với các nhóm mẫu còn lại trong cơ sở
dữ liệu Kết quả cuối cùng ta thu đ−ợc một tập các mẫu tốt nhất và kết quả này tiếp tục
đ−ợc sử dụng cho kỹ thuật so sánh dựa vào điểm đặc tr−ng để xác định đ−ợc mặt tốt nhất.
Kỹ thuật so sánh dựa trên điểm đặc tr−ng
Kỹ thuật này có sử dụng bộ lọc Gabor để lấy đ−ợc các điểm đặc tr−ng của bề mặt.
Những thông tin đặc tr−ng sẽ đ−ợc chọn và ng−ợc lại sẽ bị loại bỏ. Với các đặc tr−ng thu
⎩⎨
⎧=∂
−∂=
=
∑
=
=
1
0
)(
))()((1),(
),(min),(
1
1
x
ifif
R
ffd
ffdpfd
R
i
kkf
if
N
iT
nếu x < T
nếu x ≥ T
15 pixel
1 2 1 ……….. 7 2 4
6 3 8 ……….. 5 3 6
1 0 2 ……….. 0 1 0
……………………
R = …………………… 15 pixel
……………………
1 5 1 ……….. 7 3 4
2 3 7 ……….. 5 3 5
1 0 6 ……….. 0 1 1
29
đ−ợc của bộ lọc này ít bị mẫn cảm với các sự thay đổi nh− là sự bóp méo, sự dịch chuyển
và sự quay…
Lựa chọn các điểm đặc tr−ng ta dựa vào các vùng của mắt và mũi là chính bởi vì các
vùng mắt hầu nh− là bất biến so với các thay đổi diễm cảm của bề mặt và các hành vi cử
chỉ của mặt. Do đó với các vùng của mắt ta có thể chọn đ−ợc nhiều điểm đặc tr−ng hơn so
với các vùng khác. Bên cạnh đó cạnh đáy của mũi cũng bất biến với các thay đổi của mặt.
Từ hai yếu tố này và theo các chuẩn của phép nhân trắc ta xác định đ−ợc các điểm đặc
tr−ng bằng cách quan sát mẫu mặt đó. Các điểm này đ−ợc xác định tại vị trí cố định và
thông qua sự cân đối của mũi. Kết quả là thu đ−ợc 14 điểm biểu diễn của bề mặt và đ−ợc
biểu diễn nh− hình sau:
Hình 2.4 Minh hoạ các điểm quan trọng đ−ợc lựa chọn
Để mô tả vector đặc tr−ng của một điểm sử dụng bộ lọc Gabor bằng cách thu thập
tất cả các hệ số Gabor fi = [fi1, fi2,…, fi18]
T trong đó fij t−ơng ứng với đặc tr−ng Gabor j và
đ−ợc định giá tại điểm thứ i. Việc thu thập các hệ số này phụ thuộc vào nhân của bộ lọc.
Nhân của bộ lọc Gabor đ−ợc định giá bằng phức hệ hai chiều và đ−ợc sử dụng để thu lại
các đặc tr−ng nhiều mức và đa h−ớng. Giá trị nhân đ−ợc tính nh− sau:
⎥⎦
⎤⎢⎣
⎡
⎟⎟⎠
⎞
⎜⎜⎝
⎛−−⎟⎟⎠
⎞
⎜⎜⎝
⎛−=
2
exp)exp(
2
exp)(
2
2
22
2
2 σ
σσψ ikp
pkkpk (10)
trong đó p là toạ độ điểm có liên quan đến tâm, σ là tỷ lệ độ rộng cửa sổ với b−ớc
sóng, và k kiểm soát độ rộng cửa sổ Gaussian, kiểm soát b−ớc sóng và kiểm soát h−ớng
của phần dao động. Số hạng đầu tiên trong ngoặc đơn xác định phần dao động và số hạng
thứ hai bù giá trị DC của nhân, tạo ra bộ lọc không nhạy cảm với các thay đổi của sự chiếu
sáng.
30
Nh− vậy, các nhân Gabor đ−ợc phát sinh với 3 tần số (π/2, π/4, π/8) và 6 h−ớng (0,
π/6, π/3, π/2, 2π/3, 5π/6). Nếu cho σ = π và k = π thì kết quả thu đ−ợc 18 nhân. Kết quả là
ta có tập các hệ số của bộ lọc biểu diễn vector đặc tr−ng của một điểm. Thông qua bộ lọc
Gabor tiến hành trên các ảnh thu đ−ợc từ kỹ thuật dựa trên khuôn mẫu và ảnh cần nhận
dạng. Lúc này mỗi ảnh mặt đ−ợc mã hoá thành một vector đặc tr−ng.
Giả sử sau kỹ thuật dựa trên khuôn mẫu ta thu đ−ợc K mặt tốt nhất p = {f1, f2,…,
fK}, ảnh mặt cần nhận dạng là f và với cách tiếp cận bộ lọc Gabor trên mỗi ảnh mặt ta thu
đ−ợc 14 điểm quan trọng. Vậy thì theo sự định nghĩa của khoảng cách tiếp xúc xác định sự
giống nhau giữa các đặc điểm cơ sở của mặt cần nhận dạng f và nhóm mặt tốt nhất p = {f1,
f2,…, fK} thu đ−ợc từ kỹ thuật so sánh khuôn mẫu nh− sau:
∑
=
=
=
=
14
1
1
))(),(cos(
14
1),(
),(min),(
i
i
N
i
igifgfdg
ffdgpfdw
(11)
Vì vậy, sự giống nhau giữa các vector đặc tr−ng f(i) và g(i) của điểm đặc tr−ng thứ i
đ−ợc xác định bằng cách chuẩn hoá ngay bên trong hàm (cos), giá trị hàm thay đổi giữa [-
1,1] và giá trị này càng cao càng tốt. Thực hiện biến đổi hàm cos
cos = (1-cos)/2
thì ∑
=
−=
14
1 2
))(),(cos(1
14
1),(
i
igifgfdg (12)
do vậy giá trị biến đổi trong [0,1] với sự quy −ớc càng thấp càng tốt.
Cuối cùng sự giống nhau giữa hai mặt f và g đ−ợc tính bằng cách đ−a ra giá trị trung
bình của tất cả các sự giống nhau giữa hai điểm đặc tr−ng t−ơng ứng.
Kết hợp hai kỹ thuật so sánh dựa trên khuôn mẫu và dựa trên điểm đặc tr−ng
Trong phần này trình bày sự giống nhau giữa hai mặt dựa trên khoảng cách tiếp
xúc. Kỹ thuật này đ−ợc kết hợp từ hai kỹ thuật so sánh khác nhau đó là: kỹ thuật so sánh
khuôn mẫu và kỹ thuật so sánh điểm đặc tr−ng. Mỗi kỹ thuật đều có một sự bền vững
riêng. Vì vậy, sự kết hợp hai kỹ thuật lại với nhau sẽ cho hệ thống có sự bền vững với các
điều kiện tác động khác nhau đến ảnh cần nhận dạng.
Với kỹ thuật so sánh khuôn mẫu hệ thống nhận dạng tự động thu đ−ợc K mặt tốt
nhất và kỹ thuật so sánh điểm đặc tr−ng cho ta xác định đ−ợc chính xác một mặt trong K
mặt tốt nhất đó. Do đó, để hệ thống nhận dạng mặt bền vững với các điều kiện thay đổi của
ánh sáng ta kết hợp hai thuật toán trên để làm thoả mãn đ−ợc các điều kiện thay đổi của
ánh sáng. Thuật toán so sánh khuôn mẫu cho kết quả bền vững với các điều kiện thay đổi
31
của môi tr−ờng tác động đến còn kỹ thuật so sánh điểm đặc tr−ng cho phép hệ thống nhận
dạng chính xác ảnh cần nhận dạng. Tr−ớc tiên lựa chọn K mặt tốt nhất sử dụng kỹ thuật so
sánh dựa trên khuôn mẫu, sau đó sử dụng kỹ thuật so sánh dựa trên điểm đặc tr−ng trong
tập các mặt đó để xác định đ−ợc chính xác ng−ời t−ơng ứng.
(13)
Việc so sánh điểm đặc tr−ng dw() chỉ thực hiện đ−ợc trên một tập nhỏ dữ liệu mà dữ
liệu này nhận đ−ợc từ kỹ thuật so sánh khuôn mẫu mặt dt() thu đ−ợc và Th1, Th2 là các
ng−ỡng cho tr−ớc t−ơng ứng hai thuật toán trên. Toàn bộ phạm vi giá trị của hàm S() biến
đổi trong [0,1] và nếu giá trị của S v−ợt quá một giá trị ng−ỡng cho tr−ớc thì hệ thống
không nhận dạng đ−ợc ng−ời đó.
Nói tóm lại, sự kết hợp hai kỹ thuật nhận dạng dựa trên khuôn mẫu và dựa trên
điểm đặc tr−ng cho ta đ−ợc một hệ thống nhận dạng bền vững với các điều kiện thay đổi
của ánh sáng. Xác định đ−ợc ảnh cần tìm có trong cơ sở dữ liệu hay không và nếu có thì
ảnh đó là ảnh của ai.
⎪⎩
⎪⎨
⎧
+
=
2/)),(),((
1
1
),(
gfdwgfdt
gfS
nếu dt(f,g) > Th1
nếu dw(f,g) > Th2
ng−ợc lại
32
Ch−ơng 3. thuật toán nhận dạng trong điều kiện ánh sáng
thay đổi
Hệ thống nhận dạng mặt tự động phụ thuộc vào các yếu tố tác động của ngoại cảnh
do đó đòi hỏi phải làm phù hợp đ−ợc các yếu tố trên. Điều kiện môi tr−ờng, các biểu hiện
của bề mặt là các yếu tố chính ảnh h−ởng đến hệ thống nhận dạng mặt ng−ời tự động. Vấn
đề đặt ra là ta phải xây dựng một hệ thống nhận dạng mặt bền vững với các thay đổi của
các yếu tố trên.
Ch−ơng này khóa luận trình bày thuật toán của tác giả Mariani [3] là bền vững với
các điều kiện ánh sáng khác nhau. Thuật toán đ−ợc sử dụng dựa trên hai cách tiếp cận để
giải quyết đó là: cách tiếp cận dựa trên khuôn mẫu và cách tiếp cận dựa trên điểm đặc
tr−ng thông qua hàm khoảng cách tiếp xúc. Dựa theo các đặc tả trong [3], khóa luận minh
hoạ cụ thể thuật toán bằng những thủ tục trên ngôn ngữ lập trình PASCAL.
Mô tả các thuật toán nh− sau:
Giả sử cho một ảnh x là ảnh cần nhận dạng và đ−ợc mã hoá thành vector d-chiều trong
không gian Sd. Một cơ sở dữ liệu ảnh D đ−ợc tổ chức và quản lý theo chỉ số. Kết quả thu
đ−ợc là các chỉ số của lớp ảnh (cho biết đ−ợc ng−ời nhận dạng) và các chỉ số của các mẫu
trong lớp (biết đ−ợc điều kiện môi tr−ờng t−ơng ứng tác động đến ảnh nhận dạng).
3.1 Thuật toán so sánh khuôn mẫu dựa theo khoảng cách tiếp
xúc
Thuật toán này đ−ợc thực hiện nh− hình d−ới đây:
Hình 3.1 Mô phỏng cách so sánh hai mẫu mặt với nhau dựa trên các mẫu con
Kỹ thuật nhận dạng dựa trên khuôn mẫu sử dụng quy tắc so sánh từng mẫu ảnh nhỏ
với nhau. Mỗi mẫu t−ơng ứng với một vùng của ảnh và việc so sánh này là so sánh các
i
i
So sánh
So
sánh
ảnh cần nhận dạng ảnh mẫu
33
mẫu t−ơng ứng của nhau có trong hai ảnh cần nhận dạng. Nh− biểu diễn của hình minh hoạ
trên cho thấy mẫu thứ i của ảnh cần nhận dạng phải t−ơng ứng với mẫu thứ i trong ảnh
mẫu.
Mỗi ảnh cần nhận dạng và ảnh mẫu đ−ợc chuẩn hoá có kích th−ớc cố định là 75x75
pixel, các mẫu con có kích th−ớc 15x15 pixel. Vì vậy kỹ thuật nhận dạng này rất hiệu quả
trong việc so sánh các ảnh mà không chịu tác động của môi tr−ờng và do đó thuật toán này
bền vững với các điều kiện tác động của ánh sáng tới các ảnh nhận dạng và ảnh mẫu. Kỹ
thuật so sánh này sử dụng cách so sánh các giá trị xám của hai mẫu con với nhau bằng
cách so sánh từng điểm một của mẫu. Nếu hai điểm là khác nhau thì sự khác nhau mức
xám giữa chúng v−ợt quá một ng−ỡng cho tr−ớc và ng−ợc lai hai điểm ảnh là giống nhau
nếu sự khác nhau giữa các giá trị mức xám của điểm ảnh không v−ợt quá ng−ỡng cho
tr−ớc, giá trị này thay đổi trong khoảng [0,1] và giá trị này càng thấp càng tốt.
Theo sự mô tả trên thì một ảnh đ−ợc phân thành một vector mà các thành phần của
vector là giá trị mức xám của mẫu con. Giả sử cho một ảnh cần nhận dạng x đ−ợc biểu
diễn x={x1, x2, …,xN} trong đó xi (i=1..N) là các mẫu con của ảnh cần nhận dạng, tập hợp
các mẫu con tạo thành một ảnh và một nhóm ảnh mặt p= {f1, f2,…,fK} trong đó fi là mẫu
mặt thứ i, các mẫu mặt này cũng phải mã hoá thành các vector và có số phần tử giống nh−
số phần tử của ảnh cần nhận dạng.
Thủ tục so sánh hai mẫu mặt:
Procedure df(x: mặt, fk: mặt);
Begin
D:=0;
For i=1 to số_mẫu_con do
If (|x(i) – fk(i)|) < T then
∂(|x(i)-fk(i)|) := 0
else
∂(|x(i)-fk(i)|) := 1;
D:= D + ∂(|x(i)-fk(i)|);
Df:= D/số_mẫu_con;
End
34
Kết quả của thuật toán này là thu đ−ợc khoảng cách giữa hai mẫu mặt và kết quả
này đ−ợc sử dụng cho việc xác định một mẫu mặt x cần nhận dạng với nhóm mặt p (nhóm
p có N phần tử).
Tiếp theo là thuật toán so sánh một ảnh cần nhận dạng với một nhóm ảnh mẫu đã
thu đ−ợc. Với cách giải quyết này, ta sử dụng kết quả của thuật toán so sánh hai ảnh mặt
với nhau, khoảng cách thu đ−ợc của từng cặp so sánh (so sánh ảnh cần nhận dạng với từng
ảnh trong nhóm) và so sánh các kết quả thu đ−ợc nếu khoảng cách nào nhỏ nhất thì đó là
cặp ảnh cần tìm. Thuật toán có thể đ−ợc mô tả trong hình sau:
Hình 3.2 Mô phỏng cách so sánh một ảnh mặt cần nhận dạng với nhóm các mẫu mặt
Hình này biểu diễn việc so sánh một mặt cần nhận dạng với một tập các ảnh mặt
mẫu dựa vào khoảng cách nhỏ nhất giữa các cặp so sánh và cuối cùng thu đ−ợc một ảnh tốt
nhất trong lớp ảnh mặt mẫu đó. Thủ tục này đ−ợc phát triển đệ quy cho tất cả các lớp ảnh
mặt mẫu trong cơ sở dữ liệu và kết quả của việc đệ quy này là một tập các mẫu ảnh mặt tốt
nhất ứng với mỗi một lớp.
Thủ tục so sánh một ảnh mặt cần nhận dạng với một lớp các ảnh mẫu:
Giả sử số ảnh mẫu có trong một lớp là N, x là ảnh cần nhận dạng, p là một lớp có N ảnh
mẫu và đ−ợc biểu diễn p={f1,f2,…,fN}, giá trị min đ−ợc dùng để xác định các cặp so sánh
nào có khoảng cách nhỏ nhất và dựa vào giá trị min này cho biết đ−ợc chỉ số của ảnh mẫu
trong lớp đang quan sát. Thủ tục đ−ợc thực hiện nh− d−ới đây:
Procedure dt(x: mặt, p: lớp mặt);
Begin
min:=df(x,f1);
x
fi1
fi2
fi3
…
…
fi(N-1)
fiN
fij
Lớp ảnh mẫu
ảnh cần
nhận dạng
ảnh thu
đ−ợc sau
khi so sánh
So sánh
So sánh
Kết quả
35
For i=2 to N do
If (min >= df(x,fi)) then
min:= df(x,fi)
End
Kết quả thu đ−ợc của thủ tục trên là một mẫu mặt tốt nhất ứng với giá trị min nhỏ
nhất. Với cách thực hiện t−ơng tự thủ tục trên đ−ợc áp dụng cho các lớp ảnh mặt mẫu khác
và thu đ−ợc K mặt tốt nhất t−ơng ứng với K lớp ảnh mặt mẫu có trong cơ sở dữ liệu. K mặt
tốt nhất này đ−ợc sử dụng trong thuật toán so sánh một ảnh mặt cần nhận dạng với các mặt
tốt nhất thu đ−ợc từ thuật toán so sánh dựa trên khuôn mẫu.
3.2 Thuật toán so sánh điểm đặc tr−ng dựa theo khoảng cách
tiếp xúc
Kỹ thuật so sánh dựa trên điểm đặc tr−ng nhằm đánh giá một mặt cần nhận dạng
với K mặt tốt nhất thì mặt cần nhận dạng là mẫu mặt nào trong K mặt tốt nhất đó.
Với kỹ thuật so sánh này ảnh cần nhận dạng và K mặt tốt nhất phải đ−ợc mã hoá
thành các vector mà các thành phần của nó là các điểm đặc tr−ng của ảnh. Giả sử ảnh cần
nhận dạng là x và đ−ợc biểu diễn x={x1,x2,…,xN} trong đó xi (i=1..N) là điểm đặc tr−ng
thứ i biểu diễn trong mặt, gọi p là tập các ảnh tốt nhất (K ảnh mặt tốt nhất) và
p={f1,f2,…,fK} trong đó mỗi ảnh fi phải đ−ợc mã hoá thành các vector điểm đặc tr−ng
(fi={fi1,fi2,…,fiN}). Kỹ thuật so sánh điểm đặc tr−ng của một ảnh cần nhận dạng với tập K
ảnh mặt tốt nhất sử dụng các vector điểm đặc tr−ng, trong đó mỗi phần tử thứ i là một đặc
tr−ng của ảnh cần nhận dạng và ảnh mẫu. Tr−ớc hết ta thực hiện thuật toán so sánh hai ảnh
mặt bất kỳ dựa trên kỹ thuật khoảng cách tiếp xúc.
Thủ tục so sánh hai mặt dựa trên kỹ thuật khoảng cách tiếp xúc
Thủ tục này sử dụng các điểm đặc tr−ng đ−ợc trích ra từ bộ lọc Gabor, theo bộ lọc
này bất kỳ ảnh mặt ng−ời nào đều có 14 điểm đặc tr−ng và
x(i), f(i) là các vector biểu diễn các đặc tr−ng của mặt. Thuật
toán này hoạt động nh− sau: so sánh từng điểm đặc tr−ng của
hai ảnh với nhau và sử dụng hàm cos để tính độ lệch (sự khác
nhau) giữa hai điểm đặc tr−ng. Góc lệch giữa hai điểm đặc
tr−ng đ−ợc mô tả nh− hình bên.
Hình 3.3 Mô tả góc lệch giữa hai vector điểm đặc tr−ng
f(i)
x(i)
α
36
Nhìn vào hình biểu diễn hai vector này ta thấy nếu hai điểm là giống nhau thì góc α tạo
bởi hai vector x(i) và f(i) phải có góc nhỏ nhất. Tr−ờng hợp tốt nhất khi góc α = 00. Thủ tục
mô tả thuật toán nh− sau:
Procedure dg(x: mặt, f: mặt);
Begin
D:= 0;
For i=1 to 14 do
D:= D + (1 – cos(x(i),f(i))/2;
Dg:= D/14;
End
Kết quả thu đ−ợc là khoảng cách giữa hai mặt bất kỳ dựa trên các điểm đặc tr−ng
của ảnh.
Tiếp theo là thủ tục xác định một mặt cần nhận dạng với các mẫu mặt tốt nhất thu
đ−ợc từ kỹ thuật so sánh khuôn mẫu (K mẫu mặt tốt nhất) dựa trên khoảng cách tiếp xúc.
Trong đó x là một vector biểu diễn điểm đặc tr−ng của mặt cần nhận dạng và p là nhóm
các mẫu mặt tốt nhất (các mẫu trong p đều đ−ợc mã hoá theo vector biểu diễn các điểm
đặc tr−ng của mẫu đó). Thuật toán này đ−ợc mô tả nh− hình d−ới đây:
Hình 3.4 Mô phỏng cách so sánh một ảnh mặt với tập các ảnh mặt tốt nhất dựa trên điểm
đặc tr−ng.
Nhóm mặt tốt nhất (K mặt)
f1(f1,f2,…,fN) d1
f2(f1,f2,…,fN) d2
x(x1,x2,…,xN) …………… min(d1,d2,…,dK)
……………
fK-1(f1,f2,…,fN-1) dK-1
fK(f1,f2,…,fN) dK
Kết quả
thu đ−ợc
So sánh
Chọn kết
quả tốt nhất
37
Theo cách biểu diễn của hình trên ta thấy: một ảnh cần nhận dạng x đ−ợc so sánh
lần l−ợt với từng mẫu ảnh có trong p kết quả của phép so sánh thu đ−ợc lần l−ợt là d1,
d2,…, dK t−ơng ứng với K mẫu tốt nhất trong p. Để thu đ−ợc kết quả tốt nhất ta lấy giá trị
nhỏ nhất trong tập kết quả đo đ−ợc {d1,d2,…,dK} và giá trị nhỏ nhất di nào đó cho phép ta
xác đinh đ−ợc mẫu mặt tốt nhất thứ i trong p.
Thủ tục so sánh một mặt cần nhận dạng với tập các mặt tốt nhất thu đ−ợc từ kỹ thuật so
sánh dựa trên khuôn mẫu
Procedure dw(x: mặt, p: nhóm mặt mẫu);
Begin
{tập các mẫu mặt: p={f1,f2,..,fK} thu đ−ợc từ thuật
toán dt(x,g)}
min:= dg(x,f1);
For i=2 to K do
If min >= dg(x,fi) then
min:= dg(x,fi);
Dw:= min;
End
Kết quả đạt đ−ợc là vị trí của mẫu thứ i trong nhóm mẫu tốt nhất.
3.3 Kết hợp hai thuật toán so sánh trên
Phần này trình bày một thuật toán kết hợp cả hai kỹ thuật so sánh trên để thực hiện
nhiệm vụ nhận dạng ảnh mặt ng−ời và kết hợp hai kỹ thuật so sánh trong một điều kiện tốt
nhất. Kỹ thuật so sánh dựa vào khuôn mẫu lấy đ−ợc các mặt tốt nhất và bền vững với các
điều kiện thay đổi của ánh sáng bằng cách so sánh các mẫu con với nhau (kích th−ớc của
mẫu con là 15x15 pixel). Kỹ thuật so sánh dựa trên điểm đặc tr−ng so sánh một ảnh mặt
cần nhận dạng với tập các mặt tốt nhất thu đ−ợc từ kỹ thuật so sánh dựa trên khuôn mẫu và
xác định chính xác ảnh cần nhận dạng đó là của ng−ời nào.
Với việc kết hợp hai kỹ thuật so sánh trên dẫn tới thủ tục thực hiện thuật toán nh− sau:
Procedure S(x: mặt, p: nhóm mặt);
Begin
If dt(x,p) > Th1 then
S:=1;
38
If dw(x,p) > Th2 then
S:=1;
If (dt(x,p) = Th2) then
S:= (dt(x,p) + dw(x,p))/2;
End
Mô tả hoạt động của thủ tục trên nh− sau:
Tiến hành thực hiện hàm so sánh khuôn mẫu dt(x,p) để thu đ−ợc K mặt tốt nhất.
Nếu giá trị thu đ−ợc từ việc so sánh hai mẫu với nhau v−ợt quá ng−ỡng cho tr−ớc Th1 nào
đó thì cặp so sánh đó bị loại bỏ. Cuối cùng thu đ−ợc các mẫu mặt tốt nhất trong tập các
mẫu đ−ợc so sánh. Kết quả của hàm so sánh dt(x,p) đ−ợc truyền tới hàm so sánh các điểm
đặc tr−ng dw(x,p). Hàm này thực hiện cũng t−ơng tự nh− hàm so sánh khuôn mẫu nh−ng
dữ liệu để so sánh không phải là toàn bộ các mẫu có trong cơ sở dữ liệu ảnh mà dữ liệu là
các kết quả thu đ−ợc từ hàm so sánh khuôn mẫu dt(x,p). Nếu giá trị của hàm so sánh điểm
đặc tr−ng v−ợt quá một ng−ỡng cho tr−ớc Th2 thì cặp ảnh so sánh đó bị loại bỏ.
Nếu một trong hai giá trị của hàm so sánh khuôn mẫu và hàm so sánh các điểm đặc
tr−ng v−ợt quá một ng−ỡng cho tr−ớc Th1 hoặc Th2 thì giá trị hàm kết hợp S:=1 và với giá
trị này thì ảnh mặt của ng−ời đó không nhận dạng đ−ợc. Tr−ờng hợp ng−ợc lại hai giá trị
của hai hàm so sánh đều chấp nhận đ−ợc khi đó S có giá trị là giá trị trung bình của hai giá
trị thu đ−ợc từ hai thuật toán so sánh trên và giá trị S biến thiên trong khoảng [0,1]. Nh−ng
trong tập các kết quả của S, không phải hoàn toàn là chính xác, cũng có khi đúng nh−ng
cũng có khi sai do đó vần cần phải thực hiện việc kiểm tra tính chính xác giá trị của S bằng
một ng−ỡng nào đó. Nếu giá S v−ợt quá ng−ỡng kiểm soát đó thì việc so sánh không thành
công và ng−ời đó không nhận dạng đ−ợc.
39
Kết luận
Trong khóa luận này, tôi đã trình bày một hệ thống nhận dạng ảnh mặt ng−ời tự
động thoả mãn các điều kiện thay đổi của ánh sáng tác động đến ảnh nhận dạng. Trong
quá trình thực hiện khóa luận, tôi đã thu nhận đ−ợc kiến thức tổng quan về hệ thống đoán
nhận ảnh mặt ng−ời. Hơn nữa, đã nắm bắt đ−ợc những nội dung cơ bản của việc khắc phục
ảnh h−ởng của các điều kiện ánh sáng tác động đến hệ thống nhận dạng làm cho hệ thống
khó có thể nhận dạng ảnh một cách chính xác đã đ−ợc trình bày trong công trình của tác
giả Mariani [3], đó là:
- Kỹ thuật “Sử dụng khoảng cách tiếp xúc”
- Sử dụng hai kỹ thuật so sánh: kỹ thuật so sánh khuôn mẫu và kỹ thuật so sánh
điểm đặc tr−ng.
Kỹ thuật so sánh khuôn mẫu cho hệ thống đ−ợc các mặt tốt nhất có trong cơ sở dữ
liệu dựa vào cách đánh giá của hàm khoảng cách, còn kỹ thuật so sánh điểm đặc tr−ng cho
biết đ−ợc chính xác ảnh đó là ảnh của ng−ời nào bằng cách so sánh ảnh cần nhận dạng với
tập các ảnh tốt nhất thu đ−ợc từ kỹ thuật so sánh điểm đặc tr−ng. Trong những hệ thống
thực tế, ý t−ởng kết hợp hai thuật toán trên đ−ợc khóa luận đề cập.
Khóa luận cũng đã mô tả chi tiết các thuật toán đối sánh khoảng cách bằng một số
thủ tục PASCAL song ch−a có điều kiện cài đặt đ−ợc các thuật toán này.
Do thời gian và trình độ còn hạn chế và đây là một nội dung khó, khóa luận ch−a
hiện thực các thuật toán trình bày ở ch−ơng ba. Đấy là một nội dung trong ph−ơng h−ớng
nghiên cứu tiếp theo của khóa luận.
40
Tài liệu tham khảo
1. Keysers D. Experiments with an Extended Tangent Distance, 15th International
Conference on Pattern Recognition, Vol. 2,pp. 38-42, 2000.
2. Manjunath B.S. et al. A Feature-Based Approach to Face Recognition. Proc. IEEE
Computer Soc. Conf. Computer Vision and Pattern Recognition, pp 373-378, 1992.
3. Mariani R. A Face Location Algorithm Robust to Complex Lighting Conditions. To
appear in 2nd Audio and Video-Based Biometric Person Authentication, Sweden, 2001.
4. Rowley H. et al. Neural Network-Based Face Detection. IEEE Trans. Pattern Analysis
and Machine Intelligence, 1998.
5. Simard P. Transformation Invariance in Pattern Recognition – Tangent Distance and
Tangent Propagation. In G. Orr and K.R. Muller editors, Neural Networks: tricks of
the trade, vol 1524 of Lecture Notes in Computer Science, Springer, Heidelberg, pp
239-274, 1998.
6. Sirohey S.A, Human Face Segmentation and Identification. Technical Report, CS-TR-
3176, Univ, of Maryland, 1993.
7. Sun Q.B. et al. Face Detection Based on Color and Local Symmertry Information.
Proc. 3rd International Conterence on Automatic Face and Gesture Recognition, pp 130-
135. Apr 14-16, 1998. Nara, Japan.
8. Takacs B và Wechsler H. Detection of Face and Facial Landmarks Using Iconic Filter
Banks. Pattern Recognition, 30(1): 1623-1636, 1997.
Các file đính kèm theo tài liệu này:
- K43_Vu_Dinh_Hoang_Thesis.pdf