Thứ Tư, 26 tháng 2, 2014

Hệ thống phát hiện khuôn mặt dựa trên mạng neural và phương pháp vân vùng màu da

5
Kỹ thuật phân vùng da nguời trong ảnh màu được áp dụng trong hệ thống
nhận biết mặt người với mục đích cuối cùng là giảm khơng gian tìm kiếm mặt
người trong ảnh, giúp cho hiệu năng hoạt động của hệ thống được nâng cao hơn.
Còn ưu điểm nổi bật của mạng neural nhân tạo nói riêng và phướng tiếp cận dựa
trên máy học nói chung trong việc phát hiện mặt nguời đó là có thể miêu tả và
phát hiện khn mặt trong nhiều tình huống khác nhau. Những tình huống gặp
phải khi phát hiện khn mặt bao gồm:
 Tư thế của khn măt (Pose): Khn mặt là nghìn thẳng (frontal),
nghiêng một phần (partial profile) hay nghiêng hồn tồn (full profile).
Khn mặt hướng thẳng đứng (upright) hay là khn mặt xoay một góc
nào đó (rotate)
 Nội dung khn mặt: Khn mặt chứa đầy đủ các đặc trưng như mắt,
mũi, miệng, tai hay thiếu một vài đặc trưng nào đó.
 Trạng thái của khn mặt: Đó chính là trạng thái tình cảm của khn
mặt như cuời, khóc, tức giận…
Đây là những tình huống mà các hướng tiệp cận khác phải mất nhiều cơng
sức và phức tạp để có thể miêu tả được. Nhưng với mạng neural, thơng qua tập
mẫu và q trình huấn luyện mạng hiệu quả, kết quả mang lại là có thể rất khả
quan.

Ứng dụng
Cơng nghệ nhận biết mặt người có sự ứng dụng rộng rãi trong thực tế.
Trong nhận dạng sinh trắc học, trong hội thảo truyền hình, trong chỉ số hố ảnh
và cơ sở dữ liệu video, trong tương tác người máy. Nhận biết mặt người là giai
đoạn đầu trong hệ thống nhận dạng mặt người.
Hai bài tốn nhận biết và nhận dạng đối tượng có liên quan mật thiết. Hệ
thống nhận dạng đối tượng có thể xây dựng mà khơng có tập bộ nhận biết đối
tượng, mỗi bộ nhận biết phát hiện một đối tượng quan tâm. Tương tự, bộ nhận
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
6
biết đối tượng có thể được xây dựng mà khơng có hệ thống nhận dạng đối tượng;
bộ nhận dạng đối tượng này cần phân biệt đối tượng mong muốn với mọi đối
tượng khác có thể xuất hiện hay là lớp đối tượng chưa biết. Do đó hai bài tốn là
như nhau, dù trong thực hành hầu hết các hệ thống nhận dạng đối tượng ít khi
giải quyết nền tuỳ ý, và các hệ thống nhận biết đối tượng ít khi được huấn luyện
trên đủ loại đối tượng để xây dựng hệ thống nhận dạng. Điểm chú trọng khác
nhau của các bài tốn này dẫn đến các trình bày và thuật tốn khác nhau.
Thơng thường, các hệ thống nhận dạng khn mặt làm việc bằng cách
trước hết áp dụng bộ nhận biết khn mặt để định vị khn mặt, sau đó áp dụng
thuật tốn nhận dạng để nhận diện khn mặt.

1.2 Các thách thức trong vấn đề phát hiện mặt người
Việc nhận biết đối tượng là bài tốn xác định cửa sổ con của ảnh có thuộc
về tập các ảnh của đối tượng quan tâm hay khơng. Do đó, đường biên quyết định
của tập ảnh đối tượng phức tạp sẽ làm tăng độ khó của bài tốn và có thể tăng số
lỗi nhận biết. Giả sử ta muốn phát hiện khn mặt nghiêng trong mặt phẳng ảnh,
ngồi các khn mặt thẳng. Việc thêm các khn mặt nghiêng vào tập các ảnh ta
muốn nhận biết làm tăng độ biến thiên của tập, và có thể làm tăng độ phức tạp
của đường biên quyết định của tập ảnh. Độ phức tạp này làm bài tốn nhận biết
khó hơn. Việc thêm ảnh mới vào tập ảnh đối tượng có thể làm đường biên quyết
định đơn giản hơn và dễ học hơn. Có thể tưởng tượng điều này là đường biên
quyết định được làm trơn bằng việc thêm các ảnh vào tập. Có nhiều nguồn biến
đổi trong bài tốn nhận biết đối tượng, và cụ thể trong bài tốn nhận biết khn
mặt. Có các nguồn biến đổi sau [6]:
 Biến đổi trong mặt phẳng ảnh: loại biến đổi ảnh khn mặt đơn giản
nhất có thể được biểu diễn độc lập với khn mặt, bằng cách quay, dịch
chuyển, biến đổi tỷ lệ và lấy đối xứng ảnh.
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
7
 Biến đổi độ sáng và ngữ cảnh: biến đổi do đối tượng và mơi trường gây
ra, cụ thể các thuộc tính bề mặt của đối tượng và các nguồn sáng. Các thay
đổi về nguồn sáng nói riêng có thể biến đổi hồn tồn vẻ bề ngồi của
khn mặt.
 Biến đổi nền: Nhiều nhà nghiên cứu cho răng với kỹ thuật nhận dạng mẫu
hiện nay, tiếp cận dựa trên khung nhìn để nhận biết đối tượng chỉ thích
hợp cho các đối tượng có “đường biên ảnh có thể dự đốn được”. Khi đối
tượng có hình dáng dự đốn được, ta có thể trích ra window chỉ chứa các
pixel bên trong đối tượng, và bỏ qua nền.
 Biến đổi hình dáng: với khn mặt, loại biến đổi này bao gồm biểu lộ
tình cảm khn mặt, miệng và mắt mở hay đóng, và hình dáng khn mặt
của từng người.



1.3 Các vấn đề liên quan đến phát hiện mặt người
Bên cạnh vấn đề phát hiện mặt người, có nhiều vấn đề khác có quan hệ
mật thiết với phát hiện mặt người mà nhiều khi gây ra nhầm lẫn nếu khơng được
tìm hiểu một cách kỹ càng.
Những vấn đề đó bao gồm [7]
 Định vị khn mặt hay xác định vị trí khn mặt: Đây là vấn đề rất
gần với vấn đề phát hiện mặt người. Nếu như phát hiện mặt người trong
ảnh là phải trả lời các câu hỏi có tồn tại khn mặt trong ảnh hay khơng ?
Nếu tồn tại thì tồn tại bao nhiêu khn mặt? Vị trí của khn mặt ở đâu ?
Thì vấn đề định vị mặt người chỉ trả lời cho câu hỏi vị trí mặt người ở đâu
trong một ảnh đã biết trước là có một mặt người . Như vậy có thể thấy,
định vị khn mặt là một phần cơng việc của phát hiện mặt người.
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
8
 Phát hiện các đặc trưng của khn mặt: Đây là vấn đề cũng rất gần với
vấn đề định vị khn mặt. Nó cũng giả thiết rằng chỉ có một khn mặt
trong ảnh. Và việc phát hiện đặc trưng khn mặt là tìm ra vị trí của các
đặc trưng như đơi mắt, mũi, miệng, mơi, tai…
 Bám sát khn mặt: Mục đích của vấn đề này là ước lượng liên tục sự
thay đổi về vị trí và huớng của khn mặt trong một chuỗi ảnh thời gian
thực.
 Nhận biết trạng thái khn mặt: Mục tiêu của vấn đề này là nhận biết
trạng thái của khn mặt con người (hạnh phúc, tức giận, đau khổ…). Đây
là vấn đề rất khó và thú vị vì trạng thái khn mặt của từng người có thể là
rất khác nhau trong cùng một trạng thái tâm lý.
 Nhận dạng khn mặt: Trong vấn đề này, chúng ta phải đối sánh khn
mặt cần nhận dạng với các khn mặt có sẵn trong thư viện và tìm ra
nhưng thơng tin cần thiết về khn mặt cần nhận dạng nếu nó có đăc trưng
tương đồng với khn mặt nào đó trong thư viện.
 Thẩm tra và xác minh khn mặt: Đây là vấn đề nằm trong vấn đề nhận
dạng khn mặt. Thơng thường sau khi nhận dạng khn mặt, người ta
phải tiến hành một giai đoạn nữa gọi là thẩm tra và xác minh tính đúng
đắn của khn mặt được nhận dạng. Nó cho phép tăng sự đúng đắn của
vấn đề nhận dạng khn mặt.
Trong những vấn đề nêu trên, có thể thấy nhận biết khn mặt và nhận
dạng khn mặt là hai vấn đề cơ bản và có thể chứa đựng các vấn đề còn lại. Và
thơng thường, nhận biết khn mặt sẽ là giai đoạn đầu của hệ thống nhận dạng
khn mặt. Sự khác nhau cơ bản giữa phát hiện khn mặt với nhận dạng khn
mặt đó là: Nếu như nhận dạng khn mặt là phân biệt những khn mặt khác
nhau trong tập danh mục các khn mặt, còn nhận biết khn mặt đó là phân lớp
đuợc đâu là danh mục các khn mặt và đâu là danh mục các ảnh khơng phải
khn mặt.
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
9

1.4 Tổnq quan các hướng tiếp cận phát hiện khn mặt
Trong suốt q trình hơn ba thập kỷ, đã có rất nhiều các hướng tiếp cận và
xử lý khác nhau được đề xuất để giải quyết bài tốn phát hiện mặt người. Các
hướng tiếp cận và xử lý thơng thường nhằm giải quyết những u cầu cụ thể và
khác nhau ,trong từng ứng dụng cụ thể. Chính vì vậy có nhiều cách để có thể
phân loại các phương pháp, các kỹ thuật, các hướng tiếp cận phát hiện khn
mặt. Trong bài luận văn này, sẽ phân loại các hướng tiếp cận theo phương pháp
được sử dụng nhiều nhất. Đó là chia các hướng tiếp cận theo hai hướng chính:
Hướng tiếp cận dựa trên đặc trưng của ảnh (Feature-based) và hướng tiếp cận
dựa trên thơng tin xuất hiện trên ảnh (Image-based).
Các phương pháp, kỹ thuật phân chia theo cách này có thể nhìn thấy trong
sơ đồ dưới đây [7]:















THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
10
























Hình 1: Sơ đồ các hướng tiếp cận và phương pháp phát hiện mặt
người
1.4.1 Hướng tiếp cận dựa trên đặc trưng của ảnh (Feature-based
approaches)
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
11
Phương pháp tiệp cận dựa trên đặc trưng của khn mặt được chia thành
ba vấn đề. Giả sử cần phải phát hiện một khn mặt trong một nền ảnh lộn xộn,
phân tích mức thấp (low-level analysis) thực hiện phân đoạn các đặc trưng của
ảnh dựa trên những thuộc tính của điểm ảnh như độ xám hay màu sắc. Sự phân
đoạn lúc này còn mập mờ và chưa rõ ràng. Vấn đề thứ hai là phân tích đặc trưng,
các đặc trưng của ảnh được tổ chức thành các đặc trưng khn mặt có tính tổng
qt hơn dựa trên đặc tính hình học của khn mặt. Sau giai đoạn này, tính mập
mờ của các đặc trưng của ảnh đã được giảm bớt, đồng thời, vị trí khn mặt
cùng với các đặc trưng khn mặt đã được xác định. Tiếp theo sẽ là việc sử dụng
mơ hình hình dạng (active shape models). Những mơ hình này bao gồm từ mơ
hình dạng rắn (snakes - được đề xuất vào những năm 80) cho tới mơ hình phân
tán điểm (PDM – Point Distributed Model) được đề xuất vào những năm gần đây
để trích chọn đặc trưng có sự biến động phức tạp như mắt, mơi,…

1.4.1.1 Phân tích mức thấp (Low-level analysis)
Người ta gọi là phân tích mức thấp vì việc phân tích ở đây là phân tích dựa
trên các đặc trưng rất cơ bản và mang tính trực quan, những đặc trưng đó bao
gồm biên ảnh, thơng tin đa mức xám, màu sắc, chuyển động, tính đối xứng của
khn mặt.

1.4.1.1.1 Biên ảnh (Edges)
Đây là một đặc trưng cơ bản nhất trong các ứng dụng về xử lý ảnh, sử
dụng biên để phát hiện khn mặt được thực hiện đầu tiên bởi Sakai. Dựa trên
việc phân tích các đường ảnh của khn mặt, với mục đích là định vị những đặc
điểm trên khn mặt. Một mơ hình được đề xuất để tìm ra những đường nét của
mặt người. Cơng việc tìm ra hình dáng của mặt người được triển khai bao gồm
một đường cong bám sát vào khn mặt với một độ cong xác định và ràng buộc
để tránh sự ảnh hưởng của các nhiễu biên. Những đặc tính của đương trong hình
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
12
dáng của đầu người sau đó được đưa ra để phân tích đặc trưng sử dụng độ nét và
vị trí của khn mặt. Kỹ thuật dò tìm dựa vào đường biên này còn được áp dụng
để phát hiện cặp kính trên khn mặt.
Trong hướng tiếp cận phát hiện mặt người dựa vào đường biện, những
đường biên cần được gán nhãn và được phù hợp với mơ hình khn mặt được
sắp xếp để có thể giúp chúng ta xác minh sự đúng đắn của việc phát hiện đó.
Người ta có thể thiết lập sự gán nhãn biên đó bằng các sử dụng mặt trái, đường
tóc hoặc mặt phải của khn mặt. Việc gán nhãn này làm cho khả năng phát hiện
chính xác khn mặt trong một bức ảnh với khơng gian phức tạp và có nhiều
khn mặt.
Một trong những phương pháp được biết đến đó là phương pháp gán nhãn
của Govindaraju, phương pháp này sử dụng hệ số vàng của khn mặt lý tưởng ,
đó là hệ số giữa độ dài và độ rỗng của khn mặt:


(I.1)

Sử dụng phương pháp này, người ta đã kiểm thử 60 ảnh có nền phức tạp
bao gồm 90 khn mặt thì thấy khả năng hệ thống có thể phát hiện chính xác là
76% với mức độ trung bình là sai 2 mặt lỗi / ảnh.
1.4.1.1.2 Thơng tin đa mức xám (Grayscale Information)
Bên cạnh đường biên, thì thơng tin về mức xám trong khn mặt cũng có
thể được xem như là một đặc trưng. Những đặc trưng khn mặt như là lơng
mày, động tử hay, mơi thương xuất hiện với mức xám lớn hơn những thành phần
phụ cận bao quanh chúng. Tính chất này có thể được khai thác để phân biệt các
thành phần khác nhau của khn mặt. Những thuật tốn trích chọn đặc trưng
khn mặt gần đây thường dựa vào mức xám nhỏ nhất trong một vùng khn
mặt. Trong những thuật tốn này, bức ảnh đầu vào đầu tiên được cải thiển bằng
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
13
viêc làm tăng độ tương phản và biến hình mức xám (gray-scale morphological)
để có thể tăng độ tối của những vùng nói trên, từ đó việc nhân biết sẽ dễ dàng
hơn. Những vùng tối này được trích chọn bằng phép lấy ngưỡng dưới. Bên cạnh
đó, người ta đã tiến hành xây dựng hệ thống tự động tìm kiếm các vùng tối thuộc
mặt thơng qua sự phân tích về màu sắc. Hệ thống sử dụng một mẫu mắt gán
trọng số để xác định cac vị trí có thẻ có của cặp mắt.

1.4.1.1.3 Màu (color)
Trong khi thơng tin về mức xám được xem là một đặc trưng cơ bản của
ảnh, màu sắc có ý nghĩa nhiều trong việc nhận biết sự xuất hiện của đối tượng.
Một trong những khơng gian màu được biết đến rỗng rãi nhất đó là khơng gian
RGB, đó là khơng gian mà mỗi màu được đĩnh nghĩa bởi sự kết hợp của ba
thành phần màu là Red, Green và Blue. Do đó sự thanh đổi chủ yếu trong màu
sắc của da đó là do sự thay đổi về độ chói, thơng thường các màu RGB được coi
trọng hơn, do đó, ảnh hưởng của độ chói có thể được lọc bỏ. Người ta có thể
chuẩn hóa các thành phần màu từ RGB thành rgb như sau:



(I.2)



Từ hệ thức trên chúng ta có thể thấy rằng r+g+b = 1. Việc chuẩn hóa màu
này có ý nghĩa là, chỉ cần viết hai trong số ba giá trị trên là chúng ta có thể tìm ra
giá trị còn lại. Trong việc phân tích màu sắc của da, một biểu đổ màu dựa vào r
và g chỉ ra rằng màu của khn mặt tập trung thành một cụm nhỏ trong biểu đồ
mức xám. Để so sánh thơng tin màu của một pixel với giá trị của r và g trong
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN
14
cụm trên, và từ đó tạo ra khả năng các pixel thuộc vùng da của mặt có thể được
tìm ra.
Bên cạnh mơ hình RGB, chúng ta còn có một vài mơ hình màu khác được
sử dụng trong việc nghiên cứu vấn đề nhận dạng mặt người. Mơ hình HIS là một
ví dụ, mơ hình này có những ưu điểm so với các mơ hình khác trong việc mang
lại sự phân biệt rõ ràng giữa các cụm màu của các đặc trưng khn mặt. Do đó
mơ hình này thường được sử dụng cho cơng việc trích chọn đặc trưng của khn
mặt như mơi, mắt, lơng mày. Do việc này có quan hệ chặt chẽ với việc cảm thụ
màu sắc ở con người, nó cũng được sử dụng phổ biến trong các sơ đồ phần vùng
khn mặt.
Một mơ hình khác được biết đến trong việc áp dụng để nhận dạng khn
mặt đó là mơ hình YIQ. Để chuyển đổi từ khơng gian màu RGB sang khơng gian
YIQ, chúng ta thấy có thành phần I, đó là khoảng màu từ cam (orange) -> xanh
lơ (Cyan), giống như khoảng màu của da người châu á. Việc chuyển đổi này
cũng ảnh hưởng tới việc triệt tiêu nền các màu khác và cho phép nhận biết những
khn mặt nhỏ trong một mơi trường tự nhiên. Các mơ hình màu khác cũng
được áp dụng cho việc nhận biết mặt người còn có HSV, YES, YCrCb, YUV,
CIE-xyz, L*u*v, CSN và UCS(Farnsworth).
Việc phân vùng màu có thể được thực hiện bằng việc sử dụng các ngưỡng
xấp xỉ màu khi màu da được mơ hình hóa thơng qua biểu đồ mức xám. Phương
pháp phức tạp hơn đó là sử dụng phương pháp tính tốn thống kê, sự thay đổi
khn mặt của mơ hình là trong một phổ rộng. Người ta đã tiến hành sử dụng
phân phối Gaussian để tập hợp hàng ngàn mẫu màu của da từ các lồi khác nhau.
Phân phối Gaussian được đặc trưng bởi vector trung bình µ và ma trận hiệp
phương sai ∑. Màu của điểm ảnh từ ảnh đầu vào có thể được so sánh với màu
da của mơ hình bằng cách tính hệ số khoảng cách Mahalanobis. Hệ số này sẽ cho
biết độ tương đồng của màu pixel với màu da của mơ hình.
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN

Không có nhận xét nào:

Đăng nhận xét