Giải pháp nhận dạng đầy đủ khuôn mặt người dù khuyết thông tin
25/01/2018
110 Lượt xem
Tác giả Võ Hoàng Trọng, khoa toán - tin học, Trường ĐH khoa học tự nhiên - ĐH quốc gia TP.HCM, dưới sự hướng dẫn của PGS.TS. Phạm Thế Bảo - trưởng bộ môn ứng dụng tin học, khoa toán - tin học, Trường ĐH khoa học tự nhiên đã đề xuất một phương pháp giải quyết những thách thức trên.
Theo đó, ý tưởng chủ đạo của đề tài lại xuất phát từ những câu nói hết sức bình thường trong đời sống hàng ngày, ví dụ như: “Anh này có đôi mắt to quá!”, “Chị này có cái mũi cao thật đẹp!”, hay: “Dù nó mang khẩu trang nhưng trán có sẹo này chắc chắn của thằng A!”... Từ đó, Trọng và thầy Bảo đánh giá rằng, với những mặt chỉ có một vài thông tin như mắt, mũi hay trán, hãy thử nhận dạng trên từng vùng riêng biệt, lần lượt xác định những người có “mắt to” hay “mũi cao” hay “trán sẹo”, rồi tìm cách kết hợp các kết quả nhận dạng, biết đâu sẽ tìm được danh tính mặt người trong ảnh.
Từ ảnh ban đầu, tác giả đã phát hiện khuôn mặt bằng thuật toán HOG, phân bố các điểm mốc lên mặt và phân vùng mặt theo superpixel, từ đó tách mặt ra thành các vùng đặc trưng thuần nhất. Sau đó, áp dụng nạng neural tích chập để “huấn luyện” trên từng vùng đặc trưng. Khi kiểm tra, sử dụng những vùng đặc trưng có trên khuôn mặt để nhận dạng bằng cách xây dựng phương pháp kết hợp “trễ” từ các bộ phân loại “yếu” bằng phương pháp bầu chọn để từ đó có được một bộ phân loại “mạnh”. Đối với phương pháp bầu chọn, ở mỗi vùng đặc trưng có tính phân loại yếu, tác giả chọn ra 5 đối tượng có vùng đặc trưng giống với vùng đặc trưng của mặt người trong ảnh. Sau đó, tính điểm các đối tượng này bằng một hàm số tính điểm dựa trên khái niệm tích vô hướng của vector hệ số các vùng đặc trưng và vector xác suất của đối tượng. Cuối cùng, chọn đối tượng có điểm cao nhất để kết luận danh tính mặt người trong ảnh.
Phương pháp hiện có thể nhận dạng được mặt người chỉ với một vài phần thông tin trên mặt người hay mặt người có sự thay đổi (lúc có râu, lúc không râu, lúc có đeo kính, làn da thay đổi màu...) một cách hiệu quả với độ chính xác cao. Do đó, đề tài có thể áp dụng trong việc bảo mật các thiết bị điện tử hay phát hiện đối tượng trong đám đông thông qua camera giám sát. Công nghệ FaceID của Apple xây dựng mô hình 3 chiều của mặt người dựa trên các cảm biến, điều này giúp cho việc nhận dạng mặt dưới nhiều góc cạnh hay mặt bị che khuất một phần thông tin dễ dàng hơn nhưng lại khó khi ứng dụng vào camera công cộng vì không phải lúc nào cũng quét được mặt 3 chiều của một người ở đám đông.
Về hiệu quả kinh tế, theo tiết lộ của Hoàng Trọng, chi phí thực tế không quá cao khi chỉ đầu tư ở 2 khoản: tiền mua máy tính và tiền đầu tư camera rõ nét nhất có thể.
Hiện tác giả chỉ mới thử nghiệm phương pháp dựa trên toàn mặt cũng như chỉ một vài phần trên khuôn mặt người trên bộ dữ liệu FaceScrub. Bộ dữ liệu này rất thích hợp để thực nghiệm trước khi triển khai vào thực tế do tính đa dạng của ảnh mặt người trong bộ dữ liệu. Bộ dữ liệu này gồm ảnh khuôn mặt người với nhiều trạng thái cũng như chất lượng ảnh khác nhau, ví dụ như mặt chính diện, nửa nghiêng, chịu tác động bởi ngoại cảnh, ảnh bị mờ, ảnh khuôn mặt thay đổi theo thời gian mặt lúc già, lúc trẻ, lúc có râu, lúc không râu, lúc có đeo kính...
Thực nghiệm cho 50 đối tượng, mỗi đối tượng có hơn 1.900 ảnh để thực nghiệm ban đầu. Kết quả thực nghiệm cho thấy phương pháp nhận dạng chính xác đến 86% trên toàn mặt, 80.875% khi ảnh mặt người chỉ có thông tin trán và mắt (ví dụ như người mang khẩu trang), 73% khi mặt người chỉ có mũi và hai bên má, 64.875% khi mặt người chỉ thấy thông tin của miệng và cằm. Đối với mặt chỉ thấy vùng má trái hay má phải, độ chính xác của thuật toán chỉ 57,5%.
Đây là đề tài đã đoạt giải nhì Giải thưởng sinh viên nghiên cứu khoa học - Euréka 2017.