Công nghệ phân tích hình ảnh camera cảnh báo người ngã
08/12/2020
91 Lượt xem
Theo Tổng cục dân số, Việt Nam đã chạm đỉnh dân số vàng và bước vào thời kỳ già hóa dân số với tốc độ nhanh thuộc top đầu thế giới. Nếu như cách đây 10 năm, số người trên 60 tuổi chiếm gần 10% dân số thì hơn 30 năm nữa, tỷ lệ này có thể chạm mốc 25%. Già hóa dẫn đến nhiều vấn đề sức khỏe như suy giảm thể chất và các bệnh mãn tính. Tai nạn, đặc biệt là ngã gãy xương, rất phổ biến và là một trong 5 nguyên nhân gây tử vong ở người cao tuổi. WHO cho biết hàng năm có khoảng 28-35% người có độ tuổi trên 65 bị ngã gây tổn hại đến sức khỏe và tỷ lệ này tăng nhanh đến 32-42% đối với nhóm người trên 70 tuổi.
Cùng với đó, những năm qua Việt Nam có xu hướng chuyển sang mô hình gia đình hạt nhân, khiến nhiều cặp vợ chồng người cao tuổi phải sống cô đơn hoặc chỉ còn cụ ông/cụ bà sống cùng gia đình trẻ bận rộn. Đối mặt với sức khỏe yếu và ít được theo dõi sát sao, người già gặp rất nhiều nguy hiểm khi đột quỵ hoặc té ngã mà không được phát hiện kịp thời.
PGS.TS Lê Thanh Hà (Ảnh: trường Đại học Công nghệ, ĐHQGHN)
Nhận thấy điều này, PGS.TS Lê Thanh Hà cùng các cộng sự tại trường Đại học Công nghệ, ĐHQGHN đã quyết định phát triển một thuật toán phân tích hình ảnh camera giúp tự động giám sát và phát hiện người ngã, từ đó lập tức đưa ra tín hiệu báo động đến một ứng dụng để người giám hộ kịp thời cấp cứu. Hệ thống này không chỉ dễ dàng lắp đặt trong gia đình mà còn có thể phổ biến ngay tại các bệnh viện hoặc cơ sở chăm sóc người cao tuổi giúp giảm tải việc theo dõi cho các bác sĩ, y tá.
“Ý tưởng đó khá mộc mạc.” PGS.TS Lê Thanh Hà chia sẻ “Chúng tôi chỉ cần sử dụng một camera thông thường Full HD 1080P gắn với một bộ máy tính bo mạch cấu hình thấp Raspberry Pi có kích thước chỉ bằng một tấm thẻ và chi phí tầm vài chục USD để thu thập và xử lý dữ liệu ngay trên thiết bị. Trong môi trường ánh sáng tốt, kết quả thử nghiệm với bộ dữ liệu chuẩn gồm 50 mẫu video với nhiều điều kiện ngã khác nhau cho độ chính xác khoảng 90%".
Với sự phát triển của thị giác máy tính trong 10 năm gần đây, các phương pháp tiên tiến dựa trên hình ảnh và video đã trở nên phổ biến trong những hệ thống phát hiện ngã. Có ba cách tiếp cận chính khi phát hiện ngã dựa trên hình ảnh là: sử dụng hình ảnh từ một camera duy nhất, phân tích 3D dựa trên nhiều camera, và phân tích 3D dựa trên nhiều camera kết hợp cảm biến đo khoảng cách.
Đặt mục tiêu phải tạo ra một hệ thống “có thể phổ biến nhất với bối cảnh Việt Nam”, nhóm nghiên cứu đã lựa chọn cách tiếp cận đầu tiên - tức sử dụng dữ liệu chỉ từ một máy quay camera. Mặc dù nếu sử dụng nhiều camera kết hợp cảm biến sẽ cho ra kết quả tốt hơn nhưng phương án này khó khả thi khi triển khai với số lượng lớn.
Phát hiện người ngã thông qua phân tích hình ảnh camera. Bên trái là các vector motion ghi lịch sử chuyển động, bên phải là khung hình elip bao quanh đối tượng theo dõi (Ảnh: Phòng thí nghiệm tương tác người-máy, trường Đại học Công nghệ, ĐHQGHN)
Bên cạnh đó, bài toán phân tích hình ảnh phát hiện người ngã thường có khối lượng tính toán lớn và phức tạp, do vậy nhóm nghiên cứu phải tìm ra những kỹ thuật “đủ đơn giản nhưng thông minh” để tối ưu hóa tính toán trên chính các thiết bị đầu cuối cấu hình thấp mà không phải phụ thuộc vào một hệ thống tính toán hiệu năng cao bên ngoài.
“Điều này giống như thiết kế một mạng lưới phân tán. Mỗi bộ Raspberry gắn với camera sẽ tự xử lý hình ảnh của mình rồi gửi tín hiệu đi nếu có người ngã." PGS.TS Lê Thanh Hà chia sẻ. "Ngược lại, nếu xây dựng hệ thống tập trung - giả sử như có một triệu camera cùng truyền dữ liệu ra ngoài để xử lý - thì sẽ đòi hỏi một hệ thống tính toán cực kì cồng kềnh và tốn nhiều năng lượng. Đó là điều chúng tôi muốn tránh”
Với các ảnh liên tiếp nhau, về cơ bản đối tượng trong ảnh phần lớn giống nhau (trừ tình huống chuyển cảnh), chỉ khác nhau do vị trí của nó bị xê dịch. Do vậy khi phân tích, các nhà nghiên cứu của trường Đại học Công nghệ đã sử dụng kỹ thuật vector motion – tức tách những vùng chuyển động so với “nền”, gọi là vector, và phân tích các đặc trưng về chuyển động và hình dáng cơ thể.
Nhìn chung, tai nạn ngã xảy ra trong thời gian ngắn từ 0,45 đến 0,85 giây trong đó người bị ngã thay đổi rất nhiều về tư thế và hình dạng. Những thay đổi đột ngột này rất quan trọng để xác định xem liệu cú ngã có xảy ra hay không.
Nhờ thiết lập các đường elip bao quanh đối tượng và xem xét lịch sử chuyển động của đối tượng trên nhiều khung hình liên tiếp, thuật toán sẽ phát hiện những thay đôi về di chuyển và góc của hình elip trong suốt quá trình trước, trong và sau khi ngã nhằm phát hiện tai nạn. Các kĩ thuật xử lý nhiều khung hình song song cũng được áp dụng nhằm tăng tốc độ tính toán, đáp ứng thời gian thực.
Mặc dù các kỹ thuật vector motion đã được sử dụng tương đối nhiều trong việc nén truyền video, tuy nhiên trong nghiên cứu này, các nhà khoa học đã phát triển nó nhằm ứng dụng cho một mục đích cụ thể là phát hiện người ngã. Họ đã thiết lập được những ngưỡng giá trị (về thời gian, chiều cao, góc nghiêng, số lượng điểm ảnh …) phù hợp cho các đặc trưng chuyển động và hình dạng người ngã.
Tuy nhiên, đại diện nhóm nghiên cứu cũng lưu ý điểm hạn chế của hệ thống là khó hoạt động trong điều kiện thiếu sáng, đặc biệt vào buổi tối. Trong 3 năm qua, các kĩ thuật tính toán đã được cải thiện đáng kể nhờ những nỗ lực phát triển học máy đang diễn ra trên toàn cầu. Do vậy, PGS.TS Lê Thanh Hà cho biết họ sẵn sàng hợp tác và cải tiến kết quả prototype.
Chia sẻ về việc thương mại hóa, PGS.TS Lê Thanh Hà cho biết trong quá trình nghiên cứu, một vài doanh nghiệp Nhật Bản đã bày tỏ sự quan tâm đến công nghệ hỗ trợ chăm sóc sức khỏe người cao tuổi này. Tháng 10 vừa rồi, Cục sở hữu trí tuệ cấp bằng độc quyền sáng chế số 1-0025669 được công bố vào ngày 26 tháng 10 năm 2020 cho phương pháp và thiết bị phân tích video phát hiện sự kiện người ngã của trường. Và ngay trong tuần này, mặc dù không tiết lộ danh tính nhưng anh cũng bật mí đang cùng một tập đoàn công nghệ trong nước thỏa thuận về việc chuyển giao quyền sử dụng sáng chế.