Sinh viên làm mắt kính hỗ trợ đọc sách cho người mù
13/01/2023
82 Lượt xem
Nhóm sinh viên công nghệ thông tin ở TP HCM làm mắt kính ứng dụng trí tuệ nhân tạo (AI) chuyển văn bản thành giọng nói, hỗ trợ người mù đọc sách.
Sản phẩm do Trịnh Quốc Huy, Đào Anh Hào (Đại học Khoa học Tự nhiên TP HCM) và Phạm Huy (Đại học FPT Hà Nội) nghiên cứu với mục đích giúp người mù có cơ hội tiếp cận tri thức thông qua thiết bị nhỏ gọn, tích hợp nhiều chức năng.
Ý tưởng làm mắt kính cho người mù được Trịnh Quốc Huy (trưởng nhóm) nhen nhóm từ năm 2019 khi còn học cấp ba. Cậu học trò muốn làm một sản phẩm công nghệ dành tặng cho bà ngoại vốn là người khiếm thị. Lúc đầu, Huy dự định làm mắt kính dò đường, giúp ngoại không phải cầm gậy khi đi lại. Tuy nhiên, kính này bộc lộ hạn chế khi một số vật thể kích thước nhỏ, di động... mắt kính có thể cảnh báo sai.
Theo Huy, công nghệ vẫn có khả năng sai số. Nhưng nếu sai trong trường hợp người mù tham gia giao thông, có thể gây nguy hiểm tính mạng. Khi đó em nghĩ đến việc phát triển mắt kính hỗ trợ đọc sách.
Nói thêm về sự chuyển hướng này, Huy cho rằng công nghệ có thể hỗ trợ để họ vượt lên sự mặc cảm và tiếp cận tri thức như một người bình thường để có thể lao động và trở thành người có ích.
Quốc Huy giới thiệu mắt kính thông minh cho người mù tại cuộc thi giải pháp trí tuệ nhân tạo TP HCM lần 3, năm 2022. Ảnh: BTC
Với sự tham gia của Anh Hào và Phạm Huy cùng nhiều sinh viên đam mê AI hỗ trợ, nhóm cho ra đời phiên bản mắt kính thông minh đầu tiên năm 2021. Kính được làm bằng vật liệu nhựa PLA, trọng lượng khoảng 50 g. Mắt kính có gắn camera chụp hình văn bản và hệ thống mạch âm thanh, phát ra giọng nói. Ngoài đọc văn bản, mắt kính còn có chức năng nhận diện tiền mặt, trợ lý ảo bằng giọng nói... Các chức năng này được tích hợp vào các nút bấm trên hộp điều khiển nhỏ gọn để người mù sử dụng với mục đích họ mong muốn.
Theo Quốc Huy, yếu tố quyết định hiệu quả của mắt kính là thuật toán xử lý hình ảnh ứng dụng AI để tăng độ chính xác khi đọc văn bản từ dữ liệu của camera. Ngoài đọc sách, người mù khi sử dụng mắt kính hướng đến khu vực có chữ trong không gian xung quanh, camera sẽ chụp ảnh, nhận dạng và chuyển thành giọng nói. Điều này giúp họ có thể hình dung một phần không gian xung quanh mình.
"Chức năng này hữu ích khi người mù đến một nơi mới, thậm chí giúp họ biết được mình đang ở đâu thông qua hình ảnh từ các bảng quảng cáo, biển chỉ dẫn có chữ xung quanh. Tính năng này hỗ trợ họ rất lớn trong trường hợp đi lạc", Huy chia sẻ. Mô hình của nhóm có thể đọc các văn bản độ chính xác lên đến 90%, sử dụng công cụ giọng nói miễn phí từ Google. Sắp tới nhóm dự kiến phát triển hệ thống giọng đọc văn bản riêng thuần tiếng Việt theo từng vùng miền để phục vụ người dùng tốt hơn.
Sản phẩm được thử nghiệm cho khoảng 10 người mù tại TP HCM và Lâm Đồng và được đánh giá khả năng đọc văn bản chính xác, ngoại hình gọn nhẹ và dễ sử dụng. Tuy nhiên, một số ý kiến cho rằng về thẩm mỹ kính chưa đẹp, tốc độ đọc văn bản chậm...
Huy cho biết, từ những ý kiến này nhóm tiếp tục cải thiện sản phẩm trong những phiên bản tiếp theo. "Mong muốn các tổ chức, doanh nghiệp hỗ trợ để sản phẩm hoàn thiện hơn, sớm sản xuất hàng loạt để phục vụ người dùng" Huy nói. Hiện chi phí sản xuất một mắt kính thông minh khoảng 4,5 - 5 triệu đồng, nhưng nếu sản xuất ở quy mô công nghiệp sẽ rẻ hơn.
Theo PGS.TS Thoại Nam, Giám đốc Trung tâm kỹ thuật điện toán, Đại học Bách khoa TP HCM, mắt kính thông minh của nhóm có tính ứng dụng cao và mang giá trị nhân văn khi quan tâm đến những người yếu thế trong xã hội, giúp họ tiếp cận tri thức, hỗ trợ thông tin. Tuy nhiên, kính mới ở giai đoạn hoàn thiện công nghệ và cần tiếp tục cải tiến để sử dụng hiệu quả.
PGS Nam gợi ý, mắt kính khi hoạt động phải được truyền dữ liệu liên tục, nên nhóm cần nghiên cứu công nghệ truyền dẫn không dây tiết kiệm điện, giúp tăng thời gian sử dụng pin. "Ngoài ra, camera trên mắt kính cần sử dụng loại chuyên dụng phục vụ cho mục đích mà nhóm đặt ra", ông Nam nói.