Sinh viên phát triển hệ thống AI phân tích ảnh não
09/05/2025
4 Lượt xem
Hệ thống MedCapSys do sinh viên Phan Minh Nhật phát triển có khả năng phân tích chính xác ảnh cộng hưởng từ (MRI) và tự động tạo báo cáo, hỗ trợ bác sĩ chẩn đoán.
Phan Minh Nhật, sinh viên Trường Đại học Bách khoa - Đại học Đà Nẵng, tác giả hệ thống MedCapSys đã giành giải Nhất tại hội nghị Khoa học và Triển lãm Công nghệ 2024-2025.
Hệ thống MedCapSys được phát triển trong hơn một năm với bốn modul chính: MedCapNet (mô hình mã hóa - giải mã chuyên biệt, tự động tạo chú thích ảnh MRI não), GuidedDCNet (mô hình phân loại tổn thương dựa trên khuếch tán, hỗ trợ nhận diện bất thường như u não), GuidedSegDiff (mô hình phân đoạn tổn thương, xác định vị trí, kích thước và số lượng tổn thương) và BrainMedQwen (mô hình ngôn ngữ thị giác, tổng hợp kết quả từ các modul trên để tạo báo cáo chẩn đoán chi tiết).
Hệ thống hiện ở giai đoạn phục vụ nghiên cứu, chưa triển khai thực tế. Các modul thành phần, trong đó có GuidedDCNet đang trong quá trình phản biện tại Tạp chí quốc tế Electronics and Telecommunications Research Institute (ETRI), thuộc danh mục Scopus, xếp hạng Q2.
Các kiến trúc mô hình nhóm của hệ thống MedCapSys. Ảnh: NVCC
Theo Minh Nhật, chẩn đoán ảnh MRI não là một trong những thách thức lớn trong y học hiện đại, vì yêu cầu độ chính xác gần như tuyệt đối và phải tạo được báo cáo tuân thủ đúng quy chuẩn chuyên ngành. Hệ thống MedCapSys được phát triển nhằm nâng độ tin cậy và tính hiệu quả chẩn đoán, đặc biệt trong bối cảnh công nghệ AI hiện vẫn tồn tại hiện tượng "ảo giác", khi máy tự sinh thông tin không có thật.
"Thay vì để AI tự diễn giải toàn bộ bức ảnh, nghiên cứu lựa chọn hướng tiếp cận mới bằng cách cung cấp thông tin bổ trợ cho hệ thống như chuỗi xung, góc chụp, vị trí tổn thương, giúp AI hiểu rõ ngữ cảnh và giảm thiểu sai lệch trong phân tích", Minh Nhật nói. Từ đó, hệ thống có thể tạo ra các báo cáo chẩn đoán giàu thông tin, hỗ trợ đắc lực cho đội ngũ y bác sĩ trong quá trình ra quyết định lâm sàng.
Quy trình hoạt động của MedCapSys bắt đầu từ việc tiếp nhận ảnh MRI đầu vào (dạng 2D hoặc 3D). Sau khi tiền xử lý để chuẩn hóa chất lượng và định dạng, ảnh được chuyển qua các modul phân loại, tạo chú thích và phân đoạn tổn thương. Cuối cùng, mô hình ngôn ngữ tổng hợp dữ liệu và tạo thành một báo cáo chẩn đoán hoàn chỉnh.
Minh Nhật cho biết, với kiến trúc modul, cho phép nâng cấp linh hoạt từng phần mà không ảnh hưởng đến tổng thể. "Các modul được cải tiến qua nhiều phiên bản, ứng dụng kỹ thuật học chuyển giao, nén mô hình, tối ưu hóa kiến trúc để đảm bảo hiệu suất và độ chính xác", Nhật nói.