Khác với con người, máy tính không cảm thấy nhàm chán hoặc thất vọng khi một bài học quá dễ hoặc quá khó. Nhưng máy tính cũng giống con người ở chỗ: nó sẽ học hiệu quả hơn khi có một giáo án huấn luyện “vừa phải” phù hợp với trình độ của mình.
Việc tìm ra một giáo án phù hợp không hề dễ dàng, vì vậy các nhà khoa học máy tính đã tự hỏi: Điều gì sẽ xảy ra nếu họ có thể khiến trí thông minh nhân tạo (AI) tự thiết kế bài học cho mình?
Một số nghiên cứu nhằm trả lời câu hỏi đó đã được công bố tại Hội nghị quốc tế hàng năm về hệ thống xử lý thông tin mạng thần kinh nhân tạo (NeurIPS). Bằng việc tạo ra AI có thể tìm ra cách tốt nhất để tự dạy mình, các nghiên cứu mới này giúp tăng tốc độ học tập của các mô hình máy tính ô tô tự lái và robot gia dụng, và giải các bài toán khó trước đây.
Các nhà nghiên cứu mới đây đã phát triển các AI tự thiết kế các bài học với độ khó tăng dần.
Trong một thử nghiệm, một chương trình AI cố gắng vượt qua mê cung 2D để đến đích bằng phương pháp thử và sai. Để tạo ra các mê cung ngày càng khó và cải thiện dần khả năng của AI, các nhà nghiên cứu - đứng đầu là nghiên cứu sinh Michael Dennis tại Đại học California (UC) và Natasha Jaques, nhà khoa học nghiên cứu tại Google - đã dùng hai phương pháp. Tuy nhiên cả hai đều không hiệu quả. Một phương pháp phân phối ngẫu nhiên các vật cản; với cách này, AI không học được nhiều. Phương pháp kia lưu lại những bản đồ AI đã giải trong quá khứ và tối đa hóa độ khó tương ứng; nhưng cách này khiến mê cung trở nên quá khó - và đôi khi thậm chí không thể giải được.
Vì vậy, các nhà khoa học đã sáng tạo một cách tiếp cận mới mà họ gọi là PAIRED. Đầu tiên, họ ghép cặp AI của mình với một AI gần như giống hệt, nhưng có một vài điểm khác - họ gọi đó là "AI đối thủ". Sau đó, họ cho một AI thứ ba, gọi là AI thiết kế, thiết kế các mê cung phù hợp với các đặc điểm và dễ hoàn thành hơn cho AI đối thủ - nhưng khó cho AI ban đầu. Cách làm này khiến các bản đồ luôn nằm ở mức chỉ khó hơn một chút so với khả năng giải quyết của AI chính. AI thiết kế bản đồ cũng sử dụng mạng nơ-ron - một chương trình lấy cảm hứng từ kiến trúc của não - để học cách thực hiện nhiệm vụ của nó qua nhiều lần thử nghiệm.
Sau khi đào tạo theo cách này, các nhà nghiên cứu cho AI chính thử giải một loạt các mê cung mới và khó. Nếu được đào tạo bằng cách sử dụng hai phương pháp cũ, AI không giải được mê cung nào mới. Nhưng sau khi được đào tạo với PAIRED, nó đã giải quyết được 1/5 số mê cung mới. "Chúng tôi rất phấn khích khi PAIRED có hiệu quả ngay từ thử nghiệm đầu tiên," Dennis nói.
Trong một nghiên cứu khác, cũng được trình bày tại hội thảo NeurIPS, Jaques và các đồng nghiệp tại Google đã sử dụng PAIRED để dạy một AI điền vào các biểu mẫu web để đặt chuyến bay. Nếu được đào tạo bằng các phương pháp đơn giản hơn, AI sẽ luôn thất bại, nhưng AI được đào tạo với phương pháp PAIRED đã làm thành công khoảng 50% số nhiệm vụ được giao.
Bart Selman, nhà khoa học máy tính tại Đại học Cornell và là chủ tịch Hiệp hội Vì sự phát triển của trí tuệ nhân tạo, cho biết, phương pháp PAIRED là một cách thông minh để khiến AI học hỏi.
Selman và các đồng nghiệp cũng trình bày một cách tiếp cận khác tại Hội nghị. Nhiệm vụ cho AI của họ là trò chơi Sokoban, trong đó AI phải đẩy các khối đến các vị trí mục tiêu. Nhưng các khối có thể đi vào ngõ cụt, vì vậy để hoàn thành nhiệm vụ, phải lên kế hoạch trước hàng trăm bước.
AI thiết kế của nhóm Selman tạo ra một bộ các nhiệm vụ đơn giản, với ít khối hơn, hơn để AI chính luyện tập. Sau đó, dựa trên hiệu suất của AI chính đối với các nhiệm vụ đơn giản, AI thiết kế sẽ đưa ra các câu đố khó hơn mà AI chính thỉnh thoảng mới giải được, tạo ra một giáo án huấn luyện phù hợp và hiệu quả.
Các nhà nghiên cứu đã thử nghiệm AI của họ trên 225 vấn đề mà chưa máy tính nào giải được và nó đã giải được 80% trong số đó.
Pieter Abbeel, nhà khoa học máy tính tại UC Berkeley, nói rằng các phương pháp mới này thậm chí có thể được sử dụng cho học sinh: AI có thể giúp điều chỉnh các bài tập thành khó hơn hoặc dễ hơn để phù hợp với nhu cầu của từng học sinh.