Các startup đang nhanh chóng xây dựng các công cụ phát hiện văn bản do AI tạo ra, nhưng ở một nơi khác, nhiều sinh viên cũng đang chia sẻ cho nhau cách thức để tránh bị phát hiện.
Alex Cui (Bên trái), Giám đốc công nghệ kiêm trưởng bộ phận R&D và CEO Edward Tian muốn mang đến tính minh bạch cho nền tảng máy học với GPTZero. Họ đã huy động được đầu tư 3,5 triệu USD. Ảnh: forbes.vn.
Edward Tian chưa bao giờ nhận mình là một nhà văn. Là một sinh viên chuyên ngành khoa học máy tính tại Đại học Princeton, anh cũng có tham gia một vài lớp báo chí, tại đây anh đã học những kiến thức cơ bản về cách đưa tin. Dẫu luôn được lòng các giáo viên và bạn bè cùng lớp nhờ tính cách sôi nổi và niềm say mê học hỏi kiến thức mới, nhưng anh mô tả phong cách viết của mình vào thời điểm đó “khá tệ” - rập khuôn và rườm rà. Điểm cộng duy nhất đó là một trong những giảng viên lớp báo chí đã nhận xét rằng Tian rất giỏi “nhận dạng khuôn mẫu”, điều này rất hữu ích khi viết các tin tức với cùng một công thức kết cấu. Do đó Tian đã rất ngạc nhiên khi vào năm hai đại học, anh đã giành được một suất tham dự hội thảo viết truyện phi hư cấu của nhà văn người Mỹ John McPhee.
Hằng tuần, 16 sinh viên tụ tập để nghe nhà văn huyền thoại mổ xẻ về nghề của ông. Tian nhớ McPhee đã nói rằng ông ấy không thể dạy sinh viên của mình cách viết, nhưng ít nhất ông ấy có thể giúp họ tìm ra giọng văn độc đáo của riêng mình.
Nếu nhà văn McPhee gợi lên trong Tian một cái nhìn lãng mạn về ngôn ngữ, rằng mỗi người có một phong cách viết đặc thù khó lẫn vào đâu; thì khoa học máy tính lại giúp anh có được một góc nhìn khác: ngôn ngữ như số liệu thống kê. Trong thời gian xảy ra đại dịch, anh đã thực tập tại Bellingcat, một dự án báo chí nguồn mở, tại đây anh ấy đã viết code để phát hiện các bot Twitter. Khi còn là sinh viên, anh đã tham gia các lớp về máy học và xử lý ngôn ngữ tự nhiên. Và vào mùa thu năm 2022, anh bắt đầu thực hiện nghiên cứu về việc phát hiện sự khác biệt giữa văn bản do AI tạo ra và văn bản do con người tự viết.
Khi ChatGPT ra mắt vào tháng 11, Tian nảy ra một ý tưởng. Là một sinh viên khoa học máy tính, Tian hiểu rõ nền tảng công nghệ GPT-3, và với tư cách là một nhà báo từng làm việc để loại bỏ tận gốc các chiến dịch đưa thông tin sai lệch, anh ấy nhận thức được những hệ quả mà nội dung do AI tạo ra có thể xảy đến với xã hội.
Tian bắt đầu thử nghiệm một chương trình mới: công cụ dò ChatGPT. Anh ấy đến quán cà phê “tủ”, nhâm nhi trà hoa nhài và cặm cụi viết code xuyên đêm. Ý tưởng của anh ấy rất đơn giản. Phần mềm sẽ quét một đoạn văn bản để tìm hai yếu tố: “không xuôi tai” - biểu hiện của việc chọn từ một cách ngẫu nhiên; và “sự rối rắm”, mức độ phức tạp, câu cú liên tục biến đổi. Câu văn của con người có xu hướng xuôi tai, liền mạch và khúc chiết hơn câu văn của AI, điều này giúp Tian đoán được một đoạn văn bản do người hay AI tạo ra. Tian đặt tên công cụ này là GPTZero, và anh ấy đã đăng tải nó lên mạng vào tối ngày 2/1.
Anh ấy đã giới thiệu ngắn gọn về GPTZero trên Twitter. “Nhằm mục tiêu ngăn chặn tình trạng lạm dụng AI ngày càng gia tăng”, anh viết. “Các giáo viên trung học có muốn học sinh sử dụng ChatGPT để viết bài luận lịch sử của mình không? Có lẽ là không.” Sau đó anh ấy đi ngủ.
Tian thức dậy vào sáng hôm sau, anh ấy đã trở thành người nổi tiếng. Có quá nhiều người sử dụng công cụ của anh, gây quá tải và sập trang. Chỉ trong vài ngày, anh đã nhận được các cuộc gọi từ phóng viên trên khắp thế giới.
Và thế là startup GPTZero đã ra đời. GPTZero là một bước ngoặt mới trong câu chuyện truyền thông xoay quanh ChatGPT. Trên thực tế, một số nhà nghiên cứu đã tạo ra công cụ phát hiện văn bản do GPT-2 tạo ra vào năm 2019, nhưng GPTZero là công cụ đầu tiên nhắm đến ChatGPT. Nhiều giáo viên gửi lời cảm ơn Tian, họ tâm sự rằng cuối cùng mình đã có thể xác thực được những vướng mắc tồn tại trong lòng từ lâu trước các bài luận đáng nghi của học sinh. Phải chăng loài người đã tìm được vị cứu tinh giúp thoát khỏi mối đe dọa từ robot?
Chương trình của Tian là một tiếng súng mở màn. Nhiều người cũng bắt đầu phát triển các công cụ phát hiện AI nhanh chóng. Trong một thế giới ngập tràn những nội dung do AI tạo ra, chúng ta cần phân biệt giữa văn bản do máy móc sinh ra và thứ do con người tự sáng tạo. GPTZero đại diện cho một lời hứa rằng thực sự có thể phân biệt được hai loại nội dung, và việc phân biệt rạch ròi vô cùng quan trọng. Tian tin rằng cho dù các công cụ AI có phức tạp đến đâu, chúng ta sẽ luôn có thể vạch mặt chúng.
Những tranh cãi
Cuộc sống trên Internet là chiến trường dai dẳng giữa những kẻ lừa đảo và những người phát hiện dấu hiệu giả mạo, cả hai bên đều rút kinh nghiệm từ cuộc xung đột để cải thiện phương thức của mình. Các bộ lọc thư rác ban đầu chỉ sàng lọc email theo từ khóa, chặn các thư có cụm từ như “MIỄN PHÍ!” hoặc “trên 21 tuổi” và giờ đây chúng đã học được cách lọc thư dựa trên phong cách viết. Những kẻ gửi thư rác phản ứng lại bằng cách “bao bọc” quảng cáo của họ bằng những đoạn văn do con người viết ra, được trích từ nhiều cuốn sách cũ và chắp vá lại với nhau.
Một ví dụ khác, khi các công cụ tìm kiếm như Google, Bing ngày càng phổ biến hơn, những người sáng tạo nội dung muốn tăng thứ hạng cho website của họ, họ đã sử dụng mánh lới “nhồi nhét từ khóa” - lặp đi lặp lại cùng một từ - để trở thành kết quả xuất hiện đầu tiên khi khách hàng tìm kiếm từ khóa đó. Các công cụ tìm kiếm ngăn chặn mánh này bằng cách hạ thứ hạng các website đó.
Tương tự như vậy, nhiều sinh viên đã chia sẻ cho nhau các “bí kíp” để tránh bị GPTZero phát hiện. Một người đã lên Twitter hướng dẫn người dùng chèn ký tự có chiều rộng bằng 0 trước mỗi chữ “e” trong văn bản do ChatGPT tạo. Một người dùng TikTok đã viết một chương trình chống máy dò AI bằng cách thay thế một số chữ cái tiếng Anh bằng các ký tự Cyrillic giống chúng. Những người khác bắt đầu chạy văn bản AI của họ bằng QuillBot, một công cụ hỗ trợ viết lại câu phổ biến. Tian đã vá những lỗ hổng này, nhưng các mánh lới khác vẫn tiếp tục xuất hiện. Chỉ là vấn đề thời gian trước khi ai đó tạo ra một sản phẩm chống lại công cụ dò AI.
Đó không phải là mối lo duy nhất, ngay sau khi Tian phát hành GPTZero, một làn sóng sản phẩm tương tự đã xuất hiện. OpenAI đã tung ra công cụ phát hiện của riêng mình vào cuối tháng một, trong khi Turnitin, gã khổng lồ trong ngành chống đạo văn, đã tiết lộ một công cụ phân loại vào tháng tư. Tất cả đều có chung một phương pháp cơ bản, nhưng mỗi mô hình được đào tạo trên các tập dữ liệu khác nhau. (Ví dụ: Turnitin tập trung vào bài luận của sinh viên.) Do đó, độ chính xác rất khác nhau, OpenAI cho biết công cụ của họ có độ chính xác 26% khi phát hiện văn bản do AI viết, trong khi một công ty có tên Winston AI tự tin tuyên bố công cụ của họ có khả năng phát hiện 99,6%. Để vượt qua đối thủ, Tian sẽ phải tiếp tục cải tiến GPTZero, phát triển sản phẩm tiếp theo và hoàn thành chương trình đại học trong thời gian chờ đợi.
Ngay lập tức, Tian đã thuyết phục người bạn thời trung học Alex Cui làm CTO của công ty GPTZero, và trong những tuần tiếp theo, anh tiếp tục tuyển dụng một số lập trình viên từ ĐH Princeton và ở Canada. Cả nhóm đã lập ra một kế hoạch lớn tiếp theo: tạo ra plug-in Chrome có thể quét văn bản của một website và xác định xem nó có được tạo bởi AI hay không.
Một mối đe dọa không ngờ đến của GPTZero chính là bản thân GPTZero. Gần như ngay sau khi nó ra mắt, nhiều người đã đăng tải lên mạng xã hội một số ví dụ cho thấy việc công cụ này phân loại sai văn bản. Nó đã cảnh báo các phần của Hiến pháp Hoa Kỳ có thể do AI soạn. Những màn cười cợt dần nhường chỗ cho cơn phẫn nộ khi các câu chuyện kể về trường hợp những học sinh bị buộc tội gian lận do GPTZero bắt đầu tràn ngập Reddit. Phụ huynh của một học sinh bị buộc tội đã liên hệ với ông Soheil Feizi, giáo sư khoa học máy tính tại ĐH Maryland. “Họ thực sự tức giận,” ông nói. Mùa thu năm ngoái, trước khi GPTZero ra mắt, ông Feizi và một số đồng nghiệp khác ở ĐH Maryland đã bắt đầu thực hiện một dự án nghiên cứu về các nhược điểm của những công cụ phát hiện văn bản do AI tạo ra. Giờ đây, GPTZero và những công cụ tương tự đã buộc ông phải tin rằng chúng là những phương án lợi bất cập hại.
Vào tháng ba, ông Soheil Feizi đã công bố những phát hiện của mình về hiệu quả của công cụ dò AI. Ông lập luận rằng dựa trên cách những công cụ này hoạt động, sai sót là điều không thể tránh khỏi. Ông cho rằng chúng đang làm tổn thương học sinh. Giả sử một công cụ phát hiện có tỷ lệ phát hiện sai là 1% - một giả định lạc quan. Điều đó có nghĩa là trong một lớp học gồm 100 học sinh, với 10 bài tập làm tại nhà trong suốt kỳ học, trung bình sẽ có 10 học sinh bị buộc tội gian lận. “Thật nực cười khi nghĩ đến việc sử dụng những công cụ như vậy để giám sát việc sử dụng AI,” ông nói.
Tian cho biết mục đích của GPTZero không phải là để trừng phạt những kẻ gian lận, nhưng hiện tại mọi người đều sử dụng chúng với mục đích đó. (Kết quả phát hiện của GPTZero hiện đi kèm với dòng cảnh báo: “Không nên sử dụng những kết quả này để phạt học sinh.”) Về độ chính xác, Tian cho biết mức độ hiện tại của GPTZero là 96% khi được đào tạo trên tập dữ liệu cập nhật nhất. Các công cụ dò khác có thể tự tin khẳng định mình chính xác hơn, nhưng Tian cho biết những tuyên bố đó rất nguy hiểm, vì điều đó có nghĩa là các dữ liệu huấn luyện mô hình đang quá chuyên biệt, đến mức công cụ không thể hoạt động hiệu quả đối với những dữ liệu mới, khác biệt.
Theo khoahocphattrien