Vitalik Buterin nhận xét rằng Chat GPT-4 của OpenAI đã “giống như con người” khi vượt qua bài kiểm tra Turing.
Theo đồng sáng lập Ethereum Vitalik Buterin, GPT-4 của OpenAI, một mô hình trí tuệ nhân tạo tổng quát (AGI), đã vượt qua bài kiểm tra Turing.
Bài kiểm tra Turing là một tiêu chuẩn mơ hồ dành cho các hệ thống AI, được cho là nhằm xác định mức độ giống con người của một mô hình hội thoại. Thuật ngữ này được đặt theo tên nhà toán học nổi tiếng Alan Turing, người đã đề xuất bài kiểm tra này vào năm 1950.
Theo Turing, vào thời điểm đó, một hệ thống AI có khả năng tạo ra văn bản làm cho con người nghĩ rằng họ đang có cuộc trò chuyện với một người khác sẽ thể hiện khả năng “suy nghĩ.”
Gần 75 năm sau, người được công nhận phần lớn với việc sáng tạo ra loại tiền điện tử phổ biến thứ hai thế giới đã diễn giải nghiên cứu sơ bộ gần đây từ Đại học California San Diego là chỉ ra rằng một mô hình sản xuất đã cuối cùng vượt qua bài kiểm tra Turing.
Các nhà nghiên cứu tại Đại học California San Diego gần đây đã công bố một bài báo sơ bộ có tiêu đề “Con người không thể phân biệt GPT-4 với một con người trong bài kiểm tra Turing.” Trong nghiên cứu này, họ đã cho khoảng 500 người tham gia thử nghiệm tương tác với cả con người và các mô hình AI trong một thử nghiệm mù để xác định xem họ có thể phân biệt được đâu là con người và đâu là AI.
Theo nghiên cứu, con người đã nhầm lẫn rằng GPT-4 là “con người” trong 56% trường hợp. Điều này có nghĩa là máy móc đã lừa con người nghĩ rằng nó là một trong số họ nhiều hơn một nửa số lần thử nghiệm.
Quan điểm của Vitalik Buterin
Theo Buterin, một hệ thống AI có khả năng lừa hơn một nửa số người mà nó tương tác có nghĩa là đã vượt qua bài kiểm tra Turing.
Buterin nói thêm:
“Điều này có nghĩa là khả năng của con người để xác định xem đó là người hay bot về cơ bản giống như tung đồng xu!”
Buterin làm rõ thêm phát biểu của mình bằng cách nói, “Được rồi, không hoàn toàn, vì con người được đoán là con người 66% trong khi bot là 54%, nhưng sự khác biệt 12% là rất nhỏ; trong bất kỳ tình huống thực tế nào điều đó cơ bản được tính là vượt qua.”
Ông cũng bổ sung sau đó, để đáp lại những bình luận về bài viết ban đầu của mình, rằng bài kiểm tra Turing “là mốc được xã hội chấp nhận nổi tiếng nhất để nói rằng ‘AI bây giờ thực sự nghiêm túc’. Vì vậy, điều tốt là chúng ta nhắc nhở bản thân rằng mốc này đã được vượt qua.”
Bài kiểm tra Turing
Trí tuệ nhân tạo tổng quát (AGI) và bài kiểm tra Turing không nhất thiết liên quan đến nhau, mặc dù hai thuật ngữ này thường bị nhầm lẫn. Turing đã xây dựng bài kiểm tra của mình dựa trên tài năng toán học và dự đoán một kịch bản nơi AI có thể lừa con người nghĩ rằng nó là một trong số họ thông qua cuộc trò chuyện.
Cần lưu ý rằng bài kiểm tra Turing là một khái niệm mơ hồ không có tiêu chuẩn thực sự hay cơ sở kỹ thuật. Không có sự đồng thuận khoa học về việc liệu máy móc có thể “suy nghĩ” như các sinh vật sống hay không hoặc làm thế nào để đo lường một kỳ công như vậy. Đơn giản mà nói, khả năng “suy nghĩ” của AGI hay AI hiện không thể đo lường hoặc định nghĩa bởi các cộng đồng khoa học hay kỹ thuật.
Turing đã đưa ra những dự đoán khái niệm của mình từ lâu trước khi các hệ thống trí tuệ nhân tạo dựa trên token và sự xuất hiện của các mạng đối kháng tạo sinh, tiền thân của các hệ thống AI tạo sinh ngày nay, ra đời.
Trí tuệ nhân tạo tổng quát
Việc phức tạp hơn nữa là ý tưởng về AGI, thường được liên kết với bài kiểm tra Turing. Trong thuật ngữ khoa học, một “trí tuệ tổng quát” là một trí tuệ có khả năng thực hiện bất kỳ kỳ công nào dựa trên trí thông minh. Điều này loại trừ con người, vì không ai có khả năng “tổng quát” trên toàn bộ phổ các nỗ lực trí tuệ của con người. Do đó, một “trí tuệ nhân tạo tổng quát” sẽ có khả năng suy nghĩ vượt xa bất kỳ con người nào đã biết.
Tuy nhiên, rõ ràng rằng GPT-4 không phù hợp với tiêu chuẩn của “trí tuệ tổng quát” thực sự theo nghĩa khoa học nghiêm ngặt. Tuy nhiên, điều này không ngăn cản cộng đồng AI sử dụng thuật ngữ “AGI” để chỉ bất kỳ hệ thống AI nào có khả năng lừa một số lượng đáng kể con người.
Trong văn hóa hiện tại, việc sử dụng các thuật ngữ và cụm từ như “AGI,” “giống con người,” và “vượt qua bài kiểm tra Turing” để chỉ bất kỳ hệ thống AI nào tạo ra nội dung tương đương với nội dung do con người sản xuất là điều điển hình.