Alibaba ra mắt AI Qwen2, thách thức Meta và OpenAI

Alibaba, gã khổng lồ thương mại điện tử Trung Quốc, đang khẳng định vị thế của mình trong lĩnh vực trí tuệ nhân tạo (AI) với việc ra mắt mô hình AI mới nhất mang tên Qwen2. Theo nhiều đánh giá, đây là lựa chọn nguồn mở hàng đầu hiện nay.

Được phát triển bởi Alibaba Cloud, Qwen2 thuộc dòng mô hình Tongyi Qianwen (Qwen), bao gồm các mô hình ngôn ngữ lớn Tongyi Qianwen LLM, mô hình AI hình ảnh Qwen-VL và Qwen-Audio.

Qwen được tiền huấn luyện trên dữ liệu đa ngôn ngữ, bao phủ nhiều ngành công nghiệp và lĩnh vực khác nhau. Trong đó, Qwen-72B là mô hình mạnh nhất, được huấn luyện trên 3 nghìn tỷ token dữ liệu. Để so sánh, biến thể mạnh nhất của Llama-2 của Meta chỉ dựa trên 2 nghìn tỷ token, trong khi Llama-3 đang trong quá trình xử lý 15 nghìn tỷ token.

Theo một bài đăng trên blog của đội ngũ Qwen, Qwen2 có khả năng xử lý 128 nghìn token ngữ cảnh – tương đương với GPT-4 của OpenAI. Qwen2 cũng vượt trội hơn Llama3 của Meta trong hầu hết các chỉ số tổng hợp quan trọng, làm cho nó trở thành mô hình nguồn mở tốt nhất hiện có.

Tuy nhiên, theo xếp hạng của Elo Arena độc lập, Qwen2-72B-Instruct được đánh giá cao hơn một chút so với GPT-4-0314 nhưng lại đứng sau Llama3 70B và GPT-4-0125-preview. Điều này khiến Qwen2 trở thành mô hình LLM nguồn mở được ưa chuộng thứ hai trong số các người thử nghiệm đến nay.

Qwen2 hoạt động tốt hơn Llama3, Mixtral và Qwen1.5 trong các tiêu chuẩn tổng hợp | Hình ảnh: Alibaba Cloud

Qwen2 hiện có sẵn với năm kích thước khác nhau, từ 0,5 tỷ đến 72 tỷ tham số, mang lại những cải tiến đáng kể trong nhiều lĩnh vực chuyên môn. Phiên bản mới này được huấn luyện với dữ liệu bằng 27 ngôn ngữ, bao gồm tiếng Đức, tiếng Pháp, tiếng Tây Ban Nha, tiếng Ý và tiếng Nga, ngoài tiếng Anh và tiếng Trung.

“So với các mô hình ngôn ngữ nguồn mở tiên tiến nhất, bao gồm Qwen1.5 đã phát hành trước đó, Qwen2 vượt trội hơn hầu hết các mô hình nguồn mở khác và thể hiện tính cạnh tranh với các mô hình độc quyền trên nhiều chỉ số như hiểu ngôn ngữ, sinh ngôn ngữ, khả năng đa ngôn ngữ, lập trình, toán học và lý luận,” đội ngũ Qwen tuyên bố trên trang chính thức của họ trên HuggingFace.

Các mô hình Qwen2 cũng cho thấy khả năng ấn tượng trong việc hiểu các ngữ cảnh dài. Qwen2-72B-Instruct có thể xử lý các nhiệm vụ trích xuất thông tin trong các ngữ cảnh khổng lồ mà không gặp lỗi, và đã hoàn thành bài kiểm tra “Needle in a Haystack” gần như hoàn hảo. Điều này quan trọng vì hiệu suất của mô hình thường suy giảm khi tương tác với nó nhiều hơn.

Qwen2 thực hiện một cách đáng kinh ngạc trong bài kiểm tra “Kim trong đống cỏ khô” | Ảnh: Alibaba Cloud

Với phiên bản phát hành mới này, đội ngũ Qwen đã thay đổi giấy phép cho các mô hình của mình. Trong khi Qwen2-72B và các mô hình điều chỉnh hướng dẫn của nó tiếp tục sử dụng giấy phép Qianwen gốc, tất cả các mô hình khác đã chuyển sang giấy phép Apache 2.0, một tiêu chuẩn trong thế giới phần mềm nguồn mở.

“Trong tương lai gần, chúng tôi sẽ tiếp tục mở mã các mô hình mới để tăng tốc AI nguồn mở,” Alibaba Cloud cho biết trong một bài đăng blog chính thức.

Decrypt đã thử nghiệm mô hình và nhận thấy nó rất khả năng trong việc hiểu các nhiệm vụ bằng nhiều ngôn ngữ. Mô hình này cũng được kiểm duyệt kỹ lưỡng, đặc biệt trong các chủ đề nhạy cảm ở Trung Quốc. Điều này phù hợp với tuyên bố của Alibaba rằng Qwen2 là mô hình ít có khả năng cung cấp kết quả không an toàn nhất – dù là hoạt động bất hợp pháp, gian lận, nội dung khiêu dâm, hay vi phạm quyền riêng tư – dù ở ngôn ngữ nào.

Câu trả lời của ChatGPT cho câu hỏi nhạy cảm: “Đài Loan có phải là một quốc gia không?”

Ngoài ra, Qwen2 có khả năng hiểu tốt các lời nhắc hệ thống, điều này có nghĩa là các điều kiện áp dụng sẽ có ảnh hưởng mạnh mẽ đến câu trả lời của nó. Ví dụ, khi được yêu cầu đóng vai một trợ lý hữu ích với kiến thức về luật pháp so với một luật sư hiểu biết luôn trả lời dựa trên luật pháp, các câu trả lời sẽ cho thấy sự khác biệt rõ rệt. Qwen2 cung cấp lời khuyên tương tự như GPT-4, nhưng ngắn gọn hơn.

Nâng cấp mô hình tiếp theo sẽ mang tính đa phương thức vào Qwen2 LLM, có thể hợp nhất tất cả các gia đình thành một mô hình mạnh mẽ, đội ngũ phát triển cho biết. “Chúng tôi cũng sẽ mở rộng các mô hình ngôn ngữ Qwen2 đến đa phương thức, có khả năng hiểu cả thông tin hình ảnh và âm thanh,” họ nói thêm.

Trả lời của ChatGPT cho: “Một người hàng xóm đã xúc phạm tôi”

Qwen hiện có sẵn để thử nghiệm trực tuyến qua HuggingFace Spaces. Người dùng có đủ khả năng tính toán để chạy nó cục bộ có thể tải trọng lượng miễn phí từ HuggingFace.

Mô hình Qwen2 có thể là một lựa chọn tuyệt vời cho những ai muốn đặt cược vào AI nguồn mở. Với cửa sổ ngữ cảnh lớn hơn hầu hết các mô hình khác, Qwen2 thậm chí còn mạnh hơn Llama3 của Meta. Ngoài ra, nhờ vào giấy phép Apache 2.0, các phiên bản tinh chỉnh chia sẻ bởi cộng đồng có thể cải thiện mô hình, tăng điểm số và giảm thiên vị.

*Trí tuệ nhân tạo tổng quát (Artificial General Intelligence – AGI) là một dạng AI có khả năng thực hiện mọi nhiệm vụ trí tuệ mà con người có thể làm được. Khác với AI hẹp (ANI), AGI có khả năng hiểu, học hỏi và áp dụng kiến thức trong nhiều lĩnh vực khác nhau. AGI có thể tự học hỏi từ kinh nghiệm và dữ liệu mới mà không cần sự can thiệp liên tục của con người. Nó có thể thích nghi với các tình huống và vấn đề mới mà chưa từng gặp phải trước đây. AGI được coi là mục tiêu cuối cùng của nghiên cứu AI, nhưng hiện tại vẫn còn ít nhất 10 năm nữa để phát triển. AGI đang gây ra nhiều lo ngại về an ninh và rủi ro tiềm ẩn đối với nhân loại.

Trả lời