Đây là lần đầu tiên sau khoảng sáu năm, OpenAI công bố hai mô hình mới với mã nguồn mở, cho phép người dùng tải xuống miễn phí và vận hành trực tiếp trên máy tính hoặc laptop của mình. Mô hình cuối cùng được mở mã nguồn là GPT-2 vào năm 2019.
OpenAI vừa công bố phát hành gpt-oss-120b và gpt-oss-20b, hai mô hình mã nguồn mở có thể được tải về miễn phí và sử dụng trực tiếp trên hệ thống cá nhân. Đây là lần đầu tiên công ty tung ra một phiên bản mã nguồn mở kể từ khi GPT-2 được ra mắt vào năm 2019.
Mô hình gpt-oss-120b sở hữu 117 tỷ tham số và yêu cầu 80GB VRAM để có thể vận hành. Trong khi đó, phiên bản nhỏ hơn mang tên gpt-oss-20b, với 21 tỷ tham số, có thể chạy trên một GPU đơn với 16GB VRAM. Cả hai mô hình này đều được phát hành dưới giấy phép Apache 2.0, cho phép linh hoạt trong việc sử dụng.
Theo thông tin từ OpenAI, “việc phát hành lần này đánh dấu một bước tiến quan trọng trong cam kết của chúng tôi đối với cộng đồng mã nguồn mở, phù hợp với sứ mệnh đã được đặt ra là mang lại lợi ích từ AI đến gần hơn với mọi người”. Công ty hy vọng rằng các mô hình này sẽ trở thành công cụ sẵn có và hiệu quả cho các nhà phát triển, nhà nghiên cứu và doanh nghiệp.
Mô hình gpt-oss-120b đã đạt được 2622 điểm trong bài kiểm tra mã hóa trên Codeforces khi sử dụng công cụ, gần tương đương với hai mô hình o3 và o4-mini của OpenAI, và vượt qua o3-mini trong cả hai bài thi, đạt 2643 điểm ở chế độ không sử dụng công cụ.
Mô hình gpt-oss-20b đã đạt 2516 điểm khi có sử dụng công cụ, cho thấy hiệu suất tương đương với o3 và o4-mini, và 2230 điểm khi không có công cụ, chỉ cao hơn một chút so với o3-mini. OpenAI cũng cho biết rằng gpt-oss-120b hoạt động tốt hơn o4-mini trong các bài kiểm tra liên quan đến sức khỏe và toán học, trong khi gpt-oss-20b nhỉnh hơn o3-mini.