OpenAI ra mắt mô hình có 'trình độ tiến sĩ', GPT đã lỗi thời?

Quốc Anh - 15/09/2024 08:00 (GMT+7)

(VNF) - OpenAI vừa công bố mô hình mang tên o1 có khả năng lý luận giúp người dùng giải quyết các vấn đề khó. Đây là công nghệ tách biệt hoàn toàn khỏi dòng GPT mà công ty đang phát triển.

Trước đó, OpenAI đã tạo ra một cơn sốt tại Thung lũng Silicon khi ra mắt dòng GPT-4 vào đầu năm 2023, sau đó được nâng cấp lên thành GPT-4o vào tháng 5 năm nay. Theo chuyên gia, GPT-4o thông minh và có khả năng suy nghĩ giống con người đến mức không tưởng.

Thế nhưng, GPT đến nay lại đứng trước nguy cơ bị một dòng sản phẩm hoàn toàn mới của OpenAI vượt mặt.

Đâu là điểm vượt trội?

Dòng AI “o1” bắt đầu với 2 mô hình là o1-preview và o1-mini được công bố trên trang web của OpenAI vào ngày 12/9 vừa qua. Theo mô tả của công ty, o1 được ra đời với mục đích lập luận thông qua các tác vụ phức tạp và giải quyết các vấn đề khó hơn so với các dòng GPT.

OpenAI tuyên bố dòng o1 mới đặc biệt phù hợp với những người dùng đang gặp phải các vấn đề phức tạp trong các lĩnh vực như khoa học, chăm sóc sức khỏe và công nghệ.

o1 có thể giúp các nhà vật lý tạo ra các công thức toán học cho quang học lượng tử, hay hỗ trợ các nhà nghiên cứu giải trình tự tế bào… Các nhà phát triển cũng nhận ra rằng mô hình o1-mini đặc biệt hiệu quả trong việc xây dựng và thực hiện các quy trình có nhiều bước như gỡ lỗi mã và giải quyết các vấn đề lập trình.

Trong một vài khía cạnh, mô hình o1 vượt trội hơn hẳn GPT-4o

Tuy được giới thiệu là vượt trội hơn so với dòng GPT, OpenAI cũng đưa ra cảnh báo rằng o1 chỉ mới được phát triển và có thể chưa có nhiều tính năng tiện dùng cho người dùng như duyệt web để tìm thông tin, hay tải tệp và hình ảnh lên trang. Trong một vài trường hợp, thậm chí GPT-4o sẽ phục vụ người dùng tốt hơn.

o1-preview đạt "trình độ tiến sĩ"

Mô hình o1-preview được OpenAI thiết kế để xử lý các nhiệm vụ cần “sử dụng đầu óc”. Mô hình này có thể mất thời gian khi đưa ra phản hồi vì cần suy nghĩ và tinh chỉnh câu trả lời, thậm chí tự sửa lỗi của chính mình, tương tự như cách con người tiếp cận một vấn đề phức tạp.

Trong một cuộc thử nghiệm, o1-preview được đánh giá là có thể hoạt động ở mức gần như tương đương trình độ của một tiến sĩ trong vài lĩnh vực như vật lý, hóa học và sinh học.

o1-preview có trình độ tương đương tiến sĩ trong vài lĩnh vực

Tại kỳ thi tuyển chọn Olympic Toán học quốc tế (IMO), o1-preview đã chứng minh được năng lực của mình khi giải được 83% số bài toán, vượt trội hơn hẳn so với tỷ lệ 13% của phiên bản GPT-4o.

Hiện tại, phiên bản đã có sẵn để sử dụng trong ChatGPT bởi người dùng Plus và Team, với người dùng Enterprise và Edu sẽ có quyền truy cập vào tuần tới.

o1-mini giá “mềm” hơn

Cùng với o1-preview, OpenAI cũng ra mắt mô hình o1-mini, một phiên bản hợp lý hơn khi được thiết kế để cung cấp khả năng suy luận nhanh hơn nhưng giá thành lại rẻ hơn.

Mặc dù được tối ưu hóa chủ yếu cho các tác vụ mã hóa và STEM, o1-mini vẫn mang lại hiệu suất mạnh mẽ, đặc biệt là trong toán học và lập trình.

Trên chuẩn toán IMO, o1-mini đạt 70%, chưa bằng o1-preview nhưng chi phí phải chăng hơn rất nhiều. o1-mini sở hữu mức giá thấp hơn 80% so với o1-preview, mô hình này chủ yếu hướng đến các nhà phát triển và nhà nghiên cứu cần khả năng suy luận nhưng không cần kiến ​​thức quá sâu rộng.

Giải pháp tiết kiệm này có sẵn cho người dùng ChatGPT Plus, Team, Enterprise và Edu. Trong tương lai, dự kiến 01-mini sẽ mở rộng quyền truy cập cho cả người dùng ChatGPT Free.

Người dùng ChatGPT Enterprise và Edu sẽ sớm được trải nghiệm đầy đủ 2 mô hình o1

Cả hai mô hình mới này đều kết hợp phương pháp đào tạo an toàn, nhằm tuân thủ các hướng dẫn về an toàn và liên kết.

o1-preview thậm chí còn đạt số điểm ấn tượng là 84 điểm khi thực hiện một trong những bài kiểm tra bẻ khóa khó nhất của OpenAI, trong khi GPT-4o chỉ đạt 22 điểm. Khả năng suy luận và xử lý linh hoạt từng tình huống theo ngữ cảnh của o1 sẽ giúp mô hình xử lý tốt hơn những vấn đề về an toàn và tránh tạo ra những nội dung không phù hợp.

Mặc dù các mô hình o1-preview và o1-mini được đánh giá là phiên bản cải tiến vượt trội, song OpenAI khẳng định rằng đây chỉ là bước thử nghiệm ban đầu. Công ty cũng cho biết sẽ tiếp tục phát triển song song cả dòng GPT và o1 nhằm mở rộng khả năng của AI trong nhiều lĩnh vực khác nhau, phù hợp với nhiều đối tượng người dùng.

Theo OpenAI, VentureBeat, Maginative
Cùng chuyên mục
Tranh chấp ở Khu đô thị số 11, Quảng Nam rà soát xác định chủ đầu tư

Tranh chấp ở Khu đô thị số 11, Quảng Nam rà soát xác định chủ đầu tư

(VNF) - UBND tỉnh Quảng Nam rà soát, báo cáo các nội dung liên quan đến dự án Khu đô thị số 11 tại Đô thị mới Điện Nam - Điện Ngọc.

Khu đô thị 'VIP' nhất Hà Nội: Cứ mưa là ngập, giá nhà vài trăm tỷ mỗi căn

Khu đô thị 'VIP' nhất Hà Nội: Cứ mưa là ngập, giá nhà vài trăm tỷ mỗi căn

(VNF) - Tại Khu đô thị Ciputra, đoạn đường đi vào khu đô thị ngập sâu trong nhiều ngày, gây khó khăn cho phương tiện giao thông qua lại. Trong khi, giá biệt thự, liền kề tại đây thường rao bán vài trăm tỷ đồng/căn.

DN rượu bia đối mặt cú sốc chưa từng có

DN rượu bia đối mặt cú sốc chưa từng có

(VNF) - Nhấn mạnh quan điểm việc tăng thuế với đồ uống có cồn là “cú sốc chưa từng có”, các chuyên gia cho rằng các doanh nghiệp sản xuất bia, rượu sẽ lâm vào cảnh “khó chồng khó”.

'Công chúa mía đường' muốn thoái sạch vốn khỏi công ty anh trai làm sếp

'Công chúa mía đường' muốn thoái sạch vốn khỏi công ty anh trai làm sếp

(VNF) - Bà Đặng Huỳnh Ức My, còn được biết tới với biệt danh là "công chúa mía đường", vừa đăng ký bán toàn bộ cổ phiếu đang nắm giữ tại TTC Land, công ty do anh trai Đặng Hồng Anh làm Phó chủ tịch HĐQT.

Thực hư: Một cuộc gọi lạ đánh cắp tài khoản ngân hàng trong 3 giây

Thực hư: Một cuộc gọi lạ đánh cắp tài khoản ngân hàng trong 3 giây

(VNF) - Theo Công an tỉnh Đồng Nai, thông tin lan truyền gần đây về việc đánh cắp tài khoản ngân hàng từ những cuộc gọi lạ chỉ trong trong 3 giây là thông tin giả, sai sự thật.

Phú Thọ đề xuất xây cầu Phong Châu mới 865 tỷ đồng

Phú Thọ đề xuất xây cầu Phong Châu mới 865 tỷ đồng

(VNF) - Sau sự cố sập cầu Phong Châu, Phú Thọ đề xuất Chính phủ hỗ trợ xây cầu mới thay thế cầu Phong Châu vừa bị sập có quy mô hiện đại với tổng vốn đầu tư hơn 865 tỷ đồng.

Khách sạn Lụa Hội An bị rao bán 240 tỷ đồng để siết nợ

Khách sạn Lụa Hội An bị rao bán 240 tỷ đồng để siết nợ

(VNF) - VietinBank có thông báo về việc lựa chọn tổ chức bán đấu giá tài sản của Công ty TNHH Khách sạn Lụa Hội An với giá 240 tỷ đồng

Tiêu thụ 8,1 tỷ gói mì: Việt Nam số 1 thế giới

Tiêu thụ 8,1 tỷ gói mì: Việt Nam số 1 thế giới

(VNF) - 8,1 tỷ gói mì đã được tiêu thụ tại Việt Nam trong năm 2023, tăng 49% so với năm 2019. Tính bình quân đầu người, Việt Nam đã vươn lên dẫn đầu thế giới về tiêu thụ mì ăn liền.

Cho vay tiêu dùng: Đi qua vùng trũng, còn vương nhiều vết 'bùn'

Cho vay tiêu dùng: Đi qua vùng trũng, còn vương nhiều vết 'bùn'

(VNF) - Sau giai đoạn chững lại, thị trường cho vay tiêu dùng đã bắt đầu phục hồi trở lại với nhiều tín hiệu tích cực. Song, trong triển vọng lạc quan đấy, các tổ chức tín dụng vẫn đang phải đối mặt với rủi ro mang tên nợ xấu.