OpenAI ra mắt mô hình có 'trình độ tiến sĩ', GPT đã lỗi thời?
Quốc Anh -
15/09/2024 08:00 (GMT+7)
(VNF) - OpenAI vừa công bố mô hình mang tên o1 có khả năng lý luận giúp người dùng giải quyết các vấn đề khó. Đây là công nghệ tách biệt hoàn toàn khỏi dòng GPT mà công ty đang phát triển.
Trước đó, OpenAI đã tạo ra một cơn sốt tại Thung lũng Silicon khi ra mắt dòng GPT-4 vào đầu năm 2023, sau đó được nâng cấp lên thành GPT-4o vào tháng 5 năm nay. Theo chuyên gia, GPT-4o thông minh và có khả năng suy nghĩ giống con người đến mức không tưởng.
Thế nhưng, GPT đến nay lại đứng trước nguy cơ bị một dòng sản phẩm hoàn toàn mới của OpenAI vượt mặt.
Đâu là điểm vượt trội?
Dòng AI “o1” bắt đầu với 2 mô hình là o1-preview và o1-mini được công bố trên trang web của OpenAI vào ngày 12/9 vừa qua. Theo mô tả của công ty, o1 được ra đời với mục đích lập luận thông qua các tác vụ phức tạp và giải quyết các vấn đề khó hơn so với các dòng GPT.
OpenAI tuyên bố dòng o1 mới đặc biệt phù hợp với những người dùng đang gặp phải các vấn đề phức tạp trong các lĩnh vực như khoa học, chăm sóc sức khỏe và công nghệ.
o1 có thể giúp các nhà vật lý tạo ra các công thức toán học cho quang học lượng tử, hay hỗ trợ các nhà nghiên cứu giải trình tự tế bào… Các nhà phát triển cũng nhận ra rằng mô hình o1-mini đặc biệt hiệu quả trong việc xây dựng và thực hiện các quy trình có nhiều bước như gỡ lỗi mã và giải quyết các vấn đề lập trình.
Trong một vài khía cạnh, mô hình o1 vượt trội hơn hẳn GPT-4o
Tuy được giới thiệu là vượt trội hơn so với dòng GPT, OpenAI cũng đưa ra cảnh báo rằng o1 chỉ mới được phát triển và có thể chưa có nhiều tính năng tiện dùng cho người dùng như duyệt web để tìm thông tin, hay tải tệp và hình ảnh lên trang. Trong một vài trường hợp, thậm chí GPT-4o sẽ phục vụ người dùng tốt hơn.
o1-preview đạt "trình độ tiến sĩ"
Mô hình o1-preview được OpenAI thiết kế để xử lý các nhiệm vụ cần “sử dụng đầu óc”. Mô hình này có thể mất thời gian khi đưa ra phản hồi vì cần suy nghĩ và tinh chỉnh câu trả lời, thậm chí tự sửa lỗi của chính mình, tương tự như cách con người tiếp cận một vấn đề phức tạp.
Trong một cuộc thử nghiệm, o1-preview được đánh giá là có thể hoạt động ở mức gần như tương đương trình độ của một tiến sĩ trong vài lĩnh vực như vật lý, hóa học và sinh học.
o1-preview có trình độ tương đương tiến sĩ trong vài lĩnh vực
Tại kỳ thi tuyển chọn Olympic Toán học quốc tế (IMO), o1-preview đã chứng minh được năng lực của mình khi giải được 83% số bài toán, vượt trội hơn hẳn so với tỷ lệ 13% của phiên bản GPT-4o.
Hiện tại, phiên bản đã có sẵn để sử dụng trong ChatGPT bởi người dùng Plus và Team, với người dùng Enterprise và Edu sẽ có quyền truy cập vào tuần tới.
o1-mini giá “mềm” hơn
Cùng với o1-preview, OpenAI cũng ra mắt mô hình o1-mini, một phiên bản hợp lý hơn khi được thiết kế để cung cấp khả năng suy luận nhanh hơn nhưng giá thành lại rẻ hơn.
Mặc dù được tối ưu hóa chủ yếu cho các tác vụ mã hóa và STEM, o1-mini vẫn mang lại hiệu suất mạnh mẽ, đặc biệt là trong toán học và lập trình.
Trên chuẩn toán IMO, o1-mini đạt 70%, chưa bằng o1-preview nhưng chi phí phải chăng hơn rất nhiều. o1-mini sở hữu mức giá thấp hơn 80% so với o1-preview, mô hình này chủ yếu hướng đến các nhà phát triển và nhà nghiên cứu cần khả năng suy luận nhưng không cần kiến thức quá sâu rộng.
Giải pháp tiết kiệm này có sẵn cho người dùng ChatGPT Plus, Team, Enterprise và Edu. Trong tương lai, dự kiến 01-mini sẽ mở rộng quyền truy cập cho cả người dùng ChatGPT Free.
Người dùng ChatGPT Enterprise và Edu sẽ sớm được trải nghiệm đầy đủ 2 mô hình o1
Cả hai mô hình mới này đều kết hợp phương pháp đào tạo an toàn, nhằm tuân thủ các hướng dẫn về an toàn và liên kết.
o1-preview thậm chí còn đạt số điểm ấn tượng là 84 điểm khi thực hiện một trong những bài kiểm tra bẻ khóa khó nhất của OpenAI, trong khi GPT-4o chỉ đạt 22 điểm. Khả năng suy luận và xử lý linh hoạt từng tình huống theo ngữ cảnh của o1 sẽ giúp mô hình xử lý tốt hơn những vấn đề về an toàn và tránh tạo ra những nội dung không phù hợp.
Mặc dù các mô hình o1-preview và o1-mini được đánh giá là phiên bản cải tiến vượt trội, song OpenAI khẳng định rằng đây chỉ là bước thử nghiệm ban đầu. Công ty cũng cho biết sẽ tiếp tục phát triển song song cả dòng GPT và o1 nhằm mở rộng khả năng của AI trong nhiều lĩnh vực khác nhau, phù hợp với nhiều đối tượng người dùng.
(VNF) - Giới đầu tư đặt cược tới 90% vào khả năng Fed tiếp tục hạ lãi suất 0,25 điểm phần trăm. Nếu kịch bản này xảy ra, quyết định của Fed có thể tạo ra hiệu ứng lan tỏa mạnh mẽ lên USD, vàng, Bitcoin và toàn bộ thị trường tài chính toàn cầu trong những tháng tới.
(VNF) - Một tòa án Trung Quốc yêu cầu Malaysia Airlines bồi thường 3,3 triệu USD cho gia đình 8 nạn nhân MH370, 11 năm sau ngày chiếc máy bay biến mất bí ẩn.
(VNF) - Cảng thương mại tự do Hải Nam không chỉ là bàn đạp giúp phục hồi kinh tế Trung Quốc, mà còn là biểu tượng cải cách mở cửa của Bắc Kinh trong thời đại mới.
(VNF) - Mới đây, tập đoàn truyền thông Paramount đã đưa ra đề nghị mua lại Warner Bros Discovery với giá 108 tỷ USD, cao hơn so với thỏa thuận 82,7 tỷ trước đó của Netflix.
(VNF) - Lần đầu tiên, thặng dư thương mại của Trung Quốc với phần còn lại của thế giới vượt mốc 1.000 tỷ USD. Con số này đặt ra câu hỏi về hiệu quả các nỗ lực kiềm chế dòng hàng hóa giá rẻ từ Trung Quốc của nhiều nền kinh tế phát triển, đặc biệt là của Tổng thống Mỹ trong nhiệm kỳ hiện tại.
(VNF) - Kỳ vọng Cục Dự trữ liên bang Mỹ (Fed) hạ lãi suất vào ngày 10/12 đang đẩy giá vàng tăng, trong khi giá USD được dự báo sẽ suy yếu trong năm 2026.
(VNF) - Sự hỗn loạn xoay quanh một trong những nhà phát triển bất động sản lớn nhất Trung Quốc đang phơi bày mức độ trầm trọng của cuộc khủng hoảng bất động sản nước này.
(VNF) - Ngân hàng trung ương Nga cho biết giá trị dự trữ vàng của nước này đã lên mức kỷ lục 310 tỷ USD tính đến đầu tháng 12, đưa Moscow trở thành nhà đầu tư vàng lớn thứ năm thế giới.
(VNF) - Theo số liệu công bố ngày 7/12, Ngân hàng trung ương Trung Quốc (PBOC) tiếp tục bổ sung vàng vào kho dự trữ trong tháng 11, nâng chuỗi mua ròng liên tiếp lên 13 tháng.
(VNF) - Tín hiệu thay đổi chính sách từ Ngân hàng Trung ương Nhật Bản gây chấn động thị trường trái phiếu và lan rộng sang châu Âu, đẩy chi phí vay nợ lên cao. Những biến động này khởi tạo một làn sóng dịch chuyển dòng vốn mới, báo hiệu giai đoạn biến động mạnh của kinh tế thế giới trong thời gian tới.
(VNF) - Netflix đạt thỏa thuận chi 72 tỉ đô la Mỹ để mua lại mảng studio và dịch vụ streaming của Warner Bros. Discovery, đơn vị sản xuất loạt phim Harry Potter đình đám.
(VNF) - CEO Nvidia Jensen Huang nhận định dù Mỹ đi trước về chip AI, Trung Quốc lại nắm lợi thế chiến lược ở tốc độ xây dựng hạ tầng và năng lực năng lượng, giúp nước này nhanh chóng thu hẹp khoảng cách trong cuộc đua AI.
(VNF) - Tâm trạng của lãnh đạo có thể ảnh hưởng trực tiếp đến hiệu quả làm việc của nhân viên. Khi lãnh đạo hạnh phúc, nhân viên làm việc với hiệu suất tốt hơn, từ đó tác động tích cực đến giá trị của công ty trên thị trường chứng khoán, một nghiên cứu cho biết.
(VNF) - Năm 2025 ghi dấu một chu kỳ bứt phá hiếm có của vàng, khi kim loại quý liên tục lập đỉnh và trở thành một trong những tài sản sinh lời nhất toàn cầu. Vào những tháng cuối năm, nhiều tổ chức tài chính lớn đồng loạt dự báo vàng sẽ tiếp đà tăng, một số dự báo táo bạo cho rằng vàng có thể đạt 5.000 USD/ounce vào năm 2026.
(VNF) - Dù Nvidia đã vươn lên thành công ty giá trị nhất thế giới, CEO Jensen Huang thừa nhận ông vẫn điều hành doanh nghiệp trong tâm thế “33 ngày nữa sẽ phá sản”. Ông làm việc 7 ngày mỗi tuần và luôn sống trong trạng thái lo âu, nỗi ám ảnh hình thành từ những lần suýt sụp đổ của Nvidia thời kỳ đầu.
(VNF) - Tuần này, nhiều người Trung Quốc bất ngờ trước việc giới chức quyết định đánh thuế các loại thuốc và thiết bị tránh thai, bao gồm bao cao su, như một phần trong nỗ lực đảo ngược tình trạng sụt giảm tỷ lệ sinh.
(VNF) - Tại các cửa hàng pizza trên khắp nước Mỹ, khách hàng đang có xu hướng mua pizza bé hơn, ít topping hơn, không ăn kèm món phụ. Theo New York Times, đây không chỉ là sự thay đổi khẩu vị đơn thuần, mà cho thấy áp lực thắt chặt chi tiêu đang đè nặng lên người tiêu dùng Mỹ.
(VNF) - Mỹ tung ra loạt biện pháp trừng phạt cứng rắn nhất trong nhiều năm, tạo ra áp lực chồng chất lên ngành dầu mỏ, vốn là nguồn thu chủ chốt của Nga. Trong bối cảnh đó, cán cân trên bàn đàm phán cũng bắt đầu có dấu hiệu dịch chuyển theo chiều hướng bất lợi cho Moscow.
(VNF) - Sau nhiều năm gần như không đạt tiến triển trong việc chấm dứt chu kỳ suy thoái bắt đầu từ năm 2021, những khó khăn của ngành bất động sản Trung Quốc tiếp tục trầm trọng hơn.
(VNF) - Trong khi phần lớn các doanh nghiệp cùng ngành đã cơ bản xử lý xong núi nợ, China Vanke lại trở thành một trường hợp khác thường. Nhà phát triển bất động sản có trụ sở tại Thâm Quyến này đang đối mặt nguy cơ vỡ nợ và buộc phải tái cấu trúc.
(VNF) - Ở tuổi 29, Luana Lopes Lara ghi danh trong danh sách tỷ phú tự thân trẻ nhất hành tinh, trở thành biểu tượng nữ doanh nhân mới tại Thung lũng Silicon. Cô dẫn dắt Kalshi, nền tảng thị trường dự đoán được định giá 11 tỷ USD, là kỳ lân tài chính hiếm hoi được liên bang Mỹ cấp phép.
(VNF) - Các ngân hàng Trung Quốc đã mua vào lượng lớn USD trên thị trường giao ngay trong nước trong tuần này và tạm thời giữ số USD đó. Đây được xem là động thái hiếm gặp nhằm kiềm chế đà tăng mạnh của đồng nhân dân tệ (NDT).
(VNF) - Bộ trưởng Năng lượng Indonesia cho biết nước này sẽ thu hồi giấy phép khai thác mỏ nếu phát hiện các doanh nghiệp vi phạm quy định trên đảo Sumatra, nơi đang bị tàn phá nặng nề bởi lũ lụt.
(VNF) - Giới đầu tư đặt cược tới 90% vào khả năng Fed tiếp tục hạ lãi suất 0,25 điểm phần trăm. Nếu kịch bản này xảy ra, quyết định của Fed có thể tạo ra hiệu ứng lan tỏa mạnh mẽ lên USD, vàng, Bitcoin và toàn bộ thị trường tài chính toàn cầu trong những tháng tới.
(VNF) - Dù từng được giao hàng loạt khu “đất vàng” để làm đô thị và thương mại nhưng nhiều năm nay BMC liên tục bị nhắc tên nợ thuế, buộc Cục Thuế TP. Hồ Chí Minh phải áp dụng biện pháp mạnh: ngừng sử dụng hóa đơn. Trong khi đó, loạt dự án lớn của doanh nghiệp tại miền Trung tiếp tục rơi vào tình trạng đình trệ, bỏ hoang kéo dài…