(VNF) - DeepSeek R1 - mô hình AI mã nguồn mở từ một công ty Trung Quốc, đã khiến “ván cờ” trí tuệ nhân tạo toàn cầu thay đổi.
“Khoảnh khắc Sputnik” của AI
Đầu năm 2025, công ty khởi nghiệp Trung Quốc DeepSeek đã gây sốc giới công nghệ khi tiết lộ rằng mô hình DeepSeek R1, một mô hình AI có thể cạnh tranh với công nghệ tốt nhất từ các công ty công nghệ hàng đầu như Microsoft và Google, được xây dựng với chi phí khoảng 6 triệu USD. Con số này nhỏ hơn từ 20 đến 50 lần so với mức chi phí ước tính cho việc huấn luyện GPT-4 hay Gemini.
Sự kiện ra mắt DeepSeek R1 nhanh chóng được giới công nghệ so sánh với “khoảnh khắc Sputnik” của AI — gợi nhớ thời điểm Liên Xô phóng vệ tinh nhân tạo đầu tiên năm 1957, mở ra cuộc chạy đua không gian. Nhưng với lần này, thay vì Mỹ dẫn đầu, Trung Quốc lại là bên khơi mào một bước ngoặt trong cuộc đua AI.
Theo đánh giá của cộng đồng chuyên gia và dữ liệu từ hệ thống đánh giá Chatbot Arena (LMSYS), DeepSeek R1 đã nhanh chóng vươn lên đứng đầu bảng xếp hạng các mô hình mã nguồn mở, vượt qua cả các đối thủ “nặng ký” như Claude 3 Sonnet của Anthropic và Gemini 1.5 Pro của Google.
Việc một mô hình có thể chạy hiệu quả trên phần cứng phổ thông như GPU Nvidia A100 với chi phí đào tạo ước tính chỉ dưới 6 triệu USD khiến giới công nghệ ngỡ ngàng và mở ra cánh cửa cho nhiều đối tượng người dùng mới, từ startup nhỏ đến các tổ chức giáo dục.
Ông Sam Altman, CEO của OpenAI, nhận xét về DeepSeek R1: “Mô hình R1 của DeepSeek thực sự ấn tượng, đặc biệt là với những gì họ có thể cung cấp trong tầm giá”. Trong khi đó, CEO Nvidia Jensen Huang thì cho rằng mô hình này là một “món quà” cho ngành công nghiệp trí tuệ nhân tạo thế giới. Đây được coi là những lời đánh giá công tâm, cho thấy sức mạnh tiềm tàng của mô hình mã nguồn mở này.
Mở ra con đường dễ dàng hơn trong cuộc đua AI toàn cầu
Chiến lược phát hành miễn phí của DeepSeek đánh dấu sự khác biệt lớn trong bối cảnh hiện tại, khi các công ty công nghệ lớn vẫn duy trì các mô hình AI cao cấp với chi phí đắt đỏ và giới hạn quyền truy cập.
Không chỉ vậy, DeepSeek R1 chỉ là một phần trong “chuỗi” các mô hình AI mã nguồn mở nổi bật đến từ Trung Quốc như Qwen (Alibaba), Baichuan, InternLM, và Yi (01.AI). Nhiều mô hình trong số này không chỉ hỗ trợ tiếng Trung mà còn thành thạo tiếng Anh, cho thấy tham vọng tiếp cận thị trường toàn cầu.
“Cơn sốt” mang tên DeepSeek với mô hình R1 khiến nhiều ông lớn trong ngành “đứng ngồi không yên”. Theo đó, các công ty trí tuệ nhân tạo hàng đầu bao gồm OpenAI, Microsoft và Meta đang chuyển sang một quy trình gọi là "chưng cất" trong cuộc đua toàn cầu nhằm tạo ra các mô hình AI rẻ hơn để người tiêu dùng và doanh nghiệp áp dụng.
Kỹ thuật này thực chất chính là “bí kíp” của DeepSeek, khi công ty khởi nghiệp này sử dụng những mô hình ngôn ngữ lớn (LLM) từ các đối thủ khác để đào tạo ra các mô hình nhỏ hơn với chi phí nhỏ hơn rất nhiều. Quy trình đào tạo này được gọi là “chưng cất” vì các mô hình AI mới rất nhanh chóng tiếp thu được những tinh hoa kiến thức và dự đoán từ LLM.
Mặc dù chưng cất đã được sử dụng rộng rãi trong nhiều năm, nhưng những tiến bộ gần đây đã khiến các chuyên gia trong ngành tin rằng quy trình này sẽ ngày càng mang lại lợi ích cho các công ty khởi nghiệp đang nỗ lực tối ưu chi phí để xây dựng các ứng dụng dựa trên công nghệ này.
“Chưng cất khá kỳ diệu. Về cơ bản, đó là quá trình lấy một mô hình lớn rất thông minh và sử dụng mô hình đó để dạy một mô hình nhỏ hơn. Hình thức này rất có tiềm năng trong các nhiệm vụ cụ thể, siêu rẻ và siêu nhanh để thực hiện”, ông Olivier Godement, giám đốc sản phẩm của nền tảng OpenAI, cho biết.
Còn ông David Cox, phó chủ tịch phụ trách mô hình AI tại IBM Research, cho biết hầu hết các doanh nghiệp không cần một mô hình khổng lồ để vận hành sản phẩm của họ và những mô hình tinh gọn đã đủ mạnh cho các mục đích như chatbot dịch vụ khách hàng hoặc chạy trên các thiết bị nhỏ hơn như điện thoại.
Không lâu sau sự ra đời của DeepSeek R1, OpenAI cho ra mắt GPT-4o – phiên bản rút gọn, đa phương thức và có giá thành thấp hơn. Google cũng tung ra Gemini 1.5 Flash – mô hình nhẹ, tập trung tối ưu hóa hiệu năng.
Các AI đắt đỏ sắp “hết thời”?
Trước đây, các mô hình ngôn ngữ lớn như GPT-4 của OpenAI, Gemini của Google và Llama của Meta đòi hỏi lượng dữ liệu và sức mạnh tính toán khổng lồ để phát triển và duy trì. Mặc dù các công ty chưa tiết lộ số liệu chính xác về chi phí đào tạo các mô hình lớn, con số có khả năng lên tới hàng trăm triệu USD. Nhưng nhờ “chưng cất”, các nhà phát triển và doanh nghiệp có thể tiếp cận các khả năng của các mô hình này với mức giá chỉ bằng một phần nhỏ, cho phép các nhà phát triển ứng dụng chạy các mô hình AI nhanh chóng trên các thiết bị như máy tính xách tay và điện thoại thông minh.
Điều đó đặt ra thách thức cho nhiều mô hình kinh doanh của các công ty AI hàng đầu, đồng thời cũng đặt ra câu hỏi về lợi thế của người đi đầu trong việc xây dựng LLM khi khả năng của họ có thể bị sao chép chỉ trong vài tháng.
“Trong một thế giới mà mọi thứ đang diễn ra quá nhanh, tình huống là bạn đã chi ra rất nhiều tiền, làm nhiều quy trình khó khăn, nhưng rồi sau đó phần còn lại sẽ bám sát gót bạn. Vì vậy, đây là một bối cảnh kinh doanh thú vị và khó khăn”, ông David Cox, phó chủ tịch phụ trách mô hình AI tại IBM Research, nhận định.
Tuy nhiên, chưng cất là một quá trình kế thừa và không có “giáo viên” thì cũng sẽ không có “học sinh”. Do đó, nhiều chuyên gia công nghệ cho rằng những dự đoán rằng các mô hình ngôn ngữ lớn đắt đỏ sắp hết thời là hoàn toàn không hợp lý.
Một số chuyên gia nhận định các mô hình được tạo ra từ chưng cất hầu hết đều có hạn chế về khả năng. Chuyên gia Ahmed Awadallah của Microsoft Research cho biết một mô hình chưng cất có thể được thiết kế để rất tốt trong việc tóm tắt email, "nhưng nó thực sự sẽ không tốt ở bất kỳ điều gì khác".
Theo Ông Olivier Godement của OpenAI, các mô hình ngôn ngữ lớn vẫn sẽ cần thiết cho "các nhiệm vụ trí tuệ cao và rủi ro cao" nơi "các doanh nghiệp sẵn sàng trả nhiều tiền hơn cho mức độ chính xác và độ tin cậy cao".
Ông nói thêm rằng các mô hình lớn cũng sẽ cần thiết để khám phá các khả năng mới sau đó có thể được chắt lọc thành các khả năng nhỏ hơn. Tuy nhiên, công ty này cũng muốn ngăn chặn các mô hình lớn của mình khỏi bị chưng cất để đào tạo đối thủ cạnh tranh. OpenAI có các nhóm theo dõi việc sử dụng và có thể xóa quyền truy cập của người dùng mà họ nghi ngờ đang tạo ra lượng dữ liệu khổng lồ để xuất và đào tạo đối thủ cạnh tranh, như họ đã làm với các tài khoản mà họ tin là có liên kết với DeepSeek.
Dù còn nhiều tranh cãi xung quanh giới hạn của mô hình chưng cất và các vấn đề sở hữu trí tuệ, làn sóng AI giá rẻ do DeepSeek khởi xướng đã đặt ra một tiền lệ quan trọng: năng lực AI mạnh không nhất thiết phải đi kèm chi phí khổng lồ. Điều này không chỉ mở rộng cơ hội tiếp cận công nghệ cho các doanh nghiệp nhỏ và các tổ chức giáo dục, mà còn buộc những gã khổng lồ công nghệ phải điều chỉnh chiến lược để thích nghi với một cuộc chơi đang thay đổi nhanh chóng.
(VNF) - Ở tuổi 27, CEO của nền tảng thị trường dự đoán Polymarket Shayne Coplan đã trở thành tỷ phú tự thân trẻ nhất thế giới khi công ty được định giá 9 tỷ USD. Hành trình của chàng trai bỏ học để xây dựng startup trong phòng tắm đến gương mặt nổi bật ngành crypto toàn cầu phản ánh sức mạnh của ý tưởng táo bạo, trí tuệ đám đông và bước chuyển mình của cả một lĩnh vực công nghệ.
(VNF) - Các chuyên gia quốc tế nhận định thị trường chứng khoán Việt Nam đã bùng nổ trong năm 2025, và dư địa tăng trưởng còn rất rộng mở trong thời gian tới.
(VNF) - Mexico nâng thuế nhập khẩu lên 50% khiến Trung Quốc phản ứng gay gắt, gọi đây là hành động bảo hộ “mang tính xúc phạm” và cảnh báo tác động tiêu cực tới thương mại song phương.
(VNF) - Trung Quốc ghi nhận thặng dư thương mại kỷ lục 1.000 tỷ USD, đặt ra câu hỏi liệu sức mạnh xuất khẩu có che giấu những điểm yếu ngày càng lớn của nền kinh tế hay không?
(VNF) - Sau tin Cục Dự trữ Liên bang Mỹ (Fed) hạ lãi suất, Phố Wall tăng điểm mạnh. Trong khi đó, giá vàng cũng bật tăng nhưng cuối cùng vẫn quay trở về vùng 4.205 USD/ounce, gần như không đổi so với trước đó.
(VNF) - Tổng thống Mỹ Donald Trump ngày 10/12 cho rằng quyết định mới nhất của Cục Dự trữ Liên bang Mỹ (Fed) về việc hạ lãi suất chuẩn thêm 0,25 điểm phần trăm là chưa đủ mà lẽ ra phải “mạnh tay gấp đôi”.
(VNF) - Cục Dự trữ Liên bang Mỹ (Fed) đã cắt giảm lãi suất xuống mức thấp nhất trong vòng 3 năm sau một cuộc họp căng thẳng, phơi bày những rạn nứt sâu sắc giữa các nhà hoạch định chính sách về việc nên ưu tiên xử lý thị trường lao động suy yếu hay lạm phát vẫn ở mức cao.
(VNF) - Giới đầu tư đặt cược tới 90% vào khả năng Fed tiếp tục hạ lãi suất 0,25 điểm phần trăm. Nếu kịch bản này xảy ra, quyết định của Fed có thể tạo ra hiệu ứng lan tỏa mạnh mẽ lên USD, vàng, Bitcoin và toàn bộ thị trường tài chính toàn cầu trong những tháng tới.
(VNF) - Thặng dư thương mại kỷ lục của Trung Quốc một lần nữa phơi bày sức mạnh công nghiệp của nền kinh tế lớn thứ hai thế giới, đồng thời phản ánh mức độ mất cân đối đang gia tăng trong cấu trúc tăng trưởng của nước này.
(VNF) - Thỏa thuận thương mại giữa Indonesia và Washington đang đối mặt nguy cơ sụp đổ khi các quan chức Mỹ ngày càng thất vọng trước điều họ cho là Jakarta "bội ước" những điều khoản đã thống nhất hồi tháng 7.
(VNF) - Bạc đang cạnh tranh quyết liệt với vàng. Kim loại quý này đã tăng giá hơn gấp đôi kể từ đầu năm và vừa lập kỷ lục mới trong ngày 9/12 khi lần đầu tiên vượt mốc 60 USD/ounce trên Sàn giao dịch hàng hóa New York. Tính từ đầu năm 2025, giá bạc đã tăng 102% bỏ xa vàng khi “chỉ” tăng 59%.
(VNF) - Một vụ hỏa hoạn nghiêm trọng bùng phát tại tòa nhà văn phòng ở trung tâm Jakarta khiến ít nhất 22 người thiệt mạng, trong đó có một phụ nữ mang thai. Lực lượng chức năng Indonesia huy động hàng trăm nhân viên cùng gần 30 xe chữa cháy để dập lửa, song thiệt hại về người vẫn ở mức đặc biệt nghiêm trọng.
(VNF) - Một tòa án Trung Quốc yêu cầu Malaysia Airlines bồi thường 3,3 triệu USD cho gia đình 8 nạn nhân MH370, 11 năm sau ngày chiếc máy bay biến mất bí ẩn.
(VNF) - Cảng thương mại tự do Hải Nam không chỉ là bàn đạp giúp phục hồi kinh tế Trung Quốc, mà còn là biểu tượng cải cách mở cửa của Bắc Kinh trong thời đại mới.
(VNF) - Mới đây, tập đoàn truyền thông Paramount đã đưa ra đề nghị mua lại Warner Bros Discovery với giá 108 tỷ USD, cao hơn so với thỏa thuận 82,7 tỷ trước đó của Netflix.
(VNF) - Lần đầu tiên, thặng dư thương mại của Trung Quốc với phần còn lại của thế giới vượt mốc 1.000 tỷ USD. Con số này đặt ra câu hỏi về hiệu quả các nỗ lực kiềm chế dòng hàng hóa giá rẻ từ Trung Quốc của nhiều nền kinh tế phát triển, đặc biệt là của Tổng thống Mỹ trong nhiệm kỳ hiện tại.
(VNF) - Kỳ vọng Cục Dự trữ liên bang Mỹ (Fed) hạ lãi suất vào ngày 10/12 đang đẩy giá vàng tăng, trong khi giá USD được dự báo sẽ suy yếu trong năm 2026.
(VNF) - Sự hỗn loạn xoay quanh một trong những nhà phát triển bất động sản lớn nhất Trung Quốc đang phơi bày mức độ trầm trọng của cuộc khủng hoảng bất động sản nước này.
(VNF) - Ngân hàng trung ương Nga cho biết giá trị dự trữ vàng của nước này đã lên mức kỷ lục 310 tỷ USD tính đến đầu tháng 12, đưa Moscow trở thành nhà đầu tư vàng lớn thứ năm thế giới.
(VNF) - Theo số liệu công bố ngày 7/12, Ngân hàng trung ương Trung Quốc (PBOC) tiếp tục bổ sung vàng vào kho dự trữ trong tháng 11, nâng chuỗi mua ròng liên tiếp lên 13 tháng.
(VNF) - Tín hiệu thay đổi chính sách từ Ngân hàng Trung ương Nhật Bản gây chấn động thị trường trái phiếu và lan rộng sang châu Âu, đẩy chi phí vay nợ lên cao. Những biến động này khởi tạo một làn sóng dịch chuyển dòng vốn mới, báo hiệu giai đoạn biến động mạnh của kinh tế thế giới trong thời gian tới.
(VNF) - Netflix đạt thỏa thuận chi 72 tỉ đô la Mỹ để mua lại mảng studio và dịch vụ streaming của Warner Bros. Discovery, đơn vị sản xuất loạt phim Harry Potter đình đám.
(VNF) - CEO Nvidia Jensen Huang nhận định dù Mỹ đi trước về chip AI, Trung Quốc lại nắm lợi thế chiến lược ở tốc độ xây dựng hạ tầng và năng lực năng lượng, giúp nước này nhanh chóng thu hẹp khoảng cách trong cuộc đua AI.
(VNF) - Ở tuổi 27, CEO của nền tảng thị trường dự đoán Polymarket Shayne Coplan đã trở thành tỷ phú tự thân trẻ nhất thế giới khi công ty được định giá 9 tỷ USD. Hành trình của chàng trai bỏ học để xây dựng startup trong phòng tắm đến gương mặt nổi bật ngành crypto toàn cầu phản ánh sức mạnh của ý tưởng táo bạo, trí tuệ đám đông và bước chuyển mình của cả một lĩnh vực công nghệ.