Chuyên gia công nghệ lý giải vì sao DeepSeek AI 'tốt và rẻ'
(VNF) - Trong bối cảnh công nghệ trí tuệ nhân tạo (AI) ngày càng phát triển mạnh mẽ, DeepSeek AI đã nổi lên như một công cụ đột phá, gây ấn tượng với khả năng vượt trội và chi phí đầu tư thấp.
- DeepSeek: 'Quả bom' từ Trung Quốc 'oanh tạc' giới AI toàn cầu 28/01/2025 10:45
DeepSeek, một AI nhỏ của Trung Quốc đã gây chấn động ngành công nghệ toàn cầu với mô hình AI mã nguồn mở DeepSeek-R1, cạnh tranh trực tiếp với các sản phẩm như ChatGPT của OpenAI và Gemini của Alphabet. Mô hình này không chỉ miễn phí cho người dùng mà còn có chi phí phát triển thấp, chỉ khoảng 6 triệu USD, so với hơn 100 triệu USD của GPT-4.

Bảng điểm so sánh về hiệu xuất của ChatGPT, Cloude Snnet và DeepSeek. Ảnh: FBNV
Mới đây, trên trang cá nhân, doanh nhân Đỗ Cao Bảo - Đồng sáng lập, thành viên HĐQT tập đoàn FPT đã có những phân tích về 'ngựa chiến' AI của Trung Quốc này.
"Trong một loạt các bài kiểm tra điểm chuẩn của bên thứ ba, mô hình của DeepSeek vượt trội so với GPT-4o của OpenAI và Claude Sonnet 3.5 của Anthropic về độ chính xác, từ giải quyết vấn đề phức tạp đến Toán học và mã hóa, trên cả ngôn ngữ tiếng Trung lẫn tiếng Anh.
Hơn nữa, DeepSeek được phát triển trên mô hình mã nguồn mở thực hiện tính toán với thời gian suy luận hiệu quả. Chính CEO Microsoft Satya Nadella, tại Devos (Thuỵ Sĩ) đã phải đưa ra cảnh báo "Chúng ta nên xem xét sự phát triển của Trung Quốc rất, rất nghiêm túc".
Một số chuyên gia công nghệ đánh giá “Deepseek V3, là một mô hình tốt đến mức đánh bại GPT-4o và Claude-3.5-Sonnet, hai mô hình độc quyền tốt nhất hiện có. Do đó, Deepseek V3 là mô hình mã nguồn mở tốt nhất hiện có", ông viết.
Lý do nào khiến DeepSeek tốt và rẻ?
Doanh nhân Đỗ Cao Bảo đặt câu hỏi: "Làm cách nào để AI Trung Quốc dù đi sau Mỹ rất nhiều năm, trong bối cảnh “thiếu chip, thiếu tiền, thiếu dữ liệu và môi trường” lại tạo ra một hệ AI tổng quát (GAI) có thể vượt trội so với những mô hình AI tốt nhất của Mỹ, không những thế chi phí đầu tư lại thấp hơn ít nhất 53,5 lần OpenAI?".
Lãnh đạo của FPT dẫn câu chuyện của Liang Wenfeng, phụ trách quỹ đầu tư Định lượng Trung Quốc khi tập hợp nhân sự cho DeepSeek, ông không tìm kiếm các chuyên gia AI có kinh nghiệm, không tìm kiếm những người được đào tạo và làm việc ở nước ngoài, ông tập trung vào những nghiên cứu sinh từ các trường đại học hàng đầu Trung Quốc, bao gồm Đại học Bắc Kinh và Thanh Hoa, những người mong muốn chứng tỏ bản thân (hơn là mục tiêu tạo ra sản phẩm để làm giàu), đã giành được giải thưởng tại các hội nghị học thuật quốc tế. Chiến lược tuyển dụng này đã giúp tạo ra văn hóa công ty hợp tác, nơi mọi người được tự do sử dụng nhiều tài nguyên máy tính, trái ngược với văn hóa cạnh tranh tài nguyên của các công ty Internet lâu đời của Trung Quốc.
Hơn nữa, Liang cho rằng sinh viên phù hợp hơn với việc nghiên cứu đầu tư cao, lợi nhuận thấp, bởi với những người trẻ họ có thể cống hiến hoàn toàn cho một sứ mệnh cao cả mà không thực dụng. Liang đã đặt ra sứ mệnh cho những sinh viên tài năng trẻ: “Deep Seek được tạo ra để giải quyết những bài toán khó nhất thế giới.
Liang cũng truyền cho các bạn trẻ tinh thần yêu nước, mong muốn vượt qua các rào cản về bao vây, cấm vận công nghệ của Mỹ đối với Trung Quốc, cam kết thúc đẩy vị trí của Trung Quốc trong việc dẫn đầu đổi mới, sáng tạo trên toàn cầu.
Doanh nhân Đỗ Cao Bảo nhấn mạnh thêm, vào tháng 10/2022, Trung Quốc bị cấm nhập khẩu chip tiên tiến như H100 của Nvidia, chính vì vậy, DeepSeek phải đưa ra một phương pháp luận hiệu quả hơn để đào tạo các mô hình AI của mình, họ đã tối ưu hóa kiến trúc mô hình AI bằng cách sử dụng một loạt thủ thuật kỹ thuật, các sơ đồ giao tiếp tùy chỉnh giữa các con chip, giảm kích thước các trường dữ liệu để tiết kiệm bộ nhớ, yêu cầu sử dụng ít tài nguyên máy tính hơn để đào tạo, sử dụng sáng tạo bằng cách kết hợp các mô hình AI khác nhau.
“Nhiều cách tiếp cận này tuy không phải là mới, nhưng kết hợp chúng thành công để tạo ra một mô hình AI tiên tiến trong một khoảng thời gian cực ngắn, với chi phí cực rẻ là một kỳ tích”, ông Đỗ Cao Bảo nhận định.
Theo lãnh đạo FPT, việc phát triển các mô hình AI mã nguồn mở là cách duy nhất để Trung Quốc bắt kịp Mỹ, bởi nó thu hút nhiều người dùng và nhiều người đóng góp hơn vào kho mã nguồn mở AI. Kết quả là các nhà nghiên cứu AI Trung Quốc đã đạt được điều mà nhiều người nghĩ là cách nhiều năm ánh sáng: Một mô hình AI mã nguồn mở, miễn phí có thể sánh ngang hoặc vượt qua hiệu suất của các hệ thống suy luận tiên tiến nhất của OpenAI.
Chính vì là mô hình AI mã nguồn mở nên DeepSeek cho phép bất kỳ ai cũng có thể lấy mô hình, sử dụng và sửa đổi nó mà không bị hạn chế. Điều đó đồng nghĩa với việc DeepSeek thực sự mở trao quyền cho tất cả những người phát triển AI trên toàn cầu.

DeepSeek và 2 mặt của vấn đề
Sự xuất hiện của DeepSeek đánh dấu một bước ngoặt quan trọng trong cuộc đua AI toàn cầu, mở ra cơ hội cho việc phát triển AI hiệu quả và chi phí thấp hơn, đồng thời đặt ra thách thức mới cho các công ty công nghệ lớn.
Tuy nhiên, bên cạnh những ưu điểm vượt trội về chi phí và hiệu suất, một vấn đề quan trọng được nhiều chuyên gia và người dùng quan tâm về DeepSeek AI chính là tính bảo mật thông tin. Với việc ứng dụng công nghệ AI mạnh mẽ, những hệ thống AI như DeepSeek có thể xử lý và phân tích lượng dữ liệu khổng lồ, bao gồm cả thông tin nhạy cảm.
Một số lo ngại chính bao gồm việc liệu dữ liệu người dùng có được bảo vệ một cách nghiêm ngặt hay không, đặc biệt khi AI có thể tiếp cận và xử lý thông tin cá nhân mà không có sự giám sát đầy đủ. Các chuyên gia về bảo mật cảnh báo rằng, việc AI bị lợi dụng để thu thập hoặc tiết lộ dữ liệu cá nhân mà không có sự đồng ý có thể dẫn đến những hệ quả nghiêm trọng, từ việc xâm phạm quyền riêng tư đến việc mất kiểm soát thông tin cá nhân.
Ngoài ra, với sự phổ biến và khả năng lan rộng nhanh chóng của DeepSeek AI, các mối lo ngại về việc sử dụng AI để giám sát và các mục đích khác cũng là một vấn đề lớn cần được giải quyết. Các biện pháp bảo mật và kiểm soát quyền truy cập vào dữ liệu là điều cần thiết.
Ngoài ra, DeepSeek cũng đối mặt với lo ngại về việc tuân thủ các quy định kiểm duyệt của Trung Quốc, khi mô hình này tránh đề cập đến các chủ đề nhạy cảm như nhân quyền và Đài Loan. Vấn đề chấp nhận và cân nhắc sử dụng vẫn thuộc quyền của mỗi người.
‘Bóc trần’ DeepSeek Trung Quốc: ‘Chưng cất’ công nghệ Mỹ, độ chính xác chỉ 17%?
Khu biệt thự tiền tỷ hoang vắng trên vành đai 4 - Thủ đô
(VNF) - Nhiều căn biệt thự, liền kề thuộc dự án HUD Me Linh Central tại huyện Mê Linh, thành phố Hà Nội có giá hàng chục tỷ đồng nhưng đang bị "bỏ không" một cách lãng phí.