Liang Wenfeng - gương mặt mới của giới AI đứng sau DeepSeek Trung Quốc

Hoàng Minh - 30/01/2025 17:00 (GMT+7)

(VNF) - Đối thủ Trung Quốc mới nhất trong thế giới AI - DeepSeek đã tạo ra một cơn sóng lớn trong ngành công nghệ toàn cầu. Chỉ trong hai tuần, DeepSeek đã đột phá với một mô hình AI giúp tăng tốc, giảm chi phí và tiết kiệm so với các mô hình đã có ở Mỹ. Ngay lập tức, tất cả sự chú ý đã đổ dồn về người sáng lập của nó, doanh nhân 40 tuổi tên là Liang Wenfeng.

Chân dung CEO DeepSeek

Liang Wenfeng là người sáng lập và Giám đốc điều hành của DeepSeek, một công ty trí tuệ nhân tạo (AI) có trụ sở tại Hàng Châu, Trung Quốc. Ông sinh năm 1985 tại tỉnh Quảng Đông và đã chuyển đến tỉnh Chiết Giang ở miền Đông để học điện tử, nơi đặt trụ sở của gã khổng lồ thương mại điện tử Alibaba và các công ty công nghệ khác, theo thông tin từ các phương tiện truyền thông Trung Quốc.

Nhà sáng lập DeepSeek, Liang Wenfeng, không giống như hình mẫu của một người tiên phong trong lĩnh vực trí tuệ nhân tạo mà mọi người thường nghĩ tới. Ví dụ, khác với CEO của OpenAI, Sam Altman, ông không phải là một nhà sáng lập Silicon Valley.

Thay vào đó, Liang đến từ thế giới tài chính. Tại trường đại học, ông bắt đầu tìm hiểu về lĩnh vực thị giác máy tính, một nhánh của trí tuệ nhân tạo giúp máy tính thu thập và diễn giải thông tin qua dữ liệu hình ảnh và video.

Cùng với nhóm bạn, ông bắt đầu khám phá khả năng của trí tuệ nhân tạo trong việc tự động hóa các đầu tư chứng khoán, điều này đã dẫn đến việc ông trở thành đồng sáng lập High-Flyer Quant vào năm 2015, một trong những quỹ đầu tư lớn nhất tại Trung Quốc. Được quản lý với sự trợ giúp của trí tuệ nhân tạo, quỹ này đã tăng tài sản của mình lên hơn 10 lần chỉ trong bốn năm, từ 1.000 triệu nhân dân tệ (137 triệu USD) vào năm 2016 lên hơn 10.000 triệu nhân dân tệ (1.370 triệu euro) vào năm 2019.

Vào tháng 4/2023, High-Flyer Quant đã công bố việc đầu tư một phần lớn lợi nhuận của mình để xây dựng một hạ tầng dẫn đầu trong lĩnh vực trí tuệ nhân tạo và tiến hành các nghiên cứu quy mô lớn. Trước khi Mỹ áp đặt các hạn chế bán chip cho Trung Quốc, công ty do Liang điều hành đã mua hơn 10.000 bộ xử lý Nvidia H800 để huấn luyện các mô hình trí tuệ nhân tạo tiên tiến. Khi đó, bạn bè và người quen coi đây là một sở thích kỳ quặc mà không ai nghĩ rằng nó sẽ phát triển thành một điều gì đó lớn.

“Mới đầu gặp, anh ấy là một chàng trai mọt sách với tóc tai bù xù, nói về việc xây dựng một cụm 10.000 chip để huấn luyện mô hình của mình. Chúng tôi không nghĩ anh ấy nghiêm túc. Hình ảnh trẻ trung không lo âu của anh ấy, rất giống Silicon Valley, nhưng không phù hợp ở châu Á, và càng không phù hợp với độ tuổi của anh ấy. Anh ấy không thể giải thích rõ ràng tầm nhìn của mình ngoài việc nói: ‘Tôi muốn xây dựng cái này, và nó sẽ thay đổi cuộc chơi.’ Chúng tôi nghĩ rằng chỉ những ông lớn như ByteDance và Alibaba mới có thể làm được điều này.” - Một đối tác kinh doanh của Liang chia sẻ với FT.

'Cú sốc' mang tên Liang Wenfeng

Vào năm 2023, DeepSeek ra mắt, đánh dấu sự khởi đầu của cơn chấn động lớn trong những tuần qua. Theo công ty, việc phát triển mô hình V3 chỉ mất hai tháng và chi phí chưa đến sáu triệu USD. Vào ngày 20/1 vừa qua, mô hình R1 được công bố và hiện nay đang được tải xuống trên khắp thế giới. Liang đã tỏ ra rất ngạc nhiên trước thành công của DeepSeek: "Chúng tôi chưa bao giờ có ý định gây xáo trộn, điều này xảy ra tình cờ."

"Nguyên tắc của chúng tôi không phải là bán thua lỗ hay tìm kiếm lợi nhuận quá mức. Mô hình giá hiện tại của chúng tôi mang lại một biên lợi nhuận khiêm tốn trên chi phí của chúng tôi," nhà sáng lập này cho biết, đồng thời khẳng định rằng mức giá thấp của họ – rẻ hơn 95% so với mô hình o1 của OpenAI – không chỉ là chiến lược thu hút khách hàng.

DeepSeek cung cấp dịch vụ API với giá 1 nhân dân tệ (0,158 USD) cho mỗi triệu token đầu vào và 16 nhân dân tệ (2,19 USD) cho mỗi triệu token đầu ra. "Chúng tôi tin rằng dịch vụ AI và API nên phải dễ tiếp cận và hợp lý với mọi người," doanh nhân này khẳng định, đồng thời cam kết duy trì sự ủng hộ đối với mã nguồn mở.

Liang Wenfeng không chỉ thu hút sự chú ý của các nhà đầu tư và doanh nhân trong ngành công nghệ toàn cầu mà chính phủ Trung Quốc cũng đã mời ông tham dự một hội thảo cùng với Thủ tướng Li Qiang. Tuần trước, một nhóm các chuyên gia từ các ngành như công nghệ, giáo dục, khoa học, văn hóa, y tế và thể thao đã hội tụ tại Bắc Kinh với Li để đưa ra ý kiến và đề xuất, và Liang là người duy nhất đại diện cho lĩnh vực trí tuệ nhân tạo.

Trước sự cạnh tranh công nghệ với Mỹ, Bắc Kinh đã xác định trí tuệ nhân tạo là một ưu tiên, một thị trường có thể đạt giá trị lên tới khoảng 5,6 triệu tỷ nhân dân tệ (hơn 767,2 tỷ USD) tại Trung Quốc vào năm 2030.

Ngân hàng đầu tư quốc gia CICC ước tính rằng ngành công nghiệp AI của Trung Quốc có thể thu hút đến 1,4 triệu tỷ USD trong vòng sáu năm tới. "Trung Quốc không thể luôn luôn tụt lại phía sau trong lĩnh vực AI. Chúng ta thường nói rằng có một khoảng cách một hoặc hai năm giữa AI của Trung Quốc và Mỹ, nhưng khoảng cách thực sự là giữa sự sáng tạo và sao chép. Nếu điều này không thay đổi, Trung Quốc sẽ luôn tụt lại phía sau," Liang nhấn mạnh.

Tham vọng lớn đằng sau DeepSeek

Mặc dù DeepSeek ban đầu chỉ được coi là một dự án phụ, nhưng Liang rất tích cực tham gia vào công ty và công việc nghiên cứu, theo Financial Times.

Ông cũng cam kết biến DeepSeek thành một nhà lãnh đạo AI trong nước, tuyển dụng nhân tài từ các trường đại học hàng đầu của Trung Quốc và trả lương hậu hĩnh, ngang tầm với các gã khổng lồ công nghệ địa phương như TikTok của ByteDance.

Trong một cuộc phỏng vấn vào tháng 7 năm 2024 với Waves, được đăng lại trên China Academy, Liang đã trình bày một số tham vọng của mình về DeepSeek và chiến lược AI của Trung Quốc.

“Trong suốt nhiều năm, các công ty Trung Quốc đã quen với việc tận dụng các đổi mới công nghệ phát triển ở nơi khác và kiếm tiền từ chúng thông qua các ứng dụng,” ông nói. “Nhưng điều này không bền vững. Lần này, mục tiêu của chúng tôi không phải là kiếm lời nhanh mà là thúc đẩy ranh giới công nghệ để phát triển hệ sinh thái.”

Ông thừa nhận rằng đổi mới đòi hỏi rất nhiều tiền và nói rằng Trung Quốc trước đây đã áp dụng công nghệ có sẵn vì nền kinh tế của họ đang ở giai đoạn phát triển sớm hơn. Nhưng hiện nay không còn như vậy nữa, khi ByteDance và Tencent đã trở thành các ông lớn toàn cầu và đang tạo ra lợi nhuận khổng lồ.

“Điều chúng tôi thiếu không phải là vốn mà là sự tự tin và khả năng tổ chức nhân tài chất lượng cao để đổi mới hiệu quả,” Liang nói.

Mô hình mã nguồn mở của DeepSeek trái ngược với mô hình của OpenAI, nhưng ông không coi việc chia sẻ những đột phá của công ty mình là một bất lợi. Áp dụng mô hình mã nguồn đóng sẽ không ngăn cản đối thủ theo kịp, Liang bổ sung, và thực tế, việc mã nguồn mở lại mang lại lợi thế.

“Vì vậy, ‘pháo đài’ thực sự của chúng tôi nằm ở sự phát triển của đội ngũ—tích lũy kiến thức, nuôi dưỡng một văn hóa sáng tạo,” ông giải thích. “Mã nguồn mở và công bố các bài báo không dẫn đến thiệt hại đáng kể. Đối với các nhà công nghệ, bị theo dõi là điều đáng tự hào. Mã nguồn mở là văn hóa, không chỉ là thương mại. Đưa lại là một vinh dự, và nó thu hút nhân tài.”

Thành công lớn của Wenfeng là làm điều tương tự như người Mỹ, đạt được kết quả tương tự hoặc thậm chí tốt hơn so với OpenAI, Google, Meta hay Anthropic. Và đây là “vấn đề” của bong bóng công nghệ, với một phần rất nhỏ so với số tiền mà các gã khổng lồ tại Mỹ đã chi ra.

Liang cũng mô tả DeepSeek là một công ty phát triển từ dưới lên, nơi một sự phân chia công việc tự nhiên xuất hiện mà không có vai trò hay hệ thống cấp bậc cứng nhắc, tạo điều kiện cho sự hợp tác tự do. Nhưng khi một ý tưởng thể hiện tiềm năng, ban quản lý sẽ phân bổ nguồn lực từ trên xuống.

DeepSeek cũng không đặt giới hạn cho việc tiếp cận tài nguyên tính toán hay nhân sự, ông nói thêm, rằng bất kỳ ai có ý tưởng tốt đều có thể sử dụng “cụm huấn luyện” bất cứ lúc nào. Thậm chí, các phòng họp cũng có thể được dễ dàng tiếp cận để khuyến khích các cuộc trao đổi ngẫu nhiên giữa các đồng nghiệp và kết nối sáng tạo.

“Tôi tin rằng đổi mới, trước hết, là vấn đề của niềm tin,” ông nói. “Tại sao Silicon Valley lại sáng tạo đến vậy? Vì họ dám thử. Khi ChatGPT ra mắt, Trung Quốc thiếu sự tự tin trong nghiên cứu tiên phong. Từ các nhà đầu tư đến các công ty công nghệ lớn, nhiều người cảm thấy khoảng cách quá lớn và thay vào đó tập trung vào các ứng dụng. Nhưng đổi mới đòi hỏi sự tự tin, và người trẻ thường có nhiều sự tự tin hơn.”

DeepSeek không huy động vốn từ các quỹ bên ngoài, không có các vòng đầu tư triệu phú, không có các nhà đầu tư thiên thần, không có các công ty khởi nghiệp với văn phòng xa hoa và thực tập sinh đầy nhiệt huyết, cũng không có những sự kiện ‘crypto bros’.

Theo Fortunes, As, Cadenaser

DeepSeek: 'Ngựa ô' mới nhất của giới AI gây chấn động ngành công nghệ

DeepSeek: 'Ngựa ô' mới nhất của giới AI gây chấn động ngành công nghệ

Tài chính quốc tế
(VNF) - Một mô hình AI của Trung Quốc cực kỳ hiệu quả và mạnh mẽ đã làm chấn động ngành công nghệ. DeepSeek R1 đang khiến Phố Wall vô cùng quan ngại.
Cùng chuyên mục
Tin khác