Trận chiến AI: ‘So găng’ những bộ não nhân tạo quyền lực nhất hành tinh
Các “ bộ não nhân tạo” như ChatGPT, Gemini, Claude, Deepseek, Copilot hay Meta AI… đang từng bước trở thành hạ tầng cốt lõi trong nhiều lĩnh vực.
Nhưng trong cuộc chơi tưởng như toàn “siêu nhân” này, mỗi mô hình lại mang những ưu thế và điểm yếu riêng.
Các “ông lớn” đứng sau các mô hình AI đang so kè từng ngày, từng giờ. Ảnh: Asia Times
Trí tuệ nhân tạo đang bước vào giai đoạn cạnh tranh khốc liệt nhất từ trước đến nay. Không còn là những bản demo gây ấn tượng ban đầu, các “bộ não nhân tạo” như ChatGPT của OpenAI, Gemini của Google, Claude của Anthropic, Deepseek, Copilot của Microsoft hay Meta AI… đang từng bước trở thành hạ tầng cốt lõi trong nhiều lĩnh vực – từ giáo dục, truyền thông, đến lập trình và hoạch định chiến lược. Nhưng trong cuộc chơi tưởng như toàn “siêu nhân” này, mỗi mô hình lại mang trong mình những ưu thế riêng và cả những điểm yếu không dễ bỏ qua. Trang Asia Times đã “bóc tách” từng hệ thống, để nhìn rõ ai thực sự đang dẫn đầu và vì sao.
1. ChatGPT của OpenAI
ChatGPT, do OpenAI phát triển, là một trong những mô hình AI dễ nhận biết và được sử dụng rộng rãi nhất trên thế giới. Được xây dựng theo định dạng dựa trên đối thoại, tính linh hoạt đã biến ChatGPT thành một công cụ AI hàng đầu cho cả mục đích sử dụng thông thường và chuyên nghiệp, bao gồm các ngành như dịch vụ khách hàng, sáng tạo nội dung, lập trình và nghiên cứu.
ChatGPT lý tưởng cho nhiều đối tượng người dùng, bao gồm nhà văn, chuyên gia kinh doanh, nhà giáo dục, nhà phát triển và nhà nghiên cứu. Khả năng truy cập miễn phí của nó khiến nó trở thành điểm khởi đầu tuyệt vời cho người dùng thông thường, trong khi các doanh nghiệp, người sáng tạo nội dung và nhà phát triển có thể tận dụng các mô hình tiên tiến của nó để tăng năng suất và tự động hóa.
Nó cũng nằm trong số các mô hình AI thân thiện với người dùng nhất hiện có, có giao diện rõ ràng, phản hồi trực quan và tương tác liền mạch trên nhiều thiết bị. Tuy nhiên, các tổ chức yêu cầu các mô hình AI tùy chỉnh hoặc kiểm soát quyền riêng tư dữ liệu chặt chẽ hơn có thể thấy bản chất nguồn đóng của nó có hạn chế, đặc biệt là khi so sánh với các giải pháp thay thế nguồn mở như LLaMA của Meta.
Đối với các chuyên gia và doanh nghiệp yêu cầu khả năng mạnh mẽ hơn, ChatGPT Pro mở khóa các tính năng lập luận nâng cao thông qua chế độ o1 pro, bao gồm chức năng giọng nói nâng cao và hiệu suất được cải thiện đối với các truy vấn phức tạp.
Một trong những điểm mạnh nhất của ChatGPT là tính linh hoạt và bộ nhớ đàm thoại. Nó có thể xử lý nhiều tác vụ, từ trò chuyện thông thường và viết sáng tạo đến giải quyết vấn đề kỹ thuật, hỗ trợ mã hóa và tự động hóa doanh nghiệp. Khi bộ nhớ được bật, ChatGPT có thể lưu giữ ngữ cảnh trong các tương tác, cho phép trải nghiệm người dùng được cá nhân hóa hơn.
Một lợi thế quan trọng khác là cơ sở người dùng đã được chứng minh của nóvới hàng trăm triệu người dùng trên toàn thế giới, ChatGPT đã trải qua quá trình tinh chỉnh liên tục dựa trên phản hồi trong thế giới thực, cải thiện độ chính xác và khả năng sử dụng của nó. Ngoài ra, khả năng đa phương thức của GPT-4o cho phép nó xử lý văn bản, hình ảnh, âm thanh và video, biến nó thành một công cụ AI toàn diện để tạo nội dung, phân tích và thu hút khách hàng.
Về nhược điểm, thỉnh thoảng ChatGPT có độ trễ trong các bản cập nhật theo thời gian thực. Bên cạnh đó, mô hình độc quyền của nó có nghĩa là người dùng có quyền kiểm soát hạn chế đối với các sửa đổi hoặc tùy chỉnh, vì họ phải tuân thủ các chính sách dữ liệu và hạn chế nội dung của OpenAI.
2. Gemini của Google
Dòng Gemini của Google nổi tiếng với các khả năng đa phương thức và khả năng xử lý ngữ cảnh rộng lớn, khiến nó trở thành một công cụ đa năng cho cả ứng dụng cấp cá nhân và cấp doanh nghiệp.
Người tiêu dùng nói chung và người dùng năng suất được hưởng lợi từ sự tích hợp sâu của Gemini với Google Search, Gmail, Docs và Assistant, khiến nó trở thành một công cụ tuyệt vời để nghiên cứu, soạn thảo email và tự động hóa tác vụ. Người dùng doanh nghiệp và doanh nghiệp thấy giá trị trong việc tích hợp Gemini với Google Workspace, tăng cường khả năng cộng tác trên Drive, Sheets và Meet.
Trụ sở Google tại Mountain View, California, Mỹ. Ảnh: Kyodo/TTXVN
Các nhà phát triển và nhà nghiên cứu AI có thể tận dụng các khả năng của nó thông qua Google Cloud và Vertex AI, khiến nó trở thành lựa chọn mạnh mẽ để xây dựng các ứng dụng AI và mô hình tùy chỉnh. Các chuyên gia sáng tạo có thể tận dụng các khả năng đa phương thức của nó, làm việc với văn bản, hình ảnh và video. Trong khi đó, sinh viên và nhà giáo dục được hưởng lợi từ khả năng tóm tắt, giải thích các khái niệm và hỗ trợ nghiên cứu của Gemini, khiến nó trở thành một công cụ học thuật mạnh mẽ.
Google Gemini rất dễ tiếp cận, đặc biệt là đối với những người đã quen thuộc với các dịch vụ của Google. Sự tích hợp liền mạch của nó trên toàn bộ hệ sinh thái của Google cho phép áp dụng dễ dàng trong cả ứng dụng cá nhân và doanh nghiệp.
Các phiên bản hiện tại, Gemini 1.5 Flash và Pro, đáp ứng các nhu cầu khác nhau, với Flash cung cấp tùy chọn tinh gọn, tiết kiệm chi phí và Pro cung cấp hiệu suất cao hơn. Trong khi đó, dòng Gemini 2.0, được thiết kế chủ yếu cho mục đích sử dụng của doanh nghiệp, bao gồm các mô hình thử nghiệm như Gemini 2.0 Flash với tốc độ được cải thiện và API trực tiếp đa phương thức, cũng như Gemini 2.0 Pro mạnh mẽ hơn.
Tuy nhiên, hiệu suất của Gemini có thể không nhất quán, đặc biệt là với các ngôn ngữ hiếm hoặc các truy vấn chuyên biệt. Một số phiên bản nâng cao có thể bị giới hạn do thử nghiệm an toàn, làm chậm trễ quyền truy cập rộng rãi hơn. Hơn nữa, sự tích hợp sâu sắc với hệ sinh thái của Google có thể là rào cản đối với người dùng bên ngoài môi trường đó, khiến việc áp dụng trở nên khó khăn hơn.
3. Claude của Anthropic
Claude của Anthropic được biết đến với sự nhấn mạnh vào tính an toàn, luồng hội thoại tự nhiên và hiểu biết ngữ cảnh dạng dài. Nó đặc biệt phù hợp với những người dùng ưu tiên sử dụng AI có đạo đức và cộng tác có cấu trúc trong quy trình làm việc của họ.
Video đang HOT
Các nhà nghiên cứu và học giả cần duy trì ngữ cảnh dạng dài và ít ảo giác, cũng như các nhà văn và người sáng tạo nội dung được hưởng lợi từ cách tiếp cận có cấu trúc và độ chính xác của nó, sẽ thấy Claude là một trợ lý AI thiết yếu và có lợi.
Các chuyên gia kinh doanh và nhóm có thể tận dụng tính năng “Dự án” của Claude để quản lý nhiệm vụ và tài liệu, trong khi các nhà giáo dục và sinh viên sẽ thấy các rào cản an toàn và phản hồi rõ ràng của nó là lý tưởng để hỗ trợ học tập.
Vì Claude rất dễ tiếp cận đối với những người tìm kiếm AI có cấu trúc, đạo đức với sự hiểu biết ngữ cảnh mạnh mẽ, nên nó phù hợp ở mức độ vừa phải đối với những người dùng sáng tạo, những người có thể thấy các bộ lọc hạn chế của nó hạn chế và không lý tưởng cho những người cần các công cụ động não nhanh, không hạn chế hoặc nội dung do AI tạo ra với mức độ kiểm duyệt tối thiểu.
Ngược lại, Claude 3.5 Sonnet là mô hình hàng đầu, cung cấp khả năng lập luận, tốc độ và hiểu biết theo ngữ cảnh nâng cao cho cả người dùng cá nhân và doanh nghiệp. Đối với doanh nghiệp và nhóm, Gói Claude Team và Enterprise có giá khởi điểm khoảng 25 đô la cho mỗi người dùng mỗi tháng (thanh toán hàng năm), cung cấp các tính năng cộng tác nâng cao.
Không giống như hầu hết các AI, Claude vượt trội về tính an toàn của AI có đạo đức, bộ nhớ đàm thoại mở rộng và quản lý dự án có cấu trúc, khiến nó trở nên lý tưởng cho những người dùng cần hỗ trợ AI đáng tin cậy và được kiểm duyệt tốt. Giao diện trực quan và các công cụ tổ chức của nó giúp tăng năng suất cho các nhà văn, nhà nghiên cứu, nhà giáo dục và chuyên gia kinh doanh.
Tuy nhiên, các bộ lọc an toàn nghiêm ngặt của Claude, mặc dù ngăn chặn nội dung có hại, nhưng đôi khi lại hạn chế tính linh hoạt sáng tạo, khiến nó không phù hợp với các phiên động não mang tính thử nghiệm cao hoặc không bị hạn chế.
4. DeepSeek AI
DeepSeek, một tên tuổi mới từ Trung Quốc, đã nhanh chóng thu hút sự chú ý vì hiệu quả về chi phí và triết lý truy cập mở. Không giống như nhiều mô hình AI đã được thiết lập, DeepSeek tập trung vào việc cung cấp quyền truy cập AI giá cả phải chăng trong khi vẫn duy trì khả năng suy luận mạnh mẽ, khiến nó trở thành một lựa chọn hấp dẫn cho cả doanh nghiệp và người dùng cá nhân.
Là một lựa chọn tuyệt vời cho các doanh nghiệp có ý thức về chi phí, các nhà phát triển độc lập và các nhà nghiên cứu cần một giải pháp AI mạnh mẽ nhưng giá cả phải chăng, DeepSeek đặc biệt phù hợp với các công ty khởi nghiệp, tổ chức học thuật và doanh nghiệp cần khả năng suy luận và giải quyết vấn đề mạnh mẽ mà không tốn nhiều chi phí vận hành.
Nó rất dễ tiếp cận đối với cá nhân do mô hình dựa trên web miễn phí của nó và ngay cả các nhà phát triển và doanh nghiệp cũng được hưởng lợi từ API chi phí thấp của mô hình này.
Mô hình mới nhất, DeepSeek-R1, được thiết kế cho các tác vụ lý luận nâng cao và có thể truy cập thông qua cả API và giao diện trò chuyện. Phiên bản trước đó, DeepSeek-V3, đóng vai trò là nền tảng kiến trúc cho các bản phát hành hiện tại, cung cấp cửa sổ ngữ cảnh mở rộng lên tới 128.000 mã thông báo trong khi được tối ưu hóa để tăng hiệu quả.
DeepSeek miễn phí cho người dùng cá nhân thông qua giao diện web, khiến nó trở thành một trong những mô hình AI dễ truy cập nhất hiện có. Tuy nhiên, đối với các ứng dụng kinh doanh, việc sử dụng API có chi phí thấp hơn đáng kể so với các đối thủ cạnh tranh ở Mỹ, khiến nó trở thành một lựa chọn hấp dẫn cho các doanh nghiệp muốn giảm chi phí.
Một trong những điểm mạnh lớn nhất của DeepSeek là hiệu quả về chi phí. Nó cho phép các doanh nghiệp và nhà phát triển tiếp cận AI mạnh mẽ mà không phải chịu gánh nặng tài chính liên quan đến các mô hình như GPT-4 của OpenAI hoặc Claude của Anthropic. Phương pháp tiếp cận nguồn mở của nó càng làm tăng thêm sức hấp dẫn của nó, vì nó cung cấp trọng số mô hình và tài liệu kỹ thuật theo giấy phép mở, khuyến khích tính minh bạch và cải tiến do cộng đồng thúc đẩy.
Biểu tượng mô hình trí tuệ nhân tạo Deepseek. Ảnh: REUTERS/TTXVN
Ngoài ra, khả năng lập luận mạnh mẽ của nó đã được đánh giá chuẩn mực so với các mô hình AI hàng đầu, với DeepSeek-R1 cạnh tranh với các mô hình hàng đầu của OpenAI trong các nhiệm vụ giải quyết vấn đề cụ thể.
Nhưng có một vấn đề đáng chú ý với DeepSeek là độ trễ phản hồi của nó, đặc biệt là trong thời gian nhu cầu cao, khiến nó kém lý tưởng hơn cho các ứng dụng thời gian thực, nơi tốc độ là yếu tố quan trọng. Kiểm duyệt và thiên vị cũng là những mối quan ngại tiềm ẩn. DeepSeek tuân thủ các quy định về nội dung tại địa phương, nghĩa là nó có thể khử trùng hoặc tránh các chủ đề nhạy cảm về mặt chính trị, điều này có thể hạn chế sức hấp dẫn của nó trên thị trường toàn cầu.
5. Copilot của Microsoft
Copilot của Microsoft là trợ lý AI tập trung vào năng suất được thiết kế để nâng cao hiệu quả nơi làm việc thông qua tích hợp liền mạch với bộ Microsoft 365. Bằng cách nhúng tự động hóa hỗ trợ AI trực tiếp vào các công cụ như Word, Excel, PowerPoint, Outlook và Teams, Copilot hoạt động như một trợ lý thông minh giúp hợp lý hóa quy trình làm việc, tự động hóa các tác vụ lặp đi lặp lại và nâng cao khả năng tạo tài liệu.
Lý tưởng cho các doanh nghiệp, nhóm doanh nghiệp và chuyên gia phụ thuộc nhiều vào các ứng dụng Microsoft 365 cho các hoạt động hàng ngày của họ, Copilot của Microsoft đặc biệt có lợi cho các chuyên gia doanh nghiệp, nhà phân tích tài chính, quản lý dự án và nhân viên hành chính cần hỗ trợ hỗ trợ AI để nâng cao năng suất và giảm thời gian dành cho các tác vụ thường xuyên.
Tuy nhiên, những tổ chức thích các mô hình AI nguồn mở hoặc yêu cầu khả năng tương thích linh hoạt, đa nền tảng có thể thấy Copilot ít phù hợp hơn, đặc biệt là nếu họ dựa vào hệ sinh thái phần mềm không phải của Microsoft cho quy trình làm việc của mình.
Một trong những lợi thế quan trọng nhất của Copilot là tích hợp hệ sinh thái sâu rộng trong Microsoft 365. Đối với các doanh nghiệp và chuyên gia đã sử dụng Microsoft Office, Copilot cải thiện quy trình làm việc bằng cách nhúng các đề xuất và tự động hóa do AI điều khiển trực tiếp vào các ứng dụng quen thuộc.
Khả năng tự động hóa tác vụ của nó là một lợi ích quan trọng khác, giúp người dùng tạo báo cáo, tóm tắt cuộc họp, soạn thảo email và phân tích dữ liệu hiệu quả hơn.
Ngược lại, một trong những nhược điểm đáng kể của Copilot của Microsoft là sự khóa chặt hệ sinh thái của nó – Copilot được kết hợp chặt chẽ với Microsoft 365, nghĩa là toàn bộ tiềm năng của nó chỉ được các tổ chức đã đầu tư vào hệ sinh thái phần mềm của Microsoft nhận ra. Một mối quan ngại khác là tính linh hoạt hạn chế vì thiếu tích hợp của bên thứ ba mở rộng có trong các nền tảng AI mở hơn, khiến việc tùy chỉnh trở nên khó khăn đối với các doanh nghiệp dựa vào nhiều công cụ hơn.
6. Meta AI
Bộ công cụ AI của Meta, được xây dựng trên các mô hình LLaMA có trọng số mở (open-weight LLaMA models), là một bộ AI linh hoạt và thân thiện với nghiên cứu được thiết kế cho cả mục đích sử dụng chung và các ứng dụng chuyên biệt. Phương pháp tiếp cận của Meta ưu tiên phát triển nguồn mở, khả năng truy cập và tích hợp với các nền tảng truyền thông xã hội của mình, khiến nó trở thành một đối thủ độc đáo trong bối cảnh AI.
Nó lý tưởng cho các nhà phát triển, nhà nghiên cứu và những người đam mê AI muốn có các mô hình nguồn mở miễn phí mà họ có thể tùy chỉnh và tinh chỉnh. Nó cũng rất phù hợp với các doanh nghiệp và thương hiệu tận dụng các nền tảng xã hội của Meta, vì AI của nó có thể tăng cường tương tác với khách hàng và tạo nội dung trong các ứng dụng như Instagram và WhatsApp.
Meta AI rất dễ tiếp cận đối với các nhà phát triển và nhà nghiên cứu do tính khả dụng và tính linh hoạt của nguồn mở. Tuy nhiên, các doanh nghiệp và người dùng thông thường có thể thấy nó kém trực quan hơn so với các mô hình AI có các công cụ hướng đến người dùng tinh vi hơn. Ngoài ra, các công ty cần kiểm duyệt nội dung mạnh mẽ và tuân thủ quy định có thể thích các hệ thống AI được kiểm soát chặt chẽ hơn từ các đối thủ cạnh tranh như Microsoft hoặc Anthropic.
Ưu điểm lớn nhất của Meta AI là bản chất mã nguồn mở và có thể tùy chỉnh, cho phép các nhà phát triển tinh chỉnh các mô hình cho các trường hợp sử dụng cụ thể. Điều này thúc đẩy sự đổi mới, tính linh hoạt và tính minh bạch cao hơn so với các hệ thống AI đóng. Meta AI lại được nhúng trong các nền tảng truyền thông xã hội phổ biến như Facebook, Instagram và WhatsApp, mang lại cho nó phạm vi tiếp cận người tiêu dùng lớn và khả năng tương tác theo thời gian thực.
Mặc dù có công nghệ nền tảng mạnh mẽ, giao diện người dùng và khả năng phản hồi của Meta AI đôi khi có vẻ kém tinh tế hơn so với các đối thủ cạnh tranh như OpenAI và Microsoft. Ngoài ra, Meta đã phải đối mặt với những tranh cãi liên quan đến việc kiểm duyệt nội dung và thiên vị, làm dấy lên mối lo ngại về thông tin sai lệch do AI tạo ra và sự giám sát của cơ quan quản lý.
Sau mô hình AI ban đầu gây chấn động, DeepSeek đẩy nhanh ra mắt mô hình mới
Công ty khởi nghiệp Trung Quốc DeepSeek đang tìm cách tận dụng lợi thế sau khi ra mắt mô hình R1 gây chấn động thế giới.
Logo của DeepSeek. Ảnh: AFP/TTXVN
Theo hãng tin Reuters ngày 26/2, DeepSeek đã gây ra đợt bán tháo hơn 1.000 tỷ USD trên thị trường chứng khoán toàn cầu vào tháng trước với một mô hình AI lý luận giá rẻ vượt trội hơn nhiều đối thủ phương Tây.
Hiện, công ty có trụ sở tại Hàng Châu này đang đẩy nhanh kế hoạch ra mắt phiên bản kế nhiệm của mô hình R1 hồi tháng 1.
Theo hai nguồn tin, DeepSeek ban đầu dự kiến phát hành R2 vào đầu tháng 5 nhưng hiện muốn tung ra sớm nhất có thể.
DeepSeek cho biết họ kỳ vọng mô hình mới sẽ cải thiện khả năng lập trình và có thể suy luận bằng các ngôn ngữ ngoài tiếng Anh. Chi tiết về mốc thời gian đẩy nhanh ra mắt R2 chưa từng được đưa tin trước đó.
Các đối thủ vẫn đang tìm cách đánh giá tác động của R1, mô hình được xây dựng bằng các con chip Nvidia kém mạnh hơn nhưng vẫn có tính cạnh tranh với những sản phẩm do các tập đoàn công nghệ Mỹ phát triển với chi phí hàng trăm tỷ USD.
Ông Vijayasimha Alilughatta, Giám đốc điều hành của công ty dịch vụ công nghệ Ấn Độ Zensar, nhận định: "DeepSeek ra mắt mô hình R2 có thể là một thời khắc mang tính bước ngoặt trong ngành AI". Theo ông, thành công của DeepSeek trong tạo ra các mô hình AI tiết kiệm chi phí có thể thúc đẩy các công ty trên toàn cầu đẩy nhanh nỗ lực, phá vỡ thế độc quyền của một số ít tập đoàn lớn trong ngành.
R2 có khả năng khiến chính phủ Mỹ lo ngại, khi nước này xác định dẫn đầu trong lĩnh vực AI là ưu tiên quốc gia. Trong khi đó, R2 ra mắt có thể khiến chính quyền và doanh nghiệp Trung Quốc thêm quyết tâm, khi hàng chục công ty nước này tuyên bố đã bắt đầu tích hợp các mô hình của DeepSeek vào sản phẩm của mình.
Mô hình quản lý khác biệt tại DeepSeek
Thông tin về DeepSeek vẫn rất ít ỏi. Nhà sáng lập Lương Văn Phong trở thành tỷ phú nhờ quỹ đầu tư định lượng High-Flyer. Ông Lương chưa phát biểu trước truyền thông kể từ tháng 7/2024.
Ông Lương sinh năm 1985 tại một ngôi làng ở tỉnh Quảng Đông, miền Nam Trung Quốc. Sau đó, ông lấy bằng kỹ sư truyền thông tại Đại học Chiết Giang danh tiếng.
Một trong những công việc đầu tiên của ông là điều hành bộ phận nghiên cứu tại một công ty hình ảnh thông minh ở Thượng Hải.
Tại DeepSeek và High-Flyer, ông Lương cũng tránh các phương thức quản lý cứng nhắc của các tập đoàn công nghệ Trung Quốc, vốn nổi tiếng với hệ thống cấp bậc chặt chẽ, trả lương thấp cho nhân viên trẻ và quy tắc "996" - làm việc từ 9 giờ sáng đến 9 giờ tối, sáu ngày một tuần.
Ông Lương mở văn phòng ở Bắc Kinh gần Đại học Thanh Hoa và Đại học Bắc Kinh, hai cơ sở giáo dục danh giá nhất Trung Quốc. Ông thường xuyên tham gia vào các chi tiết kỹ thuật và sẵn sàng làm việc cùng các thực tập sinh thuộc thế hệ trẻ và những sinh viên mới tốt nghiệp, những người chiếm phần lớn lực lượng lao động của công ty. Họ cũng cho biết thường chỉ làm việc 8 tiếng một ngày trong một môi trường hợp tác.
Benjamin Liu, một nhà nghiên cứu 26 tuổi rời công ty hồi tháng 9, kể: "Ông Lương trao cho chúng tôi quyền kiểm soát và coi chúng tôi là chuyên gia. Ông ấy liên tục đặt câu hỏi và học hỏi cùng chúng tôi. DeepSeek cho phép tôi chịu trách nhiệm về những phần quan trọng trong quy trình, điều đó rất thú vị".
Trong khi Baidu và các tập đoàn công nghệ Trung Quốc khác chạy đua phát triển phiên bản AI hướng đến người tiêu dùng vào năm 2023 để tận dụng làn sóng AI toàn cầu, ông Lương nói với hãng truyền thông Trung Quốc Waves năm ngoái rằng ông cố tình tránh chi tiêu mạnh vào phát triển ứng dụng, thay vào đó tập trung vào nâng cao chất lượng mô hình AI.
Cả DeepSeek và High-Flyer đều nổi tiếng vì trả lương cao. Tại High-Flyer, một nhà khoa học dữ liệu cấp cao có thể kiếm 1,5 triệu nhân dân tệ mỗi năm, trong khi các công ty đối thủ hiếm khi trả quá 800.000 nhân dân tệ.
Sự hào phóng này là nhờ High-Flyer, một trong những quỹ đầu tư định lượng thành công nhất Trung Quốc. Dù lĩnh vực này bị chính phủ siết chặt, nhưng quỹ vẫn quản lý hàng chục tỷ nhân dân tệ.
DeepSeek đạt được thành công với mô hình AI giá rẻ nhờ khoản đầu tư lớn vào nghiên cứu và sức mạnh tính toán suốt một thập kỷ của High-Flyer. Năm 2020, một giám đốc cấp cao của quỹ tuyên bố công ty sẽ dồn toàn lực cho AI, tái đầu tư 70% doanh thu, chủ yếu vào nghiên cứu AI.
High-Flyer đã chi 1,2 tỷ nhân dân tệ cho hai cụm siêu máy tính AI vào năm 2020 và 2021. Cụm thứ hai, Fire-Flyer II, bao gồm khoảng 10.000 chip Nvidia A100, được sử dụng để đào tạo mô hình AI.
DeepSeek chưa thành lập vào thời điểm đó, nhưng việc tích lũy sức mạnh tính toán đã thu hút sự chú ý của các cơ quan quản lý chứng khoán Trung Quốc. Họ quyết định không can thiệp, một động thái mang tính quyết định đối với DeepSeek khi Mỹ cấm xuất khẩu chip A100 sang Trung Quốc vào năm 2022.
Giới chức đã yêu cầu ông Lương Văn Phong giữ thái độ kín tiếng vì họ lo ngại rằng xuất hiện trên truyền thông sẽ thu hút sự chú ý không cần thiết.
Là một trong số ít công ty sở hữu cụm A100 quy mô lớn, High-Flyer và DeepSeek đã thu hút được một số nhân tài nghiên cứu hàng đầu của Trung Quốc.
Theo ước tính của các nhà phân tích tại công ty môi giới Bernstein hồi đầu tháng 2, mức giá của DeepSeek rẻ hơn từ 20 đến 40 lần so với chi phí của OpenAI cho các mô hình tương đương.
Hiện tại, các tập đoàn công nghệ phương Tây và Trung Quốc vẫn đang lên kế hoạch chi tiêu mạnh tay cho AI, nhưng thành công của DeepSeek với R1 và mô hình V3 trước đó đã khiến một số công ty phải điều chỉnh chiến lược.
OpenAI đã giảm giá trong tháng này, trong khi Gemini của Google giới thiệu các cấp truy cập giá rẻ hơn. Kể từ khi R1 ra mắt, OpenAI cũng đã tung ra mô hình O3-Mini sử dụng ít tài nguyên tính toán hơn.
Sự hỗ trợ từ Trung Quốc
Ngay trước khi R1 thu hút chú ý toàn cầu, đã có dấu hiệu cho thấy DeepSeek được Bắc Kinh ưu ái. Vào tháng 1, truyền thông nhà nước đưa tin ông Lương Văn Phong đã tham dự một cuộc họp với Thủ tướng Trung Quốc Lý Cường tại Bắc Kinh với tư cách là đại diện của lĩnh vực AI, vượt qua nhiều lãnh đạo của các công ty lớn hơn.
Tính cạnh tranh về chi phí của các mô hình DeepSeek đã củng cố niềm tin của Bắc Kinh rằng họ có thể đổi mới vượt Mỹ. Các công ty và cơ quan chính phủ Trung Quốc đã đón nhận các mô hình DeepSeek với tốc độ chưa từng có.
Ít nhất 13 chính quyền thành phố và 10 công ty năng lượng nhà nước Trung Quốc tuyên bố đã tích hợp DeepSeek vào hệ thống. Các tập đoàn công nghệ như Lenovo, Baidu và Tencent cũng đã tích hợp mô hình DeepSeek vào sản phẩm.
Ông Alfred Wu, chuyên gia về chính sách Trung Quốc tại Trường Chính sách công Lý Quang Diệu của Singapore, nhận định: "Chủ tịch Tập Cận Bình và ông Lý Cường đã phát tín hiệu rằng họ ủng hộ DeepSeek".
Bất chấp DeepSeek, người dùng ChatGPT vẫn tăng
Logo của OpenAI và ChatGPT. Ảnh: AFP/TTXVN
Theo kênh CNBC ngày 20/2, OpenAI tiếp tục mở rộng tầm bao phủ với tốc độ ấn tượng, bất chấp áp lực từ các đối thủ cạnh tranh như DeepSeek. OpenAi đã ghi nhận trong tháng 2 có 400 triệu người dùng hoạt động hằng tuần, tăng 33% so với con số 300 triệu trong tháng 12/2024. Đây là lần đầu tiên dữ liệu này được công bố.
Theo Giám đốc vận hành OpenAI Brad Lightcap, ChatGPT ngày càng phổ biến là do nhiều yếu tố, trong đó có khả năng đáp ứng ngày càng tốt hơn nhu cầu của người dùng. Quá trình này diễn ra tự nhiên khi ngày càng có nhiều người tiếp cận và nhận thấy tiện ích của công cụ. Tốc độ lan truyền của ChatGPT chủ yếu dựa vào yếu tố truyền miệng, khi người dùng giới thiệu cho bạn bè và đồng nghiệp. Theo thời gian, nhiều người dần tìm ra cách tận dụng công cụ này để hỗ trợ công việc và cuộc sống, từ đó thúc đẩy tăng trưởng bền vững.
Không chỉ mảng người dùng cá nhân phát triển mạnh, OpenAI cũng đang mở rộng nhanh chóng phân khúc khách hàng doanh nghiệp. Hiện tại, công ty có khoảng 2 triệu doanh nghiệp trả phí, gấp đôi so với tháng 9 năm ngoái. Ông Lightcap cho biết nhiều nhân viên ban đầu sử dụng ChatGPT cho mục đích cá nhân, sau đó đề xuất doanh nghiệp triển khai công cụ này để tối ưu quy trình làm việc. Ông cho rằng sự quen thuộc của người dùng cá nhân với ChatGPT đã giúp công ty dễ dàng mở rộng sang lĩnh vực doanh nghiệp.
Grok 3 có khả năng gì mà tỷ phú Elon Musk ca ngợi là AI 'thông minh nhất Trái đất'? Mô hình trí tuệ nhân tạo Grok 3 vừa ra mắt có những đặc điểm vượt trội mà tỷ phú Elon Musk tuyên bố là "thông minh nhất Trái đất". Biểu tượng của Grok và ChatGPT. Ảnh: REUTERS/TTXVN Theo trang indiatoday.in ngày 18/2, ông Musk đã công bố phát hành Grok 3, phiên bản mới nhất của chatbot AI do ông phát triển,...











Tiêu điểm
Tin đang nóng
Tin mới nhất

Microsoft cảnh báo sẽ khởi kiện nếu bị yêu cầu ngừng dịch vụ đám mây tại châu Âu

Tổng thống Putin: Di sản Thế chiến II của Nga đang bị bóp méo vì mục đích chính trị

Kỳ vọng tăng trưởng bền vững giữa áp lực hội nhập và cải cách

GDP suy giảm trong quý 1: Kinh tế Mỹ có thể chịu đựng đến đâu giữa 'bão thuế quan'?

Seoul ra mắt bản tin kỹ thuật số và vlog dành cho cư dân nước ngoài

Nền kinh tế Eurozone tăng trưởng vượt kỳ vọng

Cựu trợ lý của chính trị gia Đức bị cáo buộc làm gián điệp cho Trung Quốc

Thế giới đang đứng trước 'mùa Đông kinh tế' năm 2025

Iran thông báo kế hoạch vòng đàm phán hạt nhân thứ 4 với Mỹ

Reuters: Trung Quốc lập danh sách hàng hóa Mỹ được miễn thuế 125%

Nga triển khai S-300PS tới Kyrgyzstan: Bước đi chiến lược củng cố sức mạnh ở Trung Á

'Cơ hội vàng' cho châu Âu giữa căng thẳng thương mại Mỹ - Trung
Có thể bạn quan tâm

Dàn sao check-in tưng bừng xem pháo hoa dịp lễ 30/4: Tăng Thanh Hà có view xịn, Châu Bùi xuống đường hưởng ứng không khí
Sao việt
07:06:18 01/05/2025
Clip thót tim: Chương Tử Di ngã nhào úp mặt giữa sóng trực tiếp, chấn thương nghiêm trọng hơn công bố?
Sao châu á
07:03:33 01/05/2025
Tổng đạo diễn Ký Ức Vui Vẻ: "Tôi không hiểu mình làm gì sai để anh Tự Long phải lớn tiếng như vậy"
Tv show
06:30:00 01/05/2025
Thiếu niên 16 tuổi đi xe máy tông thiếu tá CSGT bị thương
Tin nổi bật
06:13:18 01/05/2025
Thủ đoạn của 'ông trùm' bán thuốc hỗ trợ sinh lý giả, thu lợi 20 tỷ đồng
Pháp luật
06:10:31 01/05/2025
3 món ăn "nhất định phải có" trên mâm cơm nhà mùa nóng: Vừa giải độc gan, vừa giúp thanh nhiệt lại cực ngon miệng
Ẩm thực
05:35:06 01/05/2025
Con gái minh tinh Hollywood công khai gia nhập 'giới cầu vồng', visual cỡ nào?
Sao âu mỹ
23:20:55 30/04/2025
Cận cảnh sedan hạng sang Hongqi H9 thế hệ mới vừa ra mắt
Ôtô
22:30:33 30/04/2025
Hàng 'hot' Yamaha 135LC Fi 2025 nhập khẩu về Việt Nam, giá không rẻ
Xe máy
22:21:47 30/04/2025
3 con giáp ôm trọn 300 tỷ vào ngày 30/4/2025, bản mệnh dát vàng, mua nhà sắm xe, làm gì cũng thuận, sung túc đủ đầy
Trắc nghiệm
22:17:33 30/04/2025