Hành trình trở thành ‘vua chip AI’ của Nvidia
Nvidia đã trở thành nhà sản xuất chip có giá trị nhất thế giới nhờ vị trí dẫn đầu trong lĩnh vực điện toán trí tuệ nhân tạo (AI).
Theo Bloomberg , các nhà đầu tư đổ vốn mạnh mẽ vào công ty này, đặt niềm tin rằng sự bùng nổ của AI sẽ đem lại lợi nhuận khổng lồ.
Chip Nvidia GB200 Grace Blackwell được trưng bày trong hội nghị Computex ở Đài Bắc, Đài Loan (Trung Quốc) vào ngày 21.5 – Ảnh: Bloomberg
Chip AI chủ lực của Nvidia
Dẫn đầu thị trường hiện tại là Hopper H100, con chip được đặt theo tên nhà tiên phong khoa học máy tính Grace Hopper. Đây là phiên bản nâng cao của chip đồ họa vốn từng phổ biến trong lĩnh vực trò chơi điện tử, nay được tối ưu hóa cho các tác vụ AI. Tuy nhiên, Hopper đang dần được thay thế bởi dòng sản phẩm mới Blackwell – được đặt tên theo nhà toán học David Blackwell.
Cả hai dòng chip đều được thiết kế để biến các cụm máy tính chứa chip Nvidia thành một khối thống nhất, có khả năng xử lý khối lượng dữ liệu khổng lồ và thực hiện tính toán tốc độ cao, điều kiện tiên quyết để huấn luyện các mạng nơ ron nhân tạo hiện đại.
Trong dòng sản phẩm mới nhất, chip GB200 kết hợp hai GPU Blackwell với một CPU Grace, tạo thành siêu chip phục vụ các trung tâm dữ liệu quy mô lớn.
Nền tảng AI hiện đại, đặc biệt là các mô hình ngôn ngữ, yêu cầu xử lý dữ liệu ở quy mô lớn với hàng tỷ phép tính để đạt độ chính xác. Quá trình đào tạo các mô hình này tiêu thụ năng lượng và tài nguyên tính toán khổng lồ.
Blackwell cung cấp hiệu suất đào tạo AI gấp 2,5 lần Hopper, theo Nvidia. Cấu trúc chip sử dụng số lượng bóng bán dẫn lớn đến mức phải chia làm hai phần, kết nối với nhau bằng công nghệ liên kết cao tốc để hoạt động như một đơn vị duy nhất. Đặc điểm này không chỉ nâng cao hiệu suất mà còn giúp chip đạt tính năng vượt trội trong giới hạn vật lý hiện tại của sản xuất bán dẫn.
Lợi thế hiệu suất này là lý do chính khiến các công ty như Microsoft , Amazon và Google lựa chọn sản phẩm của Nvidia để phát triển hệ thống AI, đồng thời khiến chính phủ Mỹ phải áp đặt lệnh hạn chế xuất khẩu sang Trung Quốc đối với những mẫu chip cao cấp này.
Hành trình dẫn đầu ngành AI
Được thành lập năm 1993 tại Santa Clara, California, Nvidia ban đầu tập trung vào sản xuất chip đồ họa (GPU) phục vụ ngành game . Tuy nhiên, từ đầu thập niên 2000, công ty đã nhận ra tiềm năng của GPU trong xử lý tính toán song song – yếu tố quan trọng trong huấn luyện AI.
Khi cộng đồng nghiên cứu AI phát hiện GPU có thể tăng tốc đáng kể quá trình đào tạo mô hình, Nvidia nhanh chóng chiếm lĩnh thị trường. Họ tiên phong trong việc cung cấp phần cứng, phần mềm hỗ trợ, và cả các cụm máy chủ tích hợp giúp khách hàng triển khai hệ thống AI dễ dàng và hiệu quả hơn.
Theo công ty nghiên cứu IDC, Nvidia đang kiểm soát khoảng 90% thị phần GPU phục vụ trung tâm dữ liệu. Dù vậy, các nhà cung cấp dịch vụ đám mây như Amazon Web Services (AWS), Google Cloud và Microsoft Azure vốn là khách hàng lớn của Nvidia, cũng đang đầu tư phát triển chip riêng để giảm phụ thuộc vào bên thứ ba.
Tại hội nghị Computex 2025 tại Đài Loan (Trung Quốc) hồi tháng 5, CEO Jensen Huang thông báo Nvidia sẽ mở rộng giao thức kết nối tốc độ cao NVLink cho các sản phẩm từ bên thứ ba. Trước đó, công nghệ này chỉ áp dụng trong nội bộ hệ sinh thái Nvidia. Đây là động thái cho thấy hãng sẵn sàng thích nghi với thay đổi từ phía khách hàng, đồng thời củng cố vị trí trung tâm trong kiến trúc máy chủ AI hiện đại.
Video đang HOT
Về phía đối thủ, AMD, công ty sản xuất GPU lớn thứ hai, đã ra mắt dòng chip Instinct MI350, hứa hẹn hiệu năng gấp 35 lần thế hệ trước. Tuy nhiên, công ty vẫn chưa thể bắt kịp đà tăng trưởng của Nvidia. Intel, trong khi đó, tạm dừng kế hoạch thương mại hóa dòng chip AI Falcon Shores sau phản hồi tiêu cực từ thị trường, và hiện đang trong giai đoạn đánh giá lại chiến lược AI dưới thời CEO mới Lip-Bu Tan.
Một yếu tố giúp Nvidia vượt trội là khả năng đổi mới liên tục. Công ty cam kết giới thiệu sản phẩm chủ lực mới mỗi năm, cùng lúc phát triển nền tảng phần mềm hỗ trợ đầy đủ. Hệ thống cụm máy chủ, giải pháp hạ tầng, dịch vụ khách hàng, tất cả đều được Nvidia thiết kế để giúp doanh nghiệp triển khai AI quy mô lớn một cách hiệu quả.
CEO Jensen Huang xuất hiện đều đặn tại các sự kiện lớn toàn cầu, cập nhật chiến lược sản phẩm, công bố hợp tác mới và giữ cho Nvidia luôn là cái tên được nhắc đến khi nói đến AI.
Nhu cầu thị trường và mối lo dài hạn
Các công ty công nghệ lớn như Microsoft, Amazon, Meta và Google đang chi hàng trăm tỉ USD để xây dựng trung tâm dữ liệu AI. Nvidia cho biết họ hiện không thể đáp ứng hết đơn hàng, ngay cả với các mẫu chip cũ hơn.
Tuy nhiên, đã có tín hiệu chững lại. Microsoft gần đây hủy bỏ một số dự án trung tâm dữ liệu, làm dấy lên nghi ngại về việc dư thừa công suất AI. Dù vậy, công ty khẳng định vẫn tăng đầu tư trong các quý tiếp theo.
Ngoài ra, một diễn biến đáng chú ý đến từ Trung Quốc. Công ty khởi nghiệp DeepSeek công bố mô hình AI nguồn mở, sử dụng ít tài nguyên hơn nhờ áp dụng học tăng cường từ dữ liệu thực tế, một phương pháp không quá phụ thuộc vào quá trình đào tạo tiêu tốn. Điều này làm dấy lên lo ngại rằng nhu cầu chip cao cấp để huấn luyện AI có thể giảm trong tương lai.
Tuy nhiên, Nvidia không tỏ ra lo lắng. Họ ghi nhận bước tiến của DeepSeek là “một đột phá AI tuyệt vời” và nhấn mạnh rằng chip của hãng vẫn đóng vai trò trung tâm ngay cả trong các phương pháp huấn luyện mới.
Lệnh cấm của chính phủ Mỹ đối với các dòng chip cao cấp sang Trung Quốc đã ảnh hưởng trực tiếp đến doanh thu của Nvidia. Trong quý gần nhất, công ty báo cáo khoản giảm giá hàng tồn kho trị giá 5,5 tỉ USD do không thể bán dòng chip H20 tại Trung Quốc vốn được thiết kế để tuân thủ các quy định xuất khẩu.
Nvidia hiện đang tích cực vận động hành lang, lập luận rằng cấm xuất khẩu công nghệ AI có thể phản tác dụng. Nếu Mỹ không cung cấp công nghệ, các đối thủ như Huawei (Trung Quốc) sẽ chiếm lĩnh thị trường, đe dọa vị thế dẫn đầu của Mỹ trong lĩnh vực AI.
Một số tín hiệu tích cực đã xuất hiện vào tháng 5, chính quyền Mỹ tạm hoãn các quy định hạn chế xuất khẩu công nghệ AI sang Trung Đông, mở ra cơ hội cho Nvidia mở rộng thị trường ngoài Trung Quốc.
Sự thống trị của Nvidia không chỉ đến từ hiệu năng phần cứng mà còn là khả năng tích hợp phần mềm, dịch vụ và hạ tầng toàn diện. Công ty duy trì vị thế dẫn đầu bằng tốc độ đổi mới, khả năng thích ứng với thị trường và sự hiện diện toàn cầu trong các hệ sinh thái AI.
Tuy nhiên, thách thức vẫn còn đó gồm cạnh tranh nội bộ từ khách hàng, các phương pháp đào tạo AI ít phụ thuộc phần cứng, và yếu tố địa chính trị đều có thể ảnh hưởng đến tốc độ tăng trưởng trong tương lai.
Huawei tuyên bố có phương pháp huấn luyện AI tốt hơn DeepSeek nhờ dùng chip Ascend
Tiến bộ của Huawei trong kiến trúc mô hình trí tuệ nhân tạo (AI) mang ý nghĩa quan trọng, khi gã khổng lồ công nghệ Trung Quốc nỗ lực giảm sự phụ thuộc vào công nghệ Mỹ.
Các nhà nghiên cứu đang làm việc trên mô hình ngôn ngữ lớn Pangu của Huawei cho biết họ đã cải tiến phương pháp huấn luyện AI ban đầu của DeepSeek bằng cách tận dụng chip AI độc quyền thuộc công ty.
Một bài báo của nhóm nghiên cứu Pangu đã giới thiệu khái niệm Mixture of Grouped Experts (MoGE - tổ hợp các chuyên gia theo nhóm). Đây là phiên bản nâng cấp cho kỹ thuật Mixture of Experts (MoE - tổ hợp các chuyên gia), vốn đóng vai trò then chốt trong các mô hình AI tiết kiệm chi phí của DeepSeek.
MoE là phương pháp học máy phân chia một mô hình AI thành các mạng con riêng biệt, hay còn gọi là các expert (chuyên gia), mỗi expert tập trung vào một tập hợp con dữ liệu đầu vào, để cùng nhau thực hiện nhiệm vụ. Cách tiếp cận này được cho giúp giảm đáng kể chi phí tính toán trong quá trình tiền huấn luyện mô hình AI và tăng tốc độ xử lý ở giai đoạn suy luận.
Theo bài báo của Huawei, dù MoE giúp tiết kiệm tài nguyên điện toán với các mô hình AI có số lượng tham số lớn và khả năng học tăng cường, nhưng kỹ thuật này thường dẫn đến sự không hiệu quả trong việc thực thi. Nguyên nhân là do việc kích hoạt không đồng đều các expert, khiến hiệu suất giảm khi chạy song song trên nhiều thiết bị.
Theo các nhà nghiên cứu của Huawei, MoGE cải tiến bằng cách "gom các expert lại trong quá trình lựa chọn và phân bổ khối lượng công việc tốt hơn".
Trong huấn luyện AI, expert đề cập đến các mô hình con hoặc thành phần chuyên biệt trong một mô hình lớn hơn, mỗi cái được thiết kế để xử lý một nhiệm vụ cụ thể hoặc loại dữ liệu riêng biệt. Điều này giúp hệ thống tổng thể tận dụng chuyên môn đa dạng để nâng cao hiệu suất.
Bước tiến đó đến vào thời điểm quan trọng, khi các công ty AI Trung Quốc đang tập trung vào việc cải thiện hiệu suất huấn luyện và suy luận của mô hình thông qua cải tiến thuật toán, cũng như sự kết hợp chặt chẽ giữa phần cứng và phần mềm, bất chấp các hạn chế từ Mỹ trong việc xuất khẩu các chip AI tiên tiến như của Nvidia.
Các nhà nghiên cứu của Huawei đã thử nghiệm kiến trúc mới này trên bộ xử lý thần kinh (NPU) Ascend - chip được thiết kế để tăng tốc các tác vụ AI. Họ nhận thấy rằng MoGE "giúp cân bằng khối lượng công việc giữa các expert tốt hơn, thực thi hiệu quả hơn cho cả huấn luyện và suy luận mô hình".
So với các mô hình AI như DeepSeek-V3, Qwen2.5-72B của Alibaba và Llama-405B của Meta Platforms, Pangu đạt được hiệu suất hàng đầu trong hầu hết bài kiểm tra tiếng Anh tổng quát và tất cả bài kiểm tra tiếng Trung, đồng thời cho thấy hiệu quả cao hơn trong huấn luyện ngữ cảnh dài (xử lý và hiểu được những đoạn văn bản rất dài), theo bài báo.
Các nhà nghiên cứu của Huawei cũng cho biết Pangu vượt trội trong các nhiệm vụ hiểu ngôn ngữ tổng quát, đặc biệt là tác vụ suy luận.
Tiến bộ của Huawei trong kiến trúc mô hình AI có thể mang tính đột phá, khi công ty có trụ sở tại thành phố Thâm Quyến (Trung Quốc) đang tìm cách giảm sự phụ thuộc vào công nghệ Mỹ trong bối cảnh các lệnh trừng phạt vẫn tiếp diễn. Chip AI Ascend của Huawei được xem là lựa chọn thay thế trong nước cho một số sản phẩm Nvidia.
Pangu Ultra, mô hình ngôn ngữ lớn với 135 tỉ tham số được tối ưu hóa cho NPU, là minh chứng rõ ràng cho hiệu quả của những cải tiến kiến trúc và hệ thống từ Huawei.
Theo Huawei, quá trình huấn luyện gồm ba giai đoạn chính: Tiền huấn luyện, mở rộng ngữ cảnh dài và hậu huấn luyện. Điều này liên quan đến tiền huấn luyện với 13.200 tỉ token và mở rộng ngữ cảnh dài bằng 8.192 chip Ascend.
Các nhà nghiên cứu cho biết mô hình và hệ thống này sẽ sớm được cung cấp cho khách hàng thương mại của Huawei.
"R1-0528 giúp DeepSeek hãng dẫn đầu về mô hình AI mã nguồn mở"
Thông tin trên được Huawei công bố sau khi DeepSeek đạt bước tiến lớn với R1-0528, bản cập nhật cho mô hình suy luận R1.
DeepSeek nhấn mạnh về những cải tiến về khả năng suy luận và viết sáng tạo của R1-0528, giúp mô hình này giỏi hơn trong việc viết các bài văn nghị luận, tiểu thuyết và văn xuôi theo phong cách gần giống các tác giả là con người. Theo công ty khởi nghiệp có trụ sở ở thành phố Hàng Châu (Trung Quốc), khả năng lập trình của R1-0528 cũng được nâng cao.
DeepSeek cho biết R1-0528 đã giảm 50% hiện tượng "ảo giác", tức mô hình AI tạo ra thông tin sai lệch, không dựa trên cơ sở thực tế.
Những cải tiến này đạt được nhờ việc đầu tư thêm tài nguyên điện toán vào giai đoạn hậu huấn luyện (thời điểm các nhà phát triển thực hiện những điều chỉnh cuối cùng sau quá trình huấn luyện chính), theo công ty khởi nghiệp AI Trung Quốc. Hậu huấn luyện thường tập trung vào việc nâng cao hiệu quả, tính an toàn và độ chính xác của nội dung.
"Mô hình R1 được cập nhật đã vượt trội các mô hình AI trong nước ở nhiều bài kiểm tra chuẩn, gồm toán học, lập trình và tư duy logic tổng quát, và sánh ngang những mô hình hàng đầu toàn cầu như o3 của OpenAI và Gemini 2.5 Pro của Google", DeepSeek tuyên bố.
Tư duy logic tổng quát đề cập đến khả năng suy luận hợp lý, phân tích và giải quyết vấn đề một cách logic trong nhiều bối cảnh khác nhau, không giới hạn trong một lĩnh vực chuyên môn cụ thể.
R1-0528 được DeepSeek phát hành hôm 28.5, khoảng 1 tháng sau khi R1 bị Qwen3 (mô hình hàng đầu của gã khổng lồ thương mại điện tử Alibaba) soán ngôi hồi cuối tháng 4 trên bảng xếp hạng LiveBench dành cho các hệ thống AI mã nguồn mở. Sự thay đổi này cho thấy mức độ cạnh tranh gay gắt giữa các hãng công nghệ Trung Quốc trong cuộc đua phát triển AI.
Các kết quả đánh giá hiệu năng mà DeepSeek trích dẫn cho thấy R1-0528 đã vươn lên dẫn đầu, vượt Qwen3, vốn chỉ mới ra mắt một tháng trước đó.
R1-0528 cho thấy DeepSeek đã "vượt xAI, Meta Platforms và Anthropic để trở thành phòng thí nghiệm AI số thứ 2 thế giới, chỉ kém OpenAI", theo nhận định từ công ty tư vấn Artificial Analysis.
Artificial Analysis nhấn mạnh rằng DeepSeek đã trở thành công ty dẫn đầu không thể chối cãi trong lĩnh vực mô hình AI mã nguồn mở, khi khoảng cách giữa mô hình nguồn mở và đóng đang thu hẹp đáng kể.
So với các mô hình AI nguồn đóng, R1-0528 chỉ xếp sau o4-mini (bản High) và o3 thuộc OpenAI trong bảng chỉ số trí tuệ của Artificial Analysis. Đây là bảng xếp hạng các mô hình AI hàng đầu theo năng lực toán học, lập trình, kiến thức chuyên ngành và hiểu ngôn ngữ.
Nền tảng đánh giá độc lập LiveCodeBench cũng báo cáo rằng R1-0528 đã cải thiện rõ rệt trong khả năng lập trình có sự hỗ trợ của AI.
Hiện tại, R1-0528 được xếp hạng là mô hình AI hàng đầu Trung Quốc về khả năng lập trình trên bảng xếp hạng LiveCodeBench, chỉ sau o4-mini-high, o3-high và o4-mini-medium của OpenAI ở quy mô toàn cầu.
R1-0528 vượt qua cả Qwen3 của Alibaba và Claude 3.7 của Anthropic, vốn từng được xem là hai trong những mô hình AI lập trình hàng đầu thế giới hiện nay.
LiveCodeBench là nền tảng đánh giá chuyên sâu về khả năng lập trình của các mô hình AI.
Việc ra mắt R1-0528 đã thu hút sự chú ý từ cộng đồng công nghệ cả trong và ngoài Trung Quốc, tạo nên làn sóng áp dụng mô hình này nhanh chóng tương tự khi R1 được giới thiệu hồi tháng 1. R1 từng gây ấn tượng mạnh với các nhà phát triển nhờ hiệu năng cao và chi phí huấn luyện thấp.
Các hãng công nghệ lớn Trung Quốc như Tencent Holdings, Baidu và ByteDance (chủ sở hữu TikTok) đều công bố tích hợp R1-0528 vào nền tảng điện toán đám mây của họ dành cho nhà phát triển và khách hàng doanh nghiệp.
Trên phạm vi toàn cầu, các công ty khởi nghiệp hạ tầng và huấn luyện AI như Fireworks AI, Hyperbolics cũng tích hợp R1-0528 vào nền tảng của họ.
Nvidia có thể duy trì ngôi vương về chip AI trước vô vàn thách thức? Khi nhà đầu tư chuyển chú ý sang khả năng sinh lời thực sự của AI, câu hỏi đặt ra là liệu Nvidia có thể duy trì ngôi vương này trước nhiều thách thức, từ cạnh tranh khốc liệt đến bất ổn địa chính trị. (Ảnh: CNBC). Nvidia Corp. đã trở thành nhà sản xuất chip giá trị nhất thế giới nhờ vị...











Tiêu điểm
Tin đang nóng
Tin mới nhất

Google công bố Offerwall bù đắp thu nhập cho báo chí trước làn sóng AI

DeepSeek hoãn ra mắt AI mới

Ra mắt mô hình AI chuyên phục vụ tín đồ thời trang

Google Photos kết hợp công cụ tìm kiếm truyền thống với AI

Apple tìm cách 'gỡ gạc' tại Trung Quốc

Cuộc 'thập tự chinh' của AI

Mã độc hoành hành, nhiều nhà quản lý vẫn xem nhẹ an ninh mạng

Sử dụng AI có trách nhiệm trong lĩnh vực quốc phòng

Phát hiện phần mềm gián điệp nhắm mục tiêu người dùng App Store và Google Play

Trí tuệ nhân tạo: Thêm một phán quyết có lợi cho các công ty AI Mỹ trong cuộc chiến bản quyền

Microsoft cung cấp thêm một năm hỗ trợ miễn phí cho Windows 10

Google DeepMind ra mắt AI Gemini Robotics phiên bản ngoại tuyến
Có thể bạn quan tâm

Tổng thống Ukraine ký sắc lệnh rút khỏi Công ước cấm mìn sát thương
Thế giới
23:25:19 29/06/2025
Video Midu được chồng tặng 2 chiếc túi tiền tỷ bằng cách độc lạ, nhưng bất ngờ hơn cả là khi Minh Đạt nói lí do!
Sao việt
23:04:55 29/06/2025
Một đêm ở Thượng Hải: Nam phụ xuất sắc nhất "dạy cho showbiz một bài học" đắt giá
Sao châu á
22:56:53 29/06/2025
Nhà Thanh suy tàn, lời tiên tri của một đạo sĩ mù ứng nghiệm, nội dung rợn người
Netizen
22:18:03 29/06/2025
Trấn Thành trở lại
Tv show
22:04:34 29/06/2025
Tôi về nhà giữa đêm, thấy mẹ nằm co ro một mình còn vợ tôi "biến mất", gọi điện cho cô ấy thì nhận được câu trả lời sốc ngang hông
Góc tâm tình
21:51:22 29/06/2025
Cục Hàng không ra chỉ thị 'nóng' sau vụ 2 máy bay va chạm
Tin nổi bật
21:20:02 29/06/2025
Dấu chấm hết cho Onana
Sao thể thao
21:11:29 29/06/2025