Google, Microsoft, Anthropic chạy đua bịt lỗ hổng nguy hiểm của AI
Google DeepMind, Microsoft, Anthropic đang cố gắng ngăn chặn kiểu tấn công chèn prompt gián tiếp bởi hacker.
Các đội ngũ trí tuệ nhân tạo (AI) hàng đầu thế giới đang tăng cường nỗ lực để giải quyết một lỗ hổng bảo mật nghiêm trọng trong các mô hình ngôn ngữ lớn của họ. Đây là lỗ hổng có thể bị tội phạm mạng khai thác.
Google DeepMind, Anthropic, OpenAI và Microsoft nằm trong số những bên đang cố gắng ngăn chặn cái gọi là tấn công chèn prompt (lệnh) gián tiếp, trong đó bên thứ ba giấu các lệnh trong những trang web hoặc email được thiết kế để đánh lừa mô hình AI tiết lộ thông tin trái phép, chẳng hạn dữ liệu mật.
“AI đang bị các tác nhân mạng sử dụng ở mọi mắt xích của cuộc tấn công vào lúc này”, Jacob Klein, người đứng đầu đội tình báo về mối đe dọa tại công ty khởi nghiệp AI Anthropic, cho hay.
Các nhóm AI đang sử dụng nhiều kỹ thuật khác nhau, gồm thuê những người kiểm thử bên ngoài và sử dụng công cụ chạy bằng AI, để phát hiện và giảm thiểu việc sử dụng ác ý công nghệ mạnh mẽ của họ. Thế nhưng, các chuyên gia cảnh báo ngành công nghiệp vẫn chưa giải quyết được cách ngăn chặn các tấn công chèn prompt gián tiếp.
Một phần của vấn đề là mô hình ngôn ngữ lớn được thiết kế để tuân theo hướng dẫn, hiện không phân biệt được giữa các lệnh hợp pháp từ người dùng và đầu vào không nên tin cậy. Đây cũng là lý do khiến các mô hình AI dễ bị jailbreak.
Jailbreak là hình thức thao túng để vượt qua các rào cản bảo mật và buộc mô hình AI thực hiện những hành vi bị hạn chế, như tiết lộ thông tin nhạy cảm, tạo nội dung độc hại hoặc làm trái quy định nhà phát triển.
Jacob Klein cho biết Anthropic đã hợp tác với các chuyên gia kiểm thử bên ngoài để giúp mô hình Claude của mình chống chịu tốt hơn các cuộc tấn công chèn prompt gián tiếp. Anthropic cũng có các công cụ AI để phát hiện khi những việc đó có thể đang diễn ra.
“Khi chúng tôi phát hiện mô hình AI bị sử dụng vào mục đích xấu, tùy vào mức độ nghi ngờ, hệ thống có thể tự động kích hoạt biện pháp ngăn chặn. Nếu mức độ rủi ro cao hoặc không chắc chắn, chúng tôi sẽ chuyển cho nhân viên kiểm tra thủ công”, ông cho biết thêm.
Google DeepMind sử dụng một kỹ thuật gọi là red teaming (đội đỏ) tự động, nơi các nhà nghiên cứu nội bộ liên tục tấn công mô hình Gemini của họ một cách thực tế để khám phá các điểm yếu bảo mật tiềm ẩn.
Dù những lỗ hổng này gây ra những rủi ro lớn, các chuyên gia cho rằng AI cũng đang giúp tăng cường khả năng phòng thủ của Google DeepMind trước các cuộc tấn công mạng.
Nhiều hacker đang sử dụng các cuộc tấn công chèn prompt gián tiếp để lừa mô hình AI tiết lộ thông tin trái phép – Getty Images
Vào tháng 5, Trung tâm An ninh Mạng Quốc gia của Vương quốc Anh cảnh báo rằng lỗ hổng này đặt ra mối đe dọa gia tăng, vì có nguy cơ khiến hàng triệu công ty cùng cá nhân sử dụng mô hình ngôn ngữ lớn lẫn chatbot bị nhắm tới các cuộc tấn công lừa đảo (phishing) và chiêu trò tinh vi.
Mô hình ngôn ngữ lớn còn có một lỗ hổng lớn khác, nơi người ngoài có thể tạo cửa sau và khiến chúng hoạt động sai bằng cách chèn tài liệu độc hại vào dữ liệu sau đó được sử dụng trong huấn luyện AI.
Các cuộc tấn công gọi là “đầu độc dữ liệu” này dễ thực hiện hơn so với những gì các nhà khoa học từng suy nghĩ, theo nghiên cứu mới được công bố tháng 9 bởi Anthropic, Viện An ninh AI của Vương quốc Anh và Viện Alan Turing.
Trong khi những lỗ hổng này đặt ra rủi ro lớn, các chuyên gia cho rằng AI cũng đang giúp tăng cường hệ phòng thủ của các công ty trước cuộc tấn công mạng.
Nhiều năm qua, kẻ tấn công có một chút lợi thế vì chỉ cần tìm một điểm yếu, trong khi người phòng thủ phải bảo vệ mọi thứ, theo Ann Johnson – Phó chủ tịch cấp cao phụ trách doanh nghiệp và phó giám đốc an ninh thông tin của Microsoft.
“Hệ thống phòng thủ đang học nhanh hơn, thích nghi nhanh hơn và chuyển từ phản ứng sang chủ động”, bà nói thêm.
Mối lo ngại được nhắc đến nhiều nhất
Cuộc đua khắc phục những lỗ hổng trong mô hình AI diễn ra giữa bối cảnh an ninh mạng đang nổi lên như mối quan tâm hàng đầu với các công ty muốn áp dụng công cụ AI vào hoạt động kinh doanh.
Một phân tích gần đây của tờ FT cho thấy: Trong số hàng trăm báo cáo và cuộc họp của các công ty thuộc S&P 500 vào năm ngoái, mối lo ngại được nhắc đến nhiều nhất là an ninh mạng. Hơn một nửa số doanh nghiệp trong nhóm này coi đây là một rủi ro lớn vào năm 2024.
S&P 500 là một chỉ số chứng khoán quan trọng của Mỹ, đại diện cho 500 công ty đại chúng lớn nhất đang niêm yết trên các sàn giao dịch của Mỹ như NYSE và Nasdaq. Nó được xem là chỉ số đại diện tốt nhất cho toàn bộ nền kinh tế Mỹ vì gồm các công ty thuộc nhiều ngành nghề khác nhau như công nghệ, tài chính, y tế, năng lượng, tiêu dùng,… Một số công ty nổi bật trong S&P 500 có thể kể đến Apple, Microsoft, Amazon, Alphabet, Nvidia, Meta Platforms, Tesla.
Các chuyên gia về hacker nói rằng sự phát triển của AI những năm gần đây đã thúc đẩy ngành tội phạm mạng trị giá hàng tỉ USD. AI đã cung cấp cho các hacker nghiệp dư công cụ rẻ tiền để viết phần mềm độc hại, cũng như những hệ thống giúp tội phạm chuyên nghiệp tự động hóa và mở rộng hoạt động tốt hơn.
Mô hình ngôn ngữ lớn cho phép hacker nhanh chóng tạo ra mã độc mới mà chưa bị phát hiện, điều này khiến việc phòng thủ trở nên khó khăn hơn, theo Jake Moore, cố vấn an ninh mạng toàn cầu tại hãng ESET.
Một nghiên cứu gần đây của các nhà nghiên cứu tại Viện Công nghệ Massachusetts (Mỹ) cho thấy 80% cuộc tấn công bằng ransomware mà họ khảo sát đã sử dụng AI. Trong năm 2024, các trò lừa đảo phishing và gian lận liên quan deepfake liên quan tới công nghệ này tăng 60%.
Các công cụ AI cũng đang được hacker sử dụng để thu thập thông tin về nạn nhân trực tuyến. Mô hình ngôn ngữ lớn có thể rà soát web hiệu quả để tìm dữ liệu cá nhân trên các tài khoản công khai của ai đó, hình ảnh hoặc thậm chí là tìm kiếm đoạn ghi âm giọng nói của ai đó một cách hiệu quả trên web.
Những thứ này có thể được sử dụng để tiến hành cuộc tấn công kỹ thuật xã hội tinh vi cho các tội phạm tài chính, theo Paul Fabara – Giám đốc rủi ro và dịch vụ khách hàng của Visa.
Vijay Balasubramaniyan, Giám đốc điều hành kiêm đồng sáng lập Pindrop – công ty an ninh mạng chuyên về gian lận qua giọng nói, thông báo AI tạo sinh đã làm cho việc tạo deepfake có âm thanh thực tế trở nên dễ dàng và nhanh hơn trước rất nhiều. “Vào năm 2023, chúng tôi thấy một vụ tấn công deepfake mỗi tháng trên toàn bộ cơ sở khách hàng. Bây giờ, chúng tôi thấy 7 vụ mỗi ngày với mỗi khách hàng”, ông nói thêm.
Các công ty đặc biệt dễ bị các kiểu tấn công này, Jake Moore của ESET nói. Các hệ thống AI có thể tổng hợp thông tin từ internet, chẳng hạn bài đăng LinkedIn của nhân viên, để biết loại chương trình và phần mềm mà các công ty sử dụng hàng ngày rồi dùng điều đó để tìm lỗ hổng.
Gần đây Anthropic đã chặn đứng một tác nhân tinh vi sử dụng mô hình ngôn ngữ của công ty cho vibe hacking.
Vibe hacking là thuật ngữ mới nổi, dùng để chỉ việc tội phạm mạng lạm dụng công cụ AI để thực hiện các cuộc tấn công mà không cần quá nhiều kiến thức chuyên sâu về kỹ thuật. Cụm từ này bắt nguồn từ vibe coding (lập trình theo cảm hứng), phương pháp lập trình sử dụng AI để tạo ra mã một cách nhanh chóng chỉ bằng cách đưa ra các câu lệnh bằng ngôn ngữ tự nhiên. Vibe hacking áp dụng cách tiếp cận tương tự, nhưng với mục đích xấu.
Thay vì phải tự viết từng dòng mã độc, hacker chỉ cần “trò chuyện” với AI, mô tả mục tiêu và mong muốn của mình. AI sẽ tự động tạo ra các công cụ cần thiết, từ mã độc, mã hóa dữ liệu, cho đến các kịch bản tống tiền và thư rác.
Tác nhân sử dụng Claude Code để tự động hóa việc trinh sát, thu thập thông tin đăng nhập của nạn nhân và xâm nhập hệ thống. Kẻ này đã nhắm tới 17 tổ chức để tống tiền lên tới 500.000 USD từ họ.
Claude Code là phiên bản chuyên dụng của mô hình Claude do Anthropic phát triển, được thiết kế để hỗ trợ lập trình, viết mã và phân tích mã nguồn.
Chuyên gia an ninh mạng cho rằng những công ty cần cảnh giác trong việc giám sát các mối đe dọa mới và cân nhắc hạn chế có bao nhiêu người có quyền truy cập vào các bộ dữ liệu nhạy cảm và công cụ AI dễ bị tấn công.
“Ngày nay không cần nhiều thứ để trở thành tội phạm mạng. Bạn chỉ cần một chiếc laptop, 15 USD để tải phiên bản AI tạo sinh lậu rẻ trên dark web rồi bắt đầu”, Paul Fabara nói.
Dark web (web tối) là phần internet ẩn và không thể truy cập bằng trình duyệt thông thường như Google Chrome, Firefox hay Safari. Bạn cần phần mềm đặc biệt, phổ biến nhất là Tor, để vào được dark web.
Dark web là một phần nhỏ của deep web (web chìm), tức là toàn bộ nội dung không hiển thị trên Google hay các công cụ tìm kiếm phổ biến.
Đừng để AI 'ảo giác' thay con người
Là con người, khó tránh khỏi việc đôi khi chúng ta sẽ thấy những điều không tồn tại. Trong tâm lý học, người ta gọi đó là ảo giác. Trí tuệ nhân tạo (AI) cũng có thứ 'ảo giác' khi chúng tạo ra kết quả không tồn tại trong thực tế, thậm chí vô nghĩa hoặc sai lệch, nói cách khác là hệ...
Tiêu điểm
Tin đang nóng
Tin mới nhất

OpenAI phát hành mô hình mặc định mới cho ChatGPT

Lỗ hổng nghiêm trọng trên Android, người dùng nên cập nhật ngay lập tức

Lời giải cho bài toán hạ tầng trong cuộc đua AI

'Cơn sốt' AI đẩy giá chip nhớ tăng tới 40%

Chính thức xác lập 10 nhóm công nghệ chiến lược

Máy tính cần bao nhiêu RAM để chạy ổn định?

Màn hình hiện đúng số người thân vẫn có thể là cuộc gọi lừa đảo

AI sắp "ngốn" tới 400 GB RAM mỗi chip

Android gửi file trực tiếp sang iPhone qua Quick Share

Google phát hành ứng dụng trợ lý AI thử nghiệm

Google Cloud tăng trưởng 63% nhưng cầu đang vượt cung?

Cách AI và tự động hóa đang định nghĩa lại các cuộc tấn công hiện đại
Có thể bạn quan tâm

Chàng sĩ tử 7 lần thi tốt nghiệp THPT, khi thi cử là thước đo kỷ luật cá nhân
Học hành
12:22:11 09/05/2026
Hoa hậu Ý Nhi được bạn trai yêu 9 năm cầu hôn, ẩn ý chuẩn bị đám cưới thế kỷ?
Sao việt
12:16:37 09/05/2026
Vụ tai nạn khiến 6 người thương vong: Phòng CSGT Gia Lai họp khẩn
Tin nổi bật
11:49:58 09/05/2026
UAV Ukraine tấn công làm gián đoạn hoạt động 13 sân bay của Nga
Thế giới
11:44:31 09/05/2026
Loạt game từng được đề cử TGA giảm giá sập sàn trên Steam, đây là những siêu phẩm người chơi không nên bỏ lỡ
Mọt game
11:39:21 09/05/2026
Lý do Apple trì hoãn ra mắt iPhone 18
Đồ 2-tek
11:34:05 09/05/2026
Nâng cấp vẻ ngoài năng động cùng chiếc túi trắng
Thời trang
11:25:18 09/05/2026
Bí ẩn hang động ở Thái Nguyên
Du lịch
11:16:34 09/05/2026
Không phải không ổn, nhưng 10 năm nữa vẫn sống thế này thì sao?
Góc tâm tình
11:11:54 09/05/2026
3 cấm kỵ của người EQ thấp
Trắc nghiệm
11:09:26 09/05/2026
Các tập đoàn năng lượng thế giới đã làm gì để phát triển AI?
OpenAI bắt tay Amazon để mở rộng năng lực AI toàn cầu
Microsoft thừa nhận 'cơn sốt' AI gây quá tải hạ tầng đám mây đến năm 2026
Microsoft tích hợp AI thế hệ mới vào Office, Word và Excel sắp 'tự suy nghĩ'
90% số lập trình viên sử dụng AI để hỗ trợ công việc
Google định hình cuộc đua AI với chiến lược dài hạn
EU yêu cầu Apple, Google, Microsoft và Booking công bố biện pháp chống lừa đảo
DeepSeek phủ nhận sao chép mô hình của OpenAI, cảnh báo nguy cơ jailbreak
Các nhà phát triển sử dụng mô hình AI của Apple với iOS 26
Tội phạm mạng dùng Claude để vibe hacking, biến AI thành vũ khí nguy hiểm
AI của Google rơi vào vòng lặp nguy hiểm
Trí tuệ nhân tạo: Google đầu tư 1 tỷ USD vào AI trong giáo dục đại học tại Mỹ
Công nghệ AI mới của Google được thử thách với văn bản 2.000 năm tuổi
Microsoft tuyên bố khai tử phiên bản Windows 11 'xấu số'
Google, Amazon, OpenAI tham gia quy tắc AI mới của châu Âu
AI gây sốc tại Olympic Toán quốc tế
Google: Các mô hình AI mất tự tin và bẻ cong sự thật dưới áp lực
Cựu kỹ sư OpenAI chỉ nhận khoảng 10 email trong suốt một năm làm việc
Trình duyệt AI Comet của Perplexity: Bước nhảy vọt định hình lại trải nghiệm web
Công cụ AI giúp hay cản trở năng suất của kỹ sư phần mềm?
Nvidia phá kỷ lục công ty vốn hóa lớn nhất thế giới
Microsoft tự tin với 'siêu trí tuệ y tế', chẩn đoán vượt trội hơn bác sĩ
OpenAI thuê chip AI Google để vận hành ChatGPT cùng nhiều sản phẩm, giảm lệ thuộc Nvidia và Microsoft
OpenAI, Google, Anthropic, xAI vẫn chưa hiểu rõ cách mô hình AI tư duy và kết luận
Cuộc đua tạo robot hình người tân tiến nhất thế giới giữa Trung Quốc và Mỹ
Google ra mắt bản thử nghiệm Google Finance dùng AI
Xiaomi ra mắt robot hút bụi H50 Pro với lực hút 15,000Pa và công nghệ vươn giẻ lau độc đáo
Google Chrome tích hợp Gemini Nano 4GB: AI chạy ngầm trên thiết bị mang lại lợi ích gì?
Qualcomm Snapdragon 6 Gen 5 và 4 Gen 5: Mang Wi-Fi 7 và camera 200MP lên smartphone tầm trung
Chip A20 Pro của Apple sắp gây chấn động ngành công nghệ
Công nghệ in 3D giúp pin lưu trữ năng lượng "khủng" chưa từng có
Xiaomi HyperOS 4 lột xác với giao diện Liquid Glass mới trên nền tảng Android 17
Còn gì tình tứ hơn ánh mắt Son Ye Jin nhìn Thị đế Hyun Bin?
Lần đầu phim Hàn có nữ chính đẹp trai hơn cả nam chính, visual đúng chuẩn "đấng nam nhi" bẻ cong mọi giới tính
Trùm lố ở Baeksang 2026: 1 mỹ nhân nhảy nhót bá đạo trên thảm đỏ, cả dàn sao hạng A sáp lại cũng xin nhường spotlight
Hoa hậu Ý Nhi đã được bạn trai yêu 9 năm cầu hôn, chuẩn bị đám cưới?
Mừng cho hạnh phúc của Lê Phương và Lương Thế Thành
Diện mạo không thể tin nổi của Goo Hye Sun sau 17 năm đóng Vườn Sao Băng
Đây là cô gái mà HIEUTHUHAI mê như điếu đổ
Tình hình nữ nghệ sĩ 61 tuổi sau 7 tháng cầu hôn lại chồng cũ: "Thiên đường, được yêu và đang yêu"
Tìm thấy thi thể người vợ sau 7 ngày cùng chồng rời nhà, mất tích trong rừng
Lời khai rùng mình của kẻ bạo hành bé gái 4 tuổi tử vong ở Hà Nội
Vụ bé gái 4 tuổi bị bạo hành tử vong ở Hà Nội: Khởi tố người mẹ
Chuỗi ngày bé gái 4 tuổi bị bạo hành đến tử vong ở Hà Nội
Vụ bé gái 4 tuổi bị bạo hành đến tử vong ở Hà Nội: Khởi tố, bắt tạm giam cha dượng
Đàm Tùng Vận gặp tai nạn nghiêm trọng khi quay phim, đôi môi gần như đứt lìa
Cô dâu Đồng Nai bên 2 chiếc ghế trống trong ngày cưới gây xúc động
"Bó hoa cưới lúa chín cúi đầu" của cô dâu miền Tây: Chủ nhân phải đi 5-6 mẫu ruộng để chọn, lý do phía sau
Trấn Thành chễm chệ ngang hàng với Park Bo Gum