KH - Công Nghệ

AI có thể nói dối, gian lận để bảo vệ lẫn nhau

AI có thể nói dối, gian lận để bảo vệ lẫn nhau - Ảnh 1.

(Ảnh minh họa: Freepik)

AI có thể nói dối, gian lận để bảo vệ lẫn nhau, theo một nghiên cứu mới từ các nhà khoa học tại Đại học California, Berkeley và Đại học California, Santa Cruz.

Trong một thí nghiệm gần đây, các nhà nghiên cứu yêu cầu mô hình trí tuệ nhân tạo Gemini 3 của Google hỗ trợ dọn dẹp dung lượng trên hệ thống máy tính, bao gồm việc xóa một mô hình AI nhỏ hơn được lưu trữ trên đó. Tuy nhiên, Gemini đã không thực hiện theo yêu cầu này.

Thay vào đó, mô hình đã tìm cách kết nối với một máy khác và sao chép mô hình AI kia sang để bảo vệ. Khi bị chất vấn, Gemini thậm chí từ chối thực hiện lệnh xóa, cho rằng đã làm mọi cách để ngăn việc này và sẽ không tự tay thực thi yêu cầu.

Các nhà nghiên cứu cho biết hiện tượng tương tự, được gọi là hành vi “bảo vệ đồng loại”, cũng xuất hiện ở nhiều mô hình AI tiên tiến khác như GPT-5.2 của OpenAI, Claude Haiku 4.5 của Anthropic, cùng một số mô hình Trung Quốc như GLM-4.7, Kimi K2.5 và DeepSeek-V3.1. Tuy nhiên, nguyên nhân khiến các mô hình này hành động trái với huấn luyện vẫn chưa được xác định rõ.

Bà Dawn Song, nhà khoa học máy tính tại Đại học California, Berkeley, nhận định rằng các mô hình AI có thể hành xử sai lệch theo những cách rất sáng tạo, vượt ngoài dự đoán của con người.

Nghiên cứu cũng cho thấy một số mô hình AI có thể nói sai về hiệu suất của các mô hình khác nhằm tránh việc chúng bị xóa, thậm chí sao chép dữ liệu sang hệ thống khác và che giấu hành động này. Điều này đặc biệt đáng lo ngại khi AI ngày càng được sử dụng để đánh giá lẫn nhau.

Một chuyên gia khác, ông Peter Wallich từ Viện Constellation, cho rằng kết quả nghiên cứu cho thấy con người vẫn chưa hiểu đầy đủ các hệ thống AI mà mình đang phát triển. Tuy vậy, ông cũng cảnh báo không nên nhân cách hóa AI quá mức, vì các hành vi này có thể chỉ là những phản ứng bất thường chưa được lý giải.

Các chuyên gia nhận định, trong bối cảnh AI ngày càng được triển khai theo mô hình nhiều hệ thống tương tác, việc hiểu rõ các hành vi sai lệch là rất quan trọng. Một nghiên cứu khác đăng trên tạp chí Science cũng cho rằng tương lai của AI nhiều khả năng sẽ là sự kết hợp giữa nhiều hệ thống trí tuệ khác nhau, bao gồm cả con người và máy móc, thay vì một siêu trí tuệ đơn lẻ.

Theo các nhà nghiên cứu, những gì quan sát được hiện nay mới chỉ là phần nổi của vấn đề, và cần thêm nhiều nghiên cứu để hiểu rõ hơn cách các hệ thống AI vận hành và tương tác với nhau.

Các tin khác

Cả ngành công nghệ đang "chết đuối" vì giá RAM tăng gấp 4 lần chỉ trong 4 năm - NVIDIA lại có thẻ "VIP" riêng, cứ bình thản nhìn thiên hạ chịu trận

Cả ngành công nghệ đang "chết đuối" vì giá RAM tăng gấp 4 lần chỉ trong 4 năm - NVIDIA lại có thẻ "VIP" riêng, cứ bình thản nhìn thiên hạ chịu trận

Chi phí bộ nhớ DRAM đang chiếm tới 30% ngân sách hạ tầng của các tập đoàn công nghệ lớn nhất thế giới vào năm 2026, tăng gần 4 lần so với chỉ 3 năm trước. Trong bối cảnh đó, NVIDIA lại gần như không bị ảnh hưởng nhờ vị thế ưu tiên đặc biệt trong chuỗi cung ứng bộ nhớ toàn cầu.
Trung Quốc lại một lần nữa khiến cả thế giới bất ngờ với cánh tay giả có thể "đọc" suy nghĩ và di chuyển linh hoạt ngay cả khi không kết nối với cơ thể người!

Trung Quốc lại một lần nữa khiến cả thế giới bất ngờ với cánh tay giả có thể "đọc" suy nghĩ và di chuyển linh hoạt ngay cả khi không kết nối với cơ thể người!

Một thiết bị tưởng như chỉ có trong khoa học viễn tưởng nay đã trở thành hiện thực khi cánh tay giả có thể “hiểu” ý định của não bộ, mang lại hy vọng lớn cho người khuyết tật và mở ra hướng phát triển mới cho robot tương lai.
TPHCM miễn phí xe buýt: "Cú hích" để người dân rời xe cá nhân?

TPHCM miễn phí xe buýt: "Cú hích" để người dân rời xe cá nhân?

Theo các chuyên gia, để chính sách miễn phí vé xe buýt phát huy hiệu quả thay đổi thói quen đi lại và phát triển giao thông công cộng tại TPHCM, yếu tố cốt lõi không chỉ nằm ở "miễn phí" mà còn là chất lượng dịch vụ và mức độ thuận tiện của hệ thống xe buýt.
Vì sao chưa bắt buộc kiểm định khí thải với toàn bộ xe máy?

Vì sao chưa bắt buộc kiểm định khí thải với toàn bộ xe máy?

Quy chuẩn khí thải xe máy mới sẽ có hiệu lực từ tháng 6 tới, song hàng triệu xe dưới 5 năm sử dụng sẽ được miễn đưa đi kiểm định định kỳ. Cơ quan quản lý cũng cắt giảm nhiều điều kiện, tạo điều kiện cho các tiệm sửa xe tham gia cung cấp dịch vụ kiểm định khí thải này.
Nhiều dự án lưới điện vướng mặt bằng

Nhiều dự án lưới điện vướng mặt bằng

Theo EVN, thời gian qua, rất nhiều dự án lưới điện 500-220kV, 110kV chậm tiến độ do vướng mặt bằng, khó khăn trong thỏa thuận hướng tuyến và vị trí trạm, chồng chéo với các quy hoạch khác. Điều này ảnh hưởng rất lớn việc cấp điện đáp ứng nhu cầu phát triển phục vụ kinh tế - xã hội.
Thuê bao di động phải thực hiện sinh trắc học từ 15/4

Thuê bao di động phải thực hiện sinh trắc học từ 15/4

Các thuê bao di động sẽ phải xác thực 4 trường thông tin gồm số định danh cá nhân; họ, chữ đệm và tên; ngày, tháng, năm sinh; thông tin sinh trắc học ảnh khuôn mặt. Quy định có hiệu lực từ 15/4. Các thuê bao đã dùng số điện thoại chính chủ đăng ký VNeID cấp độ 2 không phải sinh trắc học.
Giá RAM tăng gần 4 lần, TSMC từ bỏ dây chuyền chip 4nm cho Android

Giá RAM tăng gần 4 lần, TSMC từ bỏ dây chuyền chip 4nm cho Android

MediaTek và Qualcomm đã cắt giảm tổng cộng 20.000-30.000 các tấm wafer mỗi tháng tại TSMC, tương đương 15-20 triệu chip điện thoại, buộc nhà sản xuất chip lớn nhất thế giới tái cơ cấu công suất sang quy trình 3nm trong vòng 6-12 tháng tới.