Ông trùm chatbot thừa nhận: Chính chúng tôi cũng không hiểu AI nghĩ gì

Không gian khởi nghiệp | 09/05/2025 09:15

CEO Anthropic thừa nhận ngay cả người tạo ra cũng không thật sự hiểu cách AI hoạt động, làm dấy lên lo ngại về tính minh bạch và an toàn của công nghệ này.

Trong một phát biểu thẳng thắn hiếm hoi, Dario Amodei – CEO Anthropic, công ty đang phát triển chatbot Claude đã khiến giới công nghệ phải giật mình khi thừa nhận: "Không ai, kể cả chính những người tạo ra, thực sự hiểu cách mà AI hoạt động". Tuyên bố này không chỉ phản ánh một thực trạng kỹ thuật mà còn chạm đến mối lo ngại sâu xa về tính minh bạch và an toàn trong kỷ nguyên trí tuệ nhân tạo phát triển với tốc độ chóng mặt.

Amodei giải thích rằng khi một hệ thống AI thực hiện một nhiệm vụ như tóm tắt báo cáo tài chính, nó đưa ra những lựa chọn ngôn ngữ hoặc quyết định logic mà đến cả đội ngũ kỹ sư cũng không thể lý giải cụ thể. Những mô hình AI ngày nay hoạt động dựa trên các ma trận khổng lồ được huấn luyện bằng dữ liệu hàng tỷ dòng, nhưng lý do vì sao chúng chọn một từ mà không phải từ khác, hoặc vì sao lại đột nhiên mắc lỗi, vẫn là điều bí ẩn.

Ông trùm chatbot thừa nhận: Chính chúng tôi cũng không hiểu AI nghĩ gì

Không ai, kể cả chính những người tạo ra, thực sự hiểu cách mà AI hoạt động

Sự không chắc chắn đó, theo ông, là điều chưa từng xảy ra trong lịch sử các ngành công nghệ khác. Với phần mềm truyền thống, kỹ sư có thể lần theo từng dòng code để hiểu nguyên nhân của một lỗi. Nhưng với AI, các mô hình trở nên quá phức tạp và tự phát, khiến việc "gỡ rối" logic hoạt động bên trong trở nên gần như bất khả thi. Đó chính là lý do khiến ông kêu gọi cộng đồng công nghệ cần có một "máy quét MRI cho AI" – một phương pháp khoa học và hệ thống để soi chiếu và giải mã cơ chế vận hành bên trong của các mô hình trí tuệ nhân tạo trong thập kỷ tới.

Không chỉ dừng lại ở lý thuyết, Anthropic công ty do Dario Amodei cùng chị gái Daniela thành lập sau khi rời OpenAI vì lo ngại vấn đề an toàn đã đầu tư mạnh vào các thử nghiệm mô phỏng tấn công, hay còn gọi là "red team" và "blue team". Mục tiêu là kiểm tra và tìm hiểu xem AI sẽ phản ứng ra sao trong các tình huống nguy hiểm tiềm ẩn, đồng thời cải thiện khả năng kiểm soát và giám sát từ phía con người.

Những nỗ lực này phản ánh tầm nhìn lâu dài của Amodei: trí tuệ nhân tạo không chỉ là công cụ kỹ thuật số mà là lực lượng có thể định hình lại toàn bộ nền kinh tế, xã hội và bản chất của tương lai nhân loại. Và chính vì AI đang tiệm cận sức mạnh đó, việc hiểu được cách nó hoạt động – hiểu đúng và hiểu sâu không còn là đặc quyền của các chuyên gia, mà là nhu cầu sống còn của cả nền văn minh. "Trước khi AI định hình thế giới, chúng ta cần đảm bảo mình hiểu được thứ mình đang tạo ra", ông khẳng định.

Gia Bảo