Trong khi phần lớn thế giới còn đang làm quen với công nghệ AI tạo video, các công ty công nghệ Trung Quốc đã lao vào cuộc đua này với tốc độ chóng mặt – và có vẻ như họ đang chiếm ưu thế.
Theo dữ liệu từ công ty phân tích Artificial Analysis, ByteDance – “cha đẻ” của TikTok – hiện đang sở hữu hai trong số bốn mô hình AI tạo video hàng đầu thế giới, lần lượt giữ vị trí số 1 và số 3. Google bám sát ở vị trí thứ 2 và 4, trong khi Kuaishou, nền tảng video ngắn lớn thứ hai tại Trung Quốc, giữ vị trí thứ 5 với công cụ Kling AI.
Chuyên gia Wei Xiong từ UBS nhận định: “Mảng AI video vẫn đang trong giai đoạn sơ khai, nhưng các công ty Trung Quốc đã nhanh chóng vươn lên dẫn đầu”. Với khả năng tạo video từ hình ảnh hoặc văn bản, công nghệ này được kỳ vọng sẽ lật đổ quy trình sản xuất nội dung truyền thống bằng cách cắt giảm đáng kể chi phí sản xuất, tăng tốc độ tạo nội dung và mở ra nhiều mô hình kiếm tiền mới.
![]() |
Tạo ra video bằng AI đang trở thành xu hướng toàn cầu. Ảnh minh họa |
Một ví dụ điển hình là Kling AI của Kuaishou, hiện đã có hơn 20.000 khách hàng doanh nghiệp, bao gồm các hãng quảng cáo, studio hoạt hình và đơn vị truyền thông toàn cầu. Chỉ trong quý I/2025, Kling mang về doanh thu hơn 150 triệu nhân dân tệ (tương đương 20,8 triệu USD). Trung bình mỗi ngày, doanh nghiệp chi khoảng 30 triệu nhân dân tệ (~4,2 triệu USD) để sử dụng dịch vụ tạo video bằng AI. Đáng chú ý, phần lớn doanh thu này đến từ các thị trường quốc tế như Nhật Bản, Hàn Quốc và châu Âu – cho thấy công nghệ Trung Quốc đang xuất khẩu “đạo diễn ảo” ra thế giới.
Không chịu đứng ngoài cuộc, Alibaba đã tung ra mô hình Wan 2.2, cho phép người dùng tùy chỉnh chi tiết gần như mọi yếu tố của video: ánh sáng, góc máy, khung hình, màu sắc... Điểm đặc biệt: mô hình này được mã nguồn mở, người dùng có thể tải về miễn phí và tùy biến theo nhu cầu riêng.
Tính từ tháng 2 đến nay, chuỗi mô hình “Wan” của Alibaba đã được tải về hơn 5,4 triệu lượt trên các nền tảng AI lớn như Hugging Face và ModelScope. Giáo sư Winston Ma (Đại học Luật NYU) ví von: “Chúng ta không còn ở thời AI hỗ trợ làm phim. AI giờ làm đạo diễn luôn rồi”.
Tham vọng AI của Trung Quốc không dừng lại ở lĩnh vực video. Baidu mới đây ra mắt công nghệ “nhân vật số” AI, bán được 7,65 triệu USD chỉ trong một buổi livestream kéo dài hơn 6 tiếng. Công nghệ này sẽ chính thức ra mắt thị trường vào tháng 10.
Trong khi đó, Tencent giới thiệu mô hình Hunyuan World, cho phép tạo ảnh toàn cảnh 3D từ văn bản – một công cụ hứa hẹn thay đổi cách các nhà phát triển game thiết kế thế giới ảo, đồng thời giảm mạnh thời gian và chi phí sản xuất.
Theo Daniel Ahmad từ Niko Partners, hiện nay hơn 50% studio game tại Trung Quốc đã tích hợp AI vào quy trình phát triển nội dung. Tuy nhiên, ông cũng cảnh báo: nếu lạm dụng AI một cách thiếu kiểm soát, trải nghiệm người chơi sẽ trở nên lạnh lẽo và thiếu “hơi thở con người” – điều mà ngày càng nhiều game thủ đòi hỏi.
Một trong những lý do then chốt giúp Trung Quốc tăng tốc trong lĩnh vực AI video chính là kho dữ liệu khổng lồ từ 1,4 tỷ dân, với hàng tỷ video được tạo ra mỗi ngày trên các nền tảng như TikTok, Kuaishou hay Bilibili. Khối lượng dữ liệu này trở thành "nhiên liệu" để các mô hình AI học nhanh hơn, thông minh hơn, và thích nghi tốt hơn với thị hiếu người dùng toàn cầu.
Từ bài học thành công của TikTok – từng “đánh úp” các thị trường phương Tây bằng thuật toán đề xuất cực mạnh – các hãng công nghệ Trung Quốc giờ đây đang áp dụng chiến lược tương tự cho video tạo bởi AI. Trong một thế giới ngày càng cởi mở với công nghệ, người dùng không còn đặt nặng xuất xứ quốc gia, miễn là sản phẩm đáp ứng được tốc độ, chất lượng và tính sáng tạo.
Từ những mô hình tạo video ngắn cho quảng cáo đến các công cụ mã nguồn mở cho sản xuất điện ảnh, Trung Quốc đang chuyển mình từ “người theo sau” thành “kẻ dẫn đầu” trong cuộc đua AI video toàn cầu. Với tốc độ phát triển công nghệ nhanh, khả năng thương mại hóa cao và nguồn dữ liệu dồi dào, các tập đoàn công nghệ nước này đang đặt cược lớn vào một kỷ nguyên mới – nơi AI không chỉ hỗ trợ sản xuất nội dung, mà có thể tự viết kịch bản, tự chỉ đạo và tự dựng phim.