Video AI "Louvre Cat": Khám phá chuyên sâu quy trình sáng tạo gây sốt

@Khazix0918
TIẾNG TRUNG6 tháng trước · 16 thg 1, 2026
319K
851
209
60
1.4K

TL;DR

Hai nghệ sĩ kỹ thuật số Hai Xin và A Wen tiết lộ toàn bộ quy trình làm việc cho các bộ phim AI "Louvre Cat", chi tiết cách họ sử dụng Suno, Nano Banana và Flow để kết hợp nghệ thuật cổ điển với công nghệ hiện đại.

Tối qua, tôi đã vô cùng, vô cùng hạnh phúc khi mời được hai người bạn tốt và cũng là thần tượng của mình, Hải Tân và A Văn, tham gia một buổi livestream cùng chúng tôi.

Họ đã đến để chia sẻ toàn bộ quy trình sáng tạo tác phẩm video AI của mình, "Chú Mèo Bảo Tàng Louvre."

数字生命卡兹克 - inline image

Sau khi nghe xong, tôi đã choáng váng. Tôi nói, các bạn thực sự nói hết mọi thứ, không giấu giếm chút nào, cứ chia sẻ tất cả như thế này sao...

Thật lòng mà nói, buổi livestream này chứa đầy thông tin thực tế hữu ích. Tôi thậm chí còn không muốn tóm tắt nó vì có quá nhiều thứ. Tôi đã dành cả đêm để biên tập lại bản ghi chép này một cách chi tiết, kết hợp với bài thuyết trình PPT của họ, và bây giờ, với sự cho phép của họ, tôi chia sẻ nó với mọi người.

Tôi hy vọng những kinh nghiệm quý báu này có thể mang lại chút cảm hứng cho việc sử dụng AI và công việc sáng tạo của chúng ta.

Rốt cuộc, không có nhiều người tài năng như họ sẵn lòng xuất hiện và chia sẻ mọi thứ một cách không giữ lại.

Mọi thứ đều bắt đầu từ bộ phim. Đó là điểm khởi đầu.

数字生命卡兹克 - inline image

Ring Hyacinth

@ring_hyacinth

·

15 Thg 11, 2025

Theo lời mời của Bảo tàng Nghệ thuật Phố Đông, chúng tôi đã tạo một video quảng bá chính thức cho triển lãm đầu tiên của Bảo tàng Louvre tại Thượng Hải bằng AI. Hy vọng bạn thích nó!

Triển lãm ra mắt của Bảo tàng Louvre tại Thượng Hải: "Kỳ Quan Hoa Văn: Kiệt Tác Nghệ Thuật Ấn Độ, Iran và Ottoman từ Bảo tàng Louvre"

Từ ngày 13 tháng 12 năm 2025 đến ngày 6 tháng 5 năm 2026, sẽ đổ bộ tại Bảo tàng Nghệ thuật Phố Đông.

数字生命卡兹克 - inline image

Đơn vị tổ chức: Bảo tàng Louvre, Bảo tàng Nghệ thuật Phố Đông

数字生命卡兹克 - inline image

Nhà sản xuất: Tập đoàn Lujiazui

数字生命卡兹克 - inline image

Hiển thị thêm

73 162 992 135K

Hai bộ phim này thực sự đã khiến tôi nghẹt thở vào thời điểm đó.

Nghệ thuật, đây mới thực sự là nghệ thuật.

Buổi livestream này là sự chia sẻ không giữ lại của hai nhà sáng tạo chính của hai bộ phim này, Hải Tân và A Văn, về "Chú Mèo Bảo Tàng Louvre."

Dưới đây là nội dung ghi lại buổi livestream, tất cả đều là lời của Hải Tân & A Văn:

————

Xin chào mọi người, chúng tôi là Hải Tân và A Văn. Chúng tôi là các nghệ sĩ kỹ thuật số và một nhóm sáng tạo làm việc với AI.

Hôm nay, chúng tôi muốn chia sẻ toàn bộ quy trình—từ ý tưởng đến phân cảnh và thực hiện bằng công cụ AI—của các video quảng bá chính thức mà chúng tôi vừa sản xuất cho Bảo tàng Nghệ thuật Phố Đông.

Trước đây, chúng tôi đã làm hai bộ phim ngắn tương đối nổi tiếng. Bộ phim đầu tiên là vào đầu năm ngoái, khi Báo Bắc Kinh mời chúng tôi tạo một video quảng bá văn minh đô thị cho Bắc Kinh mang tên "Chú Mèo Tử Cấm Thành Đi Làm." Sau khi hoàn thành, nó đã lan truyền rất tốt trên internet và mang lại nhiều cơ hội, bao gồm một cuộc triển lãm tại Triển lãm Osaka và là phim mở màn cho Đơn vị 9 tại hội trường chính TED 2025.

Trong sự kiện TED đó, Sam Altman cũng đã thực hiện một cuộc phỏng vấn tại Đơn vị 11, vì vậy chúng tôi rất vinh dự được chia sẻ cùng một sân khấu trong một thời gian ngắn. Chúng tôi chưa bao giờ tưởng tượng rằng những bộ phim của mình sẽ đến được những quốc gia mà chúng tôi thậm chí chưa từng đặt chân tới.

数字生命卡兹克 - inline image

Bộ phim thứ hai là video quảng bá văn minh đô thị năm nay cho Phố Đông, Thượng Hải, tiếp nối chủ đề "mèo con," mang tên "Mèo Con Văn Minh Du Lịch Phố Đông." Nó đã gây xôn xao ngay khi phát hành, với các bài đăng lại từ các tài khoản chính thức như Shanghai Release và Pudong Civilization, và dữ liệu rất xuất sắc.

Ngoại tuyến, nó xuất hiện trên màn hình siêu dài ở lối đi ngầm ga tàu điện ngầm Lujiazui và màn hình siêu lớn tại Super Brand Mall đối diện Tháp Oriental Pearl, luân phiên chiếu ở khu vực trung tâm Lujiazui. Nó cũng được chiếu trên cụm 12 màn hình dưới Tháp Oriental Pearl. Chúng tôi thậm chí còn nhận được "Giải thưởng Tác phẩm Truyền thông Chất lượng Cao Internet" từ Cục Quản lý Không gian mạng Thành phố Thượng Hải. Chúng tôi luôn có một loạt tác phẩm liên quan đến mèo con; bạn có thể nói chúng tôi là chuyên gia làm về mèo.

Vào cuối năm, Bảo tàng Nghệ thuật Phố Đông đã liên hệ với chúng tôi. Họ đang tổ chức một triển lãm lớn chính thức của Louvre tại Thượng Hải—triển lãm quy mô lớn đầu tiên thuộc loại này tại thành phố—và muốn chúng tôi tạo video quảng bá chính thức. Bảo tàng muốn có hai bộ phim ngắn để bao phủ một chu kỳ quảng bá dài khoảng một đến hai tháng.

Cuối cùng, chúng tôi đã bàn giao hai bộ phim. Nửa đầu kể câu chuyện về một "chú mèo trắng từ Pháp đến Thượng Hải," đồng thời cài cắm những quả trứng Phục sinh cho nửa sau.

Nửa sau kể câu chuyện về một "người phát ngôn mèo cam của Phố Đông đến Bảo tàng Nghệ thuật Phố Đông để xem triển lãm."

Cả hai bộ phim đều xoay quanh các hiện vật thực tế để thiết kế câu chuyện. Nửa đầu tập trung vào Đĩa Hoa Văn Công. Nửa sau tập trung vào "Bia Thi Đấu Thơ." Trong nửa sau, chúng tôi cũng xử lý lại âm nhạc, thêm saxophone để tạo biến tấu jazz, mang đến hương vị Thượng Hải hơn.

Sau khi các bộ phim được phát hành, chúng đã lan truyền trên nhiều nền tảng khác nhau, và dữ liệu tài khoản video chính thức của bảo tàng rất tốt. Các tài khoản của chúng tôi đã nhận được nhiều tin nhắn riêng từ người xem nói rằng họ đã quyết định đi xem triển lãm vì hai bộ phim ngắn này.

数字生命卡兹克 - inline image

Cũng có các kịch bản phát lại ngoại tuyến, chẳng hạn như màn hình Bến Thượng Hải, sẽ chiếu luân phiên cho đến tháng Năm năm sau.

Tiếp theo, chúng tôi muốn chia sẻ toàn bộ quy trình sáng tạo và một số hiểu biết sâu sắc, hy vọng chúng sẽ hữu ích cho bạn.

I. Chọn Diễn Viên

Điểm đầu tiên chúng tôi muốn chia sẻ là việc chọn diễn viên, và tại sao cuối cùng chúng tôi chọn một con mèo trắng cộng với một con mèo cam.

Mặc dù chúng tôi quyết định tiếp tục với chủ đề mèo, nhưng có rất nhiều suy nghĩ đằng sau việc chọn mèo. Ban đầu, chúng tôi bắt đầu từ màu sắc chủ đề của Bảo tàng Nghệ thuật Phố Đông. Bảo tàng chủ yếu là màu đen và trắng, vì vậy suy nghĩ đầu tiên của chúng tôi về một nhân vật chính là một con mèo khoang (đen trắng).

Câu chuyện trong phiên bản đầu tiên hoàn toàn khác so với bộ phim cuối cùng. Các hiện vật cốt lõi không phải là Đĩa Công và Bia Thơ; chúng tôi đã chọn một bức tranh sơn dầu. Chúng tôi đặt ra rằng con mèo khoang ban đầu đang ngủ dưới chân nhà vua trong bức tranh, sau đó bị "rơi ra" khi nhân viên bảo tàng di chuyển bức tranh. Con mèo bắt đầu khám phá Louvre và cuối cùng nhìn thấy các hiện vật rời khỏi Louvre trên một chiếc xe tải hướng đến Thượng Hải. Con mèo khoang quyết định nhảy lên một chiếc ván trượt để đuổi theo xe tải, với nhiều sự kiện nhỏ gay cấn xảy ra trên đường đi. Chúng tôi thậm chí đã làm một bản demo.

Chúng tôi sau đó đã từ bỏ kế hoạch này vì một số lý do. Lý do trực tiếp nhất là chu kỳ quảng bá dài; bảo tàng muốn có hai bộ phim. Nếu chúng tôi làm cảnh đuổi xe tải, phần thứ hai sẽ trông giống như một bộ phim hành trình đường dài sau khi được tách ra, điều này sẽ làm lệch tông màu và tiêu tốn quá nhiều năng lượng vào việc đuổi bắt, không phù hợp với không khí của một "video quảng bá bảo tàng chính thức." Vì vậy, chúng tôi đã loại bỏ hoàn toàn kế hoạch mèo khoang.

Sau khi bảo tàng yêu cầu hai bộ phim, giải pháp trực quan đầu tiên của chúng tôi rất đơn giản: tách con mèo khoang thành một con mèo trắng và một con mèo đen. Tiến triển, chúng tôi thấy rằng một con mèo đen sẽ trông quá tối trong bộ phim cuối cùng và sẽ không bắt mắt. Chúng tôi muốn nhân vật chính "sáng hơn" để thu hút sự chú ý của khán giả nhanh hơn, vì vậy chúng tôi đã điều chỉnh từ "một đen, một trắng" thành "một trắng, một cam." Ngoài ra, con mèo cam lặp lại vai trò người phát ngôn Thượng Hải của mèo cam từ bộ phim trước của chúng tôi, làm cho nó phù hợp hơn cho phần Thượng Hải. Phần Pháp phù hợp hơn với con mèo trắng.

数字生命卡兹克 - inline image

II. Thiết Lập Tông Màu

Điểm thứ hai là thiết lập tông màu.

Quyết định hình ảnh và âm nhạc trước, sau đó tiến hành tất cả các bảng phân cảnh.

Khi làm một bộ phim, một bước rất cần thiết là quyết định "tông màu phim." Tông màu bao gồm hai phần. Phần đầu tiên là hình ảnh cốt lõi trông như thế nào và cảm giác của kỹ thuật quay phim. Phần thứ hai là âm nhạc. Đối với một TVC, âm nhạc trực tiếp cho khán giả biết cảm nhận thế nào và ngược lại hướng dẫn nhịp điệu biên tập, quyết định các cảnh quay là cắt nhanh hay chậm.

Dự án này liên quan đến rất nhiều thông tin: Bảo tàng Nghệ thuật Phố Đông, Louvre, nghệ thuật Hồi giáo, Thượng Hải, Paris, v.v.

Đầu tiên, chúng tôi để ý đến "Phòng Gương" của Bảo tàng Nghệ thuật Phố Đông và cảm thấy khái niệm về gương là hoàn hảo cho cấu trúc. Louvre và Bảo tàng Nghệ thuật Phố Đông có thể có mối quan hệ phản chiếu, cũng như Thượng Hải và Paris, và hai chú mèo con. Vì vậy, ban đầu chúng tôi muốn làm một "hoạt ảnh màn hình chia đôi," kể về Paris ở một bên và Thượng Hải ở bên kia, cuối cùng gặp nhau tại Bảo tàng Nghệ thuật Phố Đông.

Chúng tôi đã thực hiện một số hình ảnh khám phá ban đầu, như Bến Thượng Hải nhìn lên Bảo tàng Nghệ thuật Phố Đông ở trên và Louvre ở dưới. Chúng tôi cũng thực hiện một bố cục hai con mèo nhìn vào áp phích trên bàn làm việc tương ứng của chúng.

Sau đó, A Văn đã thực hiện một "cuộc đại tu triệt để" dựa trên những hình ảnh này, đặt "Louvre" ở trên và "Bảo tàng Nghệ thuật Phố Đông" như một sự phản chiếu ở dưới. Hình ảnh rất thoáng đãng, với kết cấu điện ảnh, khí chất thanh lịch và ánh sáng thực tế, tươi sáng. Một bộ hình ảnh khác đã được tối ưu hóa, di chuyển "áp phích" từ bàn làm việc lên chính tòa nhà để làm cho thông tin môi trường tự nhiên hơn.

Dựa trên điều này, chúng tôi đã xác định bầu không khí hình ảnh của toàn bộ bộ phim.

数字生命卡兹克 - inline image

III. Âm Nhạc

Điểm thứ ba là âm nhạc.

Chúng tôi thường làm âm nhạc rất sớm vì nó quyết định nhịp điệu, từ đó quyết định số lượng cảnh quay và chiến lược biên tập. Đối với dự án này, chúng tôi quyết định nhạc cụ chính sẽ là piano. Có hai lý do. Một là chúng tôi thích kết cấu phản chiếu "gợn nước" trong hình ảnh phản chiếu, khiến chúng tôi liên tưởng đến những hợp âm piano trong trẻo. Hai là cấu trúc lưới của Phòng Gương khiến chúng tôi nhớ đến sự ngăn nắp của một bàn phím piano.

Điểm nhạc cho phim ngắn tường thuật cần có một "cung bậc"; chúng không thể có cùng một nhịp điệu từ đầu đến cuối như tiếng ồn trắng. Một câu chuyện phải có mở đầu, phát triển, cao trào và kết thúc, và âm nhạc phải có cấu trúc tương ứng.

Chúng tôi đã sử dụng Suno vì nó tạo ra âm nhạc nghe hay và cho phép kiểm soát tốt các phân đoạn. Bạn có thể chỉ định độ dài của mỗi giai điệu và nói rõ cho nó biết cảm xúc cần gợi lên tại một thời điểm nhất định, chẳng hạn như một bước ngoặt bất ngờ, sự căng thẳng hoặc hồi hộp.

Cấu trúc âm nhạc của chúng tôi lần này đại khái là: phần mở đầu sử dụng các hợp âm piano rất đơn giản để từ từ lôi kéo khán giả vào câu chuyện. Sau đó, một phân đoạn theo sau nhân vật chính và môi trường. Sau đó, có một phân đoạn chuyển tiếp tạo ra một trở ngại nhỏ để giữ khán giả theo dõi. Sau đó, nó đi vào giai điệu thứ hai, mang theo hành động của nhân vật chính và cao trào. Cuối cùng, phần kết thúc—chúng tôi muốn quay trở lại một hợp âm piano đẹp, vì vậy chúng tôi đã thêm một đoạn kết đặc biệt.

Một ưu điểm của Suno là bạn có thể tái tạo vô hạn các phân đoạn mà bạn không hài lòng. Sau khi hoàn thành phần nhạc Pháp, chúng tôi xuất toàn bộ bài hát và tải nó trở lại Suno để tạo một biến thể cho phần Thượng Hải trong khi vẫn giữ giai điệu. Chúng tôi đặt Ảnh hưởng Âm thanh ở mức 50%, đảm bảo giai điệu cơ bản vẫn còn, sau đó yêu cầu nó thêm saxophone và làm cho nó có cảm giác như jazz Thượng Hải xưa. Nó đã tạo ra những biến thể rất phù hợp trên giai điệu gốc.

Nó đã từng đưa ra một kết thúc khá phóng đại, nhưng cuối cùng chúng tôi đã thay đổi nó trở lại kết thúc ban đầu để giữ nó kiềm chế hơn.

Ngoài ra, chúng tôi đăng những bản nhạc này trực tuyến dưới danh tính của con mèo của chúng tôi, Nika. Nika được coi là một "nhạc sĩ huyền thoại trên Hành tinh Mèo," và nó bao gồm một số bản nhạc TVC mà chúng tôi đã làm cho khách hàng.

数字生命卡兹克 - inline image

IV. Phân Cảnh

Tiếp theo là cách tiếp cận phân cảnh.

Thẩm mỹ cá nhân của chúng tôi rất mạnh mẽ, vì vậy điều này thiên về chia sẻ kinh nghiệm hơn.

Yêu cầu cơ bản của chúng tôi đối với bảng phân cảnh mở đầu là "mật độ thông tin cao."

Cố gắng gợi ý câu chuyện nói về điều gì ngay trong cảnh quay đầu tiên. Ví dụ, cảnh quay đầu tiên của "Chú Mèo Tử Cấm Thành Đi Làm" là con mèo mở mắt với hình ảnh phản chiếu của Tử Cấm Thành trong đồng tử, nhanh chóng giải thích "mèo và Tử Cấm Thành." Sự khởi đầu của "Mèo Con Văn Minh Du Lịch Phố Đông" là con mèo đẩy mở bản đồ Thượng Hải, nhanh chóng giải thích "mèo đến Thượng Hải để du lịch."

Đối với phần mèo trắng Louvre, chúng tôi muốn giải thích câu chuyện trong vòng ba cảnh quay. Cảnh quay đầu tiên có con mèo nhìn vào áp phích, gieo vào tâm trí khán giả hình ảnh chính "áp phích triển lãm." Cảnh quay thứ hai sử dụng cận cảnh để giới thiệu nhân vật chính. Cảnh quay thứ ba sử dụng một cảnh rộng để thiết lập môi trường đồng thời thể hiện mối quan hệ phản chiếu của "Louvre phản chiếu Bảo tàng Nghệ thuật Phố Đông."

Phân cảnh cũng cần có cảm giác nhịp điệu. Nhịp điệu phần lớn đến từ sự thay đổi kích thước cảnh quay. Cảnh rộng nối tiếp cảnh rộng cảm thấy rất đơn điệu, vì vậy chúng tôi cắt qua lại giữa cảnh rộng và cận cảnh để tạo ra cảm giác mở rộng và co lại. Nếu cảnh quay mở đầu có quá nhiều thông tin, khán giả sẽ không biết nhìn vào đâu trong giây đầu tiên; chúng tôi sử dụng hoạt ảnh đơn giản để hướng dẫn mắt. Nửa đầu sử dụng phương pháp "kéo rèm," và nửa sau cũng sử dụng một thiết kế mở đầu cổ điển.

Sau đó đến phần đầu tiên của câu chuyện, đây là một phần cốt lõi và là một tập hợp các bảng phân cảnh mà chúng tôi rất hài lòng.

Mục đích của chuỗi cảnh này là cho thấy con mèo trắng bước ra khỏi Louvre, yêu thích Đĩa Hoa Văn Công và có một trí tưởng tượng tuyệt vời.

Chuỗi cảnh này cần truyền tải hai thông tin: nhân vật chính đang ở Louvre, và nhân vật chính thích đĩa công.

Cảnh quay đầu tiên sử dụng một hiện vật Louvre cổ điển để thiết lập địa điểm. Chúng tôi đã chọn tượng Nữ thần Chiến thắng có cánh của Samothrace, một tác phẩm điêu khắc rất cổ điển. Chúng tôi cố tình không chọn Mona Lisa vì nó quá phổ biến và sẽ có vẻ quá sáo rỗng. Về bố cục, chúng tôi không tập trung máy ảnh hoàn toàn vào tác phẩm điêu khắc vì chúng tôi muốn khán giả tập trung vào con mèo. Vì vậy, chúng tôi đặt tác phẩm điêu khắc ở hậu cảnh như một vật trang trí và sử dụng một góc máy cực thấp, làm cho con mèo trắng ở tiền cảnh chiếm nhiều không gian hơn trong khung hình, buộc khán giả tập trung vào con mèo trong khi vẫn nhận ra ngay lập tức "đây là Louvre."

Cảnh quay thứ hai bắt đầu giới thiệu tinh tế nghệ thuật Hồi giáo. Chúng tôi đã tham khảo một nghệ sĩ nổi tiếng trên Instagram, người có cách làm phổ biến là quay các cảnh trong cuộc sống hàng ngày và sau đó làm cho các biểu tượng trong đó chuyển động.

Cảm giác đó thật tuyệt vời vì nó kỳ ảo nhưng lại có cảm giác như một điều gì đó có thể xảy ra trong đời thực. Ban đầu, chúng tôi đã tạo một phiên bản phóng đại hơn, như toàn bộ cảnh biến thành các hoa văn khi con mèo lướt qua, nhưng sau đó cảm thấy nó có quá nhiều chuyển động và không giống đời thực, vì vậy chúng tôi đã thay đổi nó thành một kế hoạch máy ảnh cố định kiềm chế hơn, để các hoa văn nền chuyển động tinh tế khi con mèo đi qua.

Chúng tôi đã thử nhiều phiên bản: các hoa văn giống vòng tròn ma thuật, máy ảnh lia xuống một thế giới nghệ thuật Hồi giáo, các hoa văn nhô ra khỏi màn hình, v.v. Sau đó, chúng tôi nhận ra rằng "thú vị" thôi là chưa đủ; chúng tôi cũng cần sự thăng hoa về cảm xúc. Vì vậy, chúng tôi đã sử dụng một thiết kế tương phản: bắt đầu với một góc máy cực cao áp bức, và khi máy ảnh di chuyển đến khung hình cuối, nó đi vào một không gian mở rộng lớn, mang lại cho khán giả cảm giác giác ngộ đột ngột. Trong cảnh quay cuối cùng, các hoa văn ở hai bên di chuyển như một băng chuyền, đưa con mèo vào một không gian triển lãm mở.

Chúng tôi cũng đã thực hiện một sự đánh đổi: không có chân dung trong khung hình. Một khi chân dung người xuất hiện trong khung hình, khán giả sẽ vô tình tìm kiếm tất cả các chân dung, và sự chú ý của họ sẽ bị đánh cắp khỏi con mèo. Chúng tôi muốn khán giả đi theo con mèo, vì vậy chúng tôi đã loại bỏ các yếu tố dễ dàng ăn cắp sự chú ý càng nhiều càng tốt để giữ cho biểu cảm tinh tế.

数字生命卡兹克 - inline image

Trong thiết kế khung hình cuối của cảnh quay này, A Văn đã thực hiện một thao tác rất thông minh: đặt trực tiếp Đĩa Hoa Văn Công vào không gian triển lãm, để hiện vật cốt lõi xuất hiện sớm trong cao trào. Sau khi xác định khung hình cuối, chúng tôi quay lại và thiết kế lại khung hình đầu tiên và chuyển động máy ảnh, làm cho cảnh quay được kiểm soát hơn.

Sau cao trào cảm xúc, chúng tôi cần thêm một chút kích thích mới. Chúng tôi nghĩ về việc con mèo nhìn thấy không gian sau khi đi lên, hoặc nhìn thấy một hiện vật khác, nhưng không có cái nào đủ cảm động.

Sau đó, chúng tôi nghĩ đến việc con mèo nhìn thấy một con công, và con công còn sống. Điểm này ngay lập tức khiến chúng tôi cảm thấy như tác phẩm nghệ thuật đã trở nên sống động. Về nhịp điệu, chúng tôi cũng thực hiện một sự tiến triển từng bước: con công đầu tiên quay đầu, sau đó quay thân, và cuối cùng xòe cánh, dành sự bất ngờ cho giây cuối cùng.

Sau cao trào, nó cần trở về thực tế. Chúng tôi đã sử dụng một cách rất đơn giản: cắt trở lại cận cảnh con mèo, như thể nó đang tưởng tượng, sau đó cắt đến một cảnh quay khách quan thiết lập thực tế—con mèo thực sự đang đứng trước đĩa công nhìn vào hiện vật. Khán giả sau đó hiểu rằng phân đoạn tưởng tượng đến từ trí tưởng tượng của con mèo.

Sau đó đến phân đoạn chuyển tiếp, nhằm giải thích rằng "hiện vật sẽ đến Thượng Hải" và "con mèo quyết định chui vào hộp và đi cùng."

Chúng tôi đã sử dụng kỹ thuật dựng phim và xử lý màn hình chia đôi vì nó có thể truyền tải nhiều thông tin trong một thời gian ngắn. Khi thực hiện các cảnh quay như vậy, chúng tôi cắt bỏ người càng nhiều càng tốt. Trong các bộ phim về động vật, khuôn mặt người dễ dàng ăn cắp sự chú ý; khán giả có nhiều khả năng đồng cảm với con người hơn, và sự chú ý của họ sẽ bị lấy đi, vì vậy chúng tôi chỉ giữ lại cận cảnh và hành động mà không để lộ khuôn mặt.

数字生命卡兹克 - inline image

Phân đoạn thứ hai ban đầu sẽ nói về những gì xảy ra với con mèo trong thùng hàng trên máy bay.

Trước khi hoàn toàn xác định cốt truyện, chúng tôi sử dụng Sora để chạy một số mẫu nhằm kiểm tra nhanh nhịp điệu và bố cục, tìm kiếm sự bất ngờ và tài liệu tham khảo. Sau khi chạy chúng, chúng tôi không thích vì hình ảnh không thoáng đãng, màu sắc hơi vàng, cũ kỹ và tối, không phù hợp với tông màu chúng tôi đã đặt trước đó. Logic cốt truyện cũng không hoạt động vì con mèo trong hộp không thể nhìn thấy các hiện vật bên ngoài, và các hiện vật cũng nên ở trong hộp.

Vì vậy, chúng tôi đã loại bỏ toàn bộ phân đoạn "nhìn trộm vào trong hộp" và kéo sự tập trung trở lại câu chuyện cốt lõi: con mèo trắng đồng hành cùng đĩa công đến Thượng Hải.

Đối với việc đến Thượng Hải, ban đầu chúng tôi muốn thực hiện một sự chuyển tiếp thực tế của một chiếc máy bay bay từ Louvre đến Thượng Hải, và chúng tôi đã chạy nó với VEO 3. Chúng tôi cũng đã thử một hoạt ảnh vi mô bản đồ cổ điển. Nhưng tất cả các kế hoạch này đều bị chúng tôi từ chối.

Bởi vì một bản đồ làm cho khán giả đặc biệt quan tâm đến tính hợp lý, chẳng hạn như liệu vị trí của Paris và Thượng Hải và khoảng cách bay có chính xác hay không, điều này làm phân tán sự chú ý. Chúng tôi cũng đã thử một kế hoạch "bản đồ điểm lửa với dấu chân" trừu tượng hơn, nhưng chúng tôi không thích cảnh quay quá rộng; chúng tôi muốn khán giả nhìn thấy chủ thể chính chiếm một phần lớn hơn của khung hình.

Cuối cùng, chúng tôi quyết định thay đổi trực tiếp giữa "khung hình đầu tiên của Louvre" và "khung hình đầu tiên của Bảo tàng Nghệ thuật Phố Đông," làm cho sự chuyển tiếp gần hơn và tập trung hơn.

Chúng tôi đã thử nghiệm nhiều loại hoạt ảnh chuyển tiếp: như một tấm thảm mở ra, gạch lật, hình ảnh máy bay, v.v. Cuối cùng, chúng tôi chọn máy bay vì hình ảnh máy bay xuất hiện trong các cảnh quay trước và sau khi chuyển tiếp. Hình ảnh liên tục làm cho khán giả cảm thấy thoải mái hơn, ngay cả khi nó nhảy từ phong cách thực tế sang phong cách nghệ thuật khảm ở giữa, nó sẽ không bị đột ngột.

数字生命卡兹克 - inline image

Sau khi đến Thượng Hải, việc phân cảnh trực tiếp hơn: đầu tiên nhìn thấy Bảo tàng Nghệ thuật Phố Đông từ xa đến gần, sau đó nhìn thấy con mèo chạy về phía bảo tàng. Chúng tôi thực sự thích một trong những cảnh quay: con mèo chạy dọc theo mặt nước, với hình ảnh phản chiếu trong nước là một con công.

Ý tưởng này ban đầu "hoang dã hơn." Chúng tôi hy vọng rằng khi con mèo chạy, nó có thể nhìn thấy bóng của nhiều loài động vật, như công, ngựa, lạc đà, v.v., mang lại cảm giác rằng "tất cả nghệ thuật Hồi giáo đã đến Thượng Hải cùng nhau." Chúng tôi đã thử chuyển văn bản thành hình ảnh và chuyển văn bản thành video, nhưng không cái nào hoạt động. Chúng tôi cũng nghĩ về việc con mèo nhìn thấy chính mình như một con hổ trong tim, với cái bóng là một con hổ, nhưng điều này quá yếu liên quan đến bộ phim và nhanh chóng bị loại bỏ.

Sau đó, chúng tôi nhận thấy rằng việc giao phó sự sáng tạo cốt lõi như vậy trực tiếp cho AI trong một lần là không đáng tin cậy và cần được chia nhỏ để thực hiện. Đầu tiên, chúng tôi vẽ tay bảng phân cảnh, quyết định một góc máy hơi cao để sự chú ý của khán giả tự nhiên rơi vào phản chiếu của hồ.

Bố cục được đơn giản hóa thành "cái bóng của con mèo là một con công," điều này liên quan trực tiếp nhất đến mạch chính. Chúng tôi sẽ sử dụng Photoshop để ghép mối quan hệ mong muốn, sau đó giao nó cho mô hình để hoàn thành phong cách và động lực thống nhất. Trong suốt quá trình, chúng tôi cảm thấy mạnh mẽ rằng ngay cả một bản vẽ tay thô sơ cũng trực quan hơn để AI hiểu và để mọi người giao tiếp.

Đối với phần kết thúc, chúng tôi lặp lại khái niệm về "gương," kết thúc với một hình ảnh kiềm chế và đẹp hơn.

数字生命卡兹克 - inline image

Đó là tất cả cho phần phân cảnh.

Tiếp theo, phần nghệ thuật được giao cho A Văn.

V. Nghệ Thuật

Tôi (A Văn) chủ yếu làm hai việc.

Đầu tiên, chuyển đổi các bảng phân cảnh bản thảo của Hải Tân thành hình ảnh cuối cùng. Thứ hai, kiểm soát phong cách nghệ thuật tổng thể.

Sau khi nhận dự án, chúng tôi ngay lập tức đi tìm hiểu về nghệ thuật Hồi giáo. Đó là một phong cách nghệ thuật mà chúng tôi thường ít tiếp xúc, nhưng nó rất đặc biệt. Sau khi nắm vững một số từ khóa cốt lõi, thật dễ dàng để tạo ra nghệ thuật phong cách khảm với các đặc điểm kỳ lạ. Chúng tôi đã tóm tắt 4 từ khóa rất hữu ích trong buổi livestream; hai từ được sử dụng phổ biến nhất là "phong cách Iznik" và "nghệ thuật khảm." Ở đây, khảm đề cập đến nghệ thuật khảm, khác với nghệ thuật Pixel.

Chúng tôi có hai nguyên tắc để làm phim. Nó phải đẹp ngay từ cái nhìn đầu tiên và bền lâu khi nhìn lại. Trong kỷ nguyên AI, thật quý giá khi một khán giả sẵn sàng xem hết bộ phim ngắn của bạn. Đẹp đối với chúng tôi tương đương với cảm giác điện ảnh. Bền lâu tương đương với càng nhiều chi tiết và chi tiết sáng tạo càng tốt, bao gồm cả chi tiết nghệ thuật.

Mọi người thực sự rất nhạy cảm với cảm giác điện ảnh. Đối với cùng một hình ảnh và cùng một prompt, với kết quả từ các mô hình khác nhau, bạn có thể dễ dàng đánh giá cái nào có cảm giác điện ảnh hơn. Vì vậy, bước đầu tiên trong nghệ thuật là chọn đúng mô hình. Mô hình tạo hình ảnh chính hiện tại của chúng tôi về cơ bản là Nano Banana Pro. Đối với việc sửa đổi hình ảnh, chúng tôi chủ yếu sử dụng nó trực tiếp với sửa đổi văn bản, đôi khi kết hợp với Photoshop. Tôi cũng tinh chỉnh thủ công một số phần.

Chọn đúng mô hình cũng có giá trị như chọn đúng nhà cung cấp. Nó có thể thực hiện công việc tốt và xử lý nhiều sửa đổi khó khăn. Ví dụ, có một cảnh quay chúng tôi rất hài lòng, nhưng sau khi gửi bản thảo đầu tiên, bảo tàng nói rằng cảnh quay này phải được loại bỏ vì nó sẽ làm cho việc di chuyển các hiện vật trông thiếu chuyên nghiệp, và họ không muốn truyền tải cảm giác đó đến khán giả. Về mặt tường thuật, chúng tôi cần cảnh quay này để giải thích con mèo trốn trong hộp để đi theo các hiện vật đến Thượng Hải. Cuối cùng, chúng tôi đã sử dụng Nano Banana để "bọc" các hiện vật, làm cho việc xử lý trông chuyên nghiệp hơn, và nó đã được chấp nhận.

Một ví dụ khác: khung hình cuối cùng của hình ảnh rất đẹp, nhưng bạn sẽ thấy rằng sự chú ý ở lại mông con mèo trắng trong một thời gian dài; đây là một vấn đề chỉ lộ ra sau khi chuyển sang con mèo trắng. Giải pháp rất đơn giản: để đuôi cụp xuống trong khung hình đầu tiên, và nó sẽ không thành vấn đề khi đi lên sau đó.

Thậm chí còn phóng đại hơn là cứu vãn tình thế bằng cách thay đổi con mèo. Khi chúng tôi chuyển nhân vật chính từ một con mèo đen sang một con mèo trắng giữa chừng, nhiều khung hình tĩnh và hoạt ảnh đã được hoàn thành.

Nghe có vẻ phi lý, nhưng AI thực sự có thể thay đổi nó.

Vào thời điểm đó, các công cụ chúng tôi có thể sử dụng còn hạn chế, chỉ có thế hệ đầu tiên của Nano Banana, mà chúng tôi thường sử dụng trong Google Whisk. Thói quen của chúng tôi là một thư mục cho mỗi cảnh quay, vì vậy chúng tôi đã đi vào từng thư mục một để thay đổi màu sắc của con mèo, và hoàn thành tất cả trong một ngày rưỡi.

Sau đó, khi xem xét lại, Banana Pro ra mắt, và chúng tôi thấy rằng hiệu quả thậm chí còn phi lý hơn sắp tới. AI không chỉ có thể thay đổi nó mà còn có thể thay đổi nó ngày càng nhanh hơn. Trên các nền tảng của bên thứ ba, bạn có thể tải lên tất cả các khung hình tĩnh cùng một lúc và thay đổi nhân vật chính mèo đen thành mèo trắng chỉ bằng một câu, hiệu quả hơn.

数字生命卡兹克 - inline image

Nhiều người hỏi Nano Banana Pro nên dùng ở đâu là tốt nhất.

Theo trải nghiệm của chúng tôi, hệ thống thành viên của chính Google có khá nhiều cạm bẫy. Chúng tôi đã mua gói thành viên Google Ultra cao cấp nhất từ khi nó ra mắt và sử dụng cho đến nay. Bạn thường thấy người khác nói Google có giảm giá, như 79 đô la mỗi tháng trong ba tháng, hoặc giá nửa năm, nhưng nhìn lại giá đăng ký của chính bạn, nó có thể không thay đổi chút nào và vẫn rất đắt, thậm chí còn cao hơn khi tính thuế.

Một điểm khác khiến chúng tôi rất không hài lòng là điểm vào 4K không rõ ràng. Một số người nói nó nằm trong Flow, nhưng chế độ tạo mặc định của Flow là 1K và chỉ nâng cấp lên 4K khi tải xuống. Chúng tôi không chắc đó là siêu phân giải hay 4K gốc. Google AI Studio có thể xuất 4K gốc hơn, nhưng nó bị tính phí riêng.

Nếu bạn là thành viên Ultra như chúng tôi, đây là cách sử dụng thực tế hơn của chúng tôi: dùng Flow để tạo nhanh kiểu gacha vì nó nhanh với nền 1K. Dùng Gemini để lặp lại nhiều vòng; các vòng đối thoại rất tiện lợi. Khi bạn đã nắm rõ kết quả, bạn có thể đến AI Studio để có 4K gốc.

Ngoài ra, các prompt của chúng tôi ngày càng đơn giản hơn. Khả năng hiểu đa phương thức của mô hình rất mạnh và thường không cần những bài văn dài. Ví dụ, tôi sẽ ném một bức ảnh vào, để nó trích xuất con mèo và con bướm, đặt chúng lên nền màu trơn, sau đó biến nó thành pixel art. Sau khi ổn định phong cách, việc mở rộng chất liệu rất hiệu quả.

Và những prompt ngày nay có thực sự cần phải là những bài văn dài không?

Chúng tôi có một cảnh quay cần góc nhìn chính diện của một hiện vật trưng bày, nhưng không ai có thể vào trong suốt thời gian dựng; nhân viên chỉ có thể gửi cho chúng tôi hai bức ảnh chụp nhanh từ xa.

Hai bức ảnh này đã rất quý giá đối với chúng tôi, vì vậy chúng tôi đã dùng chúng như thông tin tình báo và trực tiếp để Gemini tạo ra góc nhìn chính diện của hiện vật dựa trên hai bức ảnh, theo tỷ lệ 16:9.

Kết quả rất tốt, và chúng tôi đã dùng nó để hoàn thành cảnh quay cuối cùng.

Điều đáng ngạc nhiên hơn là khi chúng tôi đến địa điểm vào ngày khai mạc và thấy nó gần như giống hệt với vị trí thực tế. Mọi người không thể chen vào, nhưng AI thì có thể.

数字生命卡兹克 - inline image

Khi một mô hình đủ mạnh, nó không quan tâm đến nguồn gốc của bảng phân cảnh. Điều đó có nghĩa là, đôi khi bạn đưa cho nó những bảng phân cảnh khá kỳ quặc, và nó có thể ngay lập tức hiểu bạn muốn gì và trực tiếp tạo ra những hình ảnh rất đẹp. Đây đều là những hình ảnh được mô hình trực tiếp xuất ra bằng cách sử dụng bảng phân cảnh của Hải Tâm, và chúng đều rất tốt.

数字生命卡兹克 - inline image

Nhưng đối với sự sáng tạo phức tạp, bạn phải lặp lại theo từng giai đoạn.

Lấy cảnh quay "con mèo đi trên bờ, với hình phản chiếu trong nước là một con công" làm ví dụ.

Đầu tiên, tôi sẽ hiểu góc nhìn của bản phác thảo phân cảnh.

Tôi có thói quen xây dựng một bản phác thảo rất thô trong PPT. Tôi tình cờ có sẵn một ảnh PNG trong suốt của một "diễn viên kỳ cựu" mèo trắng; đặt nó vào khung hình sẽ xây dựng được góc nhìn. Sau đó, tôi ném bản phác thảo thô này vào mô hình để biến nó thành phong cách chân thực, trước tiên có được một cảnh cơ bản "một con mèo đi trên bờ với một cái hồ gần đó."

Bước thứ hai là lát gạch nền. Tôi thực sự đã dùng prompt để lát gạch nền trên mặt đất bê tông, thử nhiều từ khóa cho đến khi tìm được phiên bản có "mật độ vừa phải." Sau khi lát xong, hình ảnh đã thành hình, nhưng nhiều lần lặp lại sẽ làm biến dạng tư thế của con mèo, vì vậy tôi để AI điều chỉnh lại.

Bước thứ ba là thêm thông tin hiện vật. Cách đơn giản nhất là chồng nó lên trong PS và điều chỉnh kiểu lớp. Nhưng chúng tôi thấy rằng hình phản chiếu con công trong hồ rất khó để chuyển động vì những con công cách điệu không dễ dàng chuyển đổi thành động lực học chân thực. Vì vậy, tôi quay lại PS, xóa con công, thay thế bằng một bóng con công chân thực, và ném lại vào mô hình để tiếp tục chạy.

Sau đó, màu sắc của con mèo phải được thay đổi. Sau khi thay đổi, tôi thấy những viên gạch nền đã "ăn" con mèo trắng, vì vậy tôi đã lát lại gạch nền một lần nữa để có được khung hình tĩnh cuối cùng.

数字生命卡兹克 - inline image

Cuối cùng, làm hoạt ảnh thực ra là phần đơn giản nhất. Thông thường, nó là đầu ra trực tiếp; hai hoặc ba lần thử có thể có được động tác tốt, như con mèo đi dọc bờ và hình phản chiếu con công trong nước đi theo.

Sau đó là một số kinh nghiệm về nghệ thuật trong việc ghép cảnh thực.

Có rất nhiều địa danh và hiện vật trong phim ngắn không thể sai, vì vậy chúng tôi cần sự chắc chắn. Nhiều khi chúng tôi ghép con mèo lên các địa danh có thật.

Bây giờ việc ghép này rất đơn giản; bạn chỉ cần nói với Nano Banana Pro rằng có một con mèo cam quay lưng về phía máy ảnh đang đuổi theo một con bướm có màu sắc xác định trong cảnh, và nó có thể tạo ra.

Hai mẹo nhỏ để cải thiện tỷ lệ thành công. Đầu tiên, cắt xén trước khi tạo. Ví dụ, chúng tôi không cần phần trang trí ở dưới cùng của chất liệu Khách sạn Hòa Bình, vì vậy tôi sẽ cắt chúng ra trước khi đưa cho mô hình. Nhiều cảnh quay trong nhà cũng vậy; cắt bỏ những khu vực không cần thiết trước, và mô hình sẽ tập trung hơn.

Thứ hai, nếu bạn cần thực hiện một match cut hoặc sử dụng lại một chủ thể nhiều lần, bạn nên trích xuất con mèo và con bướm lên nền màu trơn trước, sau đó thay đổi các nền khác nhau. Để mô hình liên tục thay đổi cảnh trực tiếp trong cùng một hình ảnh dễ dẫn đến việc ăn mất con bướm, ăn mất con mèo hoặc thay đổi màu sắc của con mèo. Việc trích xuất chủ thể trước rồi thay đổi nền có tỷ lệ thành công cao hơn nhiều.

数字生命卡兹克 - inline image

Nhiều người hỏi tại sao chúng tôi không sử dụng tham chiếu nhiều hình ảnh để tạo video.

Về các sản phẩm video đa tham chiếu, chúng tôi đã thử hầu hết mọi thứ trên thị trường khi thực hiện hai bộ phim ngắn này, và vấn đề độ rõ nét rất khó chữa; các yếu tố trở nên mờ ngay cả khi có một chuyển động nhỏ.

Ngay cả với chức năng đa tham chiếu mới được ra mắt gần đây trên Flow, chúng tôi đã thử, và rất khó để đảm bảo các hiện vật chúng tôi muốn không thay đổi. Chúng tôi có quá nhiều chủ thể ổn định cần duy trì, bao gồm nhiều hiện vật, con mèo và con bướm, vì vậy cuối cùng, quy trình khung hình đầu và cuối là ổn định hơn.

Nhiều bạn bè cũng hỏi, liệu có còn cần PS không?

Tôi nghĩ PS vẫn hữu ích, nhưng chúng tôi mở nó ngày càng ít. Tôi rất khuyên dùng một chức năng mà không nhiều người sử dụng, gọi là "Harmonize."

Bạn dán một ảnh PNG hoặc hình ảnh lên một khung hình tĩnh, nhấp vào harmonize, và nó tự động khớp với ánh sáng môi trường, làm cho sự kết hợp trở nên hài hòa hơn. Ví dụ, trong cảnh quay với cái đĩa nổi, tôi nhấp vào harmonize, và sự khác biệt về ánh sáng trước và sau là rất rõ ràng; hiệu quả cao.

Đồng thời, Banana Pro đủ mạnh để nhiều thứ có thể được thực hiện trực tiếp với nó. Ví dụ, trong phim mèo cam, có một cảnh mà tôi đã dùng Vidu để tạo bản xem trước; độ rõ nét không đủ, và các hiện vật không ổn định, nhưng mối quan hệ giữa chuyển động của con mèo và các hiện vật thì đúng.

Vì vậy, tôi đã ném cả bản xem trước và chất liệu hiện vật vào Banana Pro, để nó giữ nguyên bố cục và thay thế các hiện vật nổi bằng những cái tôi đã cung cấp, cho phép chúng xuất hiện nhiều lần và một cách rải rác. Kết quả là một hình ảnh rất tốt trong phiên bản đầu tiên, và nó thậm chí còn tự động thêm độ sâu trường ảnh tiền cảnh/hậu cảnh và chuyển động mờ, về cơ bản đáp ứng nhu cầu sản xuất.

数字生命卡兹克 - inline image

VI. Hoạt ảnh

Công cụ video chính của chúng tôi là Flow. Mô hình video thường dùng của chúng tôi là VEO 3.1.

Flow gần đây cũng đã ra mắt chức năng 4K, giúp ích cho chất lượng hình ảnh. Đối với các mô hình video phụ trợ, chúng tôi cũng sử dụng Kling, Hailuo, Jimeng, Wanxiang, Luma, v.v., nhưng Flow tiện lợi hơn khi sử dụng và hình ảnh có cảm giác điện ảnh hơn.

Chúng tôi cảm thấy rằng chúng ta đã bước vào một kỷ nguyên mà chúng ta có thể "chỉnh sửa video." Nhiều công cụ video có thể trực tiếp chỉnh sửa video. Có một chức năng ẩn trong Flow, với một điểm vào sâu; có một nút "chỉnh sửa" ở góc trên bên trái của video đã tạo. Khi vào bên trong, bạn có thể thêm thứ vào video, cắt bỏ thứ, và thậm chí thay đổi vị trí và chuyển động của máy ảnh; nó hơi thử nghiệm nhưng đôi khi hữu ích.

Những hạn chế của nó cũng rõ ràng; ví dụ, nó có thể thêm và cắt, nhưng rất khó để "chỉnh sửa và thay thế," như thay đổi một con mèo đen thành một con mèo trắng. Để đạt được điều này, bạn phải loại bỏ trước và sau đó chèn vào, cảm giác rất vụng về.

Trong Flow, chúng tôi cũng sử dụng nhiều tính năng vẽ nguệch ngoạc. Văn bản thuần túy rất khó để bắt con mèo thực hiện một số hành động nhất định, như bắt con mèo nhảy trực tiếp qua; chúng tôi không thể có được nó ngay cả sau nhiều lần thử.

数字生命卡兹克 - inline image

Nhưng bằng cách vẽ một hình nguệch ngoạc trên khung hình đầu tiên để đưa ra hướng dẫn chuyển động, như con bướm nên bay đi đâu và con mèo đi theo nó, và sau đó thêm một prompt "làm theo hướng dẫn trong chú thích và sau đó xóa chú thích của tôi," mô hình sẽ tạo ra theo các quy tắc chuyển động bạn đã chú thích, và con mèo có thể bước ra khỏi khung hình một cách trơn tru.

Và Ray3 của Luma hữu ích một cách bất ngờ. Chúng tôi đã thử nghiệm vào dịp Giáng sinh, tải lên một bản xem trước rất thô và thêm một prompt; nó tạo ra rất đẹp với độ rõ nét cao, thậm chí còn tạo ra thứ từ hư vô trong video gốc.

Nhược điểm là tạo chậm, nhưng ưu điểm là chất lượng ghép cao, phù hợp cho sản xuất.

Tính năng tạo nhân vật mới của Wan 2.6 cũng đáng chú ý. Các nhân vật người của nó vẫn dễ bị lệch lạc, nhưng các nhân vật động vật thì thú vị hơn nhiều so với con người. Tôi tình cờ tải lên một video rất mờ và tối về con mèo Nika của tôi, và sau khi xây dựng nhân vật, tôi có thể sử dụng @ để triệu hồi nó trong Wan 2.6; chất lượng tạo ra ở mức "được chủ chấp thuận" và rất nét. Chúng tôi đã bắt nó làm nhiều thứ, như một con khủng long đến cứu nó. Tính năng này ra mắt sau khi hai bộ phim ngắn của chúng tôi đã được đăng tải, đó là một chút không đúng lúc.

Một mẹo nhỏ khác: khi tạo hoạt ảnh vi mô cho màn hình kết thúc, bạn có thể chọn một "mô hình hơi tệ hơn," tức là mô hình thế hệ trước. Biên độ chuyển động của thế hệ trước thường nhỏ hơn, đôi khi rất phù hợp cho màn hình kết thúc. Ví dụ, đối với màn hình kết thúc, chúng tôi muốn môi trường di chuyển nhẹ, nhưng Flow có thể thêm nhiều mẫu tưởng tượng và di chuyển quá nhiều.

Sử dụng một mô hình thế hệ trước thực sự di chuyển vừa phải. Lần này tôi đã sử dụng Jimeng 3.0, và biên độ chuyển động vi mô đó rất phù hợp.

VII. Các bản nháp bị loại bỏ

Lần này có rất nhiều bản nháp bị loại bỏ, đặc biệt là cho bộ phim mèo cam, bởi vì sau khi Pro ra mắt, việc thực hiện một số ý tưởng rất nhanh và số lượng khám phá lớn hơn. Dưới đây là một vài bản chúng tôi đặc biệt thích nhưng đau lòng xóa bỏ.

Một là "Bánh ngọt hình bướm" mà khán giả Thượng Hải thích hỏi. Bánh ngọt hình bướm của Thượng Hải rất nổi tiếng, và chúng tôi đã thực sự làm một chiếc bánh ngọt hình bướm khổng lồ, và chúng tôi rất thích hình ảnh đó. Nhưng trong AI, một khi bánh ngọt hình bướm di chuyển, nó biến trở lại thành một con bướm thật và không bao giờ bay, vì vậy chúng tôi đã phải từ bỏ nó.

Một điểm check-in rất nổi tiếng khác tại Bảo tàng Nghệ thuật Phố Đông, nơi bạn có thể chụp ảnh Tháp Phương Đông. Chúng tôi đã thực hiện một cảnh quay nơi một con bướm thò một nửa cánh vào từ bên ngoài cửa sổ, và nửa còn lại của cánh được hoàn thành qua bóng của ánh sáng mặt trời, tạo thành một con bướm hoàn chỉnh. Hình ảnh rất đẹp, nhưng khi nó di chuyển, con bướm vẫn không bay, vì vậy nó đã bị xóa.

Một cảnh quay khác là phòng trưng bày nghệ thuật Hồi giáo của bảo tàng Louvre; ban đầu chúng tôi muốn làm nó phóng đại hơn, thậm chí với động lực học cấp độ sóng thần, nhưng sau đó cảm thấy nó quá viển vông và không phù hợp với cảm giác "kín đáo nhưng kỳ ảo" mà chúng tôi muốn, vì vậy nó cũng đã bị xóa.

数字生命卡兹克 - inline image

Cuối cùng

Cuối cùng, điểm cốt lõi chúng tôi muốn truyền tải là:

Mô hình càng tiện lợi, bạn càng nên thúc đẩy bản thân làm tốt hơn.

Bây giờ các mô hình ngày càng tiện lợi, nhiều nhà sáng tạo có xu hướng sử dụng các tác nhân để trực tiếp xuất ra toàn bộ các giải pháp bảng phân cảnh hoặc để chúng hoàn thành nhiều phần sáng tạo hơn. Nhưng điều chúng tôi muốn nói là sự tiện lợi của mô hình không nên là cái cớ cho sự lười biếng.

Nó giống như một lời nhắc nhở hơn: bạn có nhiều khả năng hơn để làm cho tác phẩm của mình tốt hơn.

Kết thúc bằng một câu nói chúng tôi thường nói:

Chỉ cần bạn đang hành động, bạn đang tiến về phía trước.

Cảm ơn mọi người, phần chia sẻ hôm nay của chúng tôi kết thúc tại đây.

Nếu bạn thấy nó hữu ích, hãy thoải mái chia sẻ nó với bạn bè của bạn để xem; đó là một sự giúp đỡ rất lớn cho chúng tôi!

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind
Dành cho nhà sáng tạo

Biến Markdown của bạn thành bài viết 𝕏 gọn gàng

Khi bạn đăng bài viết dài của riêng mình, việc định dạng hình ảnh, bảng và khối mã cho 𝕏 rất mệt mỏi. YouMind biến cả bản nháp Markdown thành một bài viết 𝕏 gọn gàng, sẵn sàng để đăng.

Thử Markdown sang 𝕏

Thêm pattern để giải mã

Bài viết viral gần đây

Khám phá thêm bài viết viral