เจาะลึกเบื้องหลังไวรัลวิดีโอ AI "Louvre Cat" กับกระบวนการสร้างสรรค์สุดล้ำ

@Khazix0918
จีน6 เดือนที่ผ่านมา · 16 ม.ค. 2569
319K
851
209
60
1.4K

TL;DR

ศิลปินดิจิทัล Hai Xin และ A Wen เผยขั้นตอนการทำงานทั้งหมดสำหรับภาพยนตร์ AI ชุด "Louvre Cat" พร้อมรายละเอียดการใช้ Suno, Nano Banana และ Flow เพื่อผสมผสานศิลปะคลาสสิกเข้ากับเทคโนโลยีสมัยใหม่

เมื่อคืนนี้ผมดีใจมากๆ ที่ได้เชิญเพื่อนรักและไอดอลของผมสองคน ไห่ซิน และ อาเหวิน มาร่วมไลฟ์สดกับเรา

พวกเขามาแชร์กระบวนการสร้างสรรค์ผลงานวิดีโอ AI เรื่อง "แมวพิพิธภัณฑ์ลูฟวร์" อย่างละเอียด

数字生命卡兹克 - inline image

ผมตะลึงมากหลังจากฟังจบ ผมบอกว่า พวกคุณบอกหมดเลยนะ ไม่มีการปิดบังอะไรเลย แชร์กันแบบนี้เลยเหรอ...

เอาจริงๆ ไลฟ์สดครั้งนี้มีข้อมูลที่เป็นประโยชน์มากมาย ผมแทบไม่อยากสรุปด้วยซ้ำเพราะมันเยอะเกินไป ผมใช้เวลาทั้งคืนจัดทำบทถอดเทปนี้อย่างละเอียด จับคู่กับสไลด์พรีเซนเทชั่นของพวกเขา และตอนนี้ก็ได้รับอนุญาตจากพวกเขาแล้ว ผมเลยนำมาแบ่งปันให้ทุกคน

หวังว่าประสบการณ์อันมีค่าเหล่านี้จะเป็นแรงบันดาลใจให้กับการใช้ AI และงานสร้างสรรค์ของพวกเราทุกคน

ท้ายที่สุดแล้ว คนที่มีความสามารถและเต็มใจออกมาแชร์ทุกอย่างโดยไม่สงวนไว้แบบนี้มีไม่มากนัก

ทุกอย่างเริ่มต้นจากภาพยนตร์ นี่คือจุดเริ่มต้น

数字生命卡兹克 - inline image

Ring Hyacinth

@ring_hyacinth

·

15 พ.ย. 2025

ตามคำเชิญของพิพิธภัณฑ์ศิลปะผู่ตง เราได้สร้างวิดีโอโปรโมทอย่างเป็นทางการสำหรับนิทรรศการครั้งแรกของพิพิธภัณฑ์ลูฟวร์ในเซี่ยงไฮ้โดยใช้ AI หวังว่าคุณจะชอบนะ!

การเปิดตัวพิพิธภัณฑ์ลูฟวร์ในเซี่ยงไฮ้: "ปาฏิหาริย์แห่งลวดลาย: ผลงานชิ้นเอกของศิลปะอินเดีย อิหร่าน และออตโตมันจากพิพิธภัณฑ์ลูฟวร์"

13 ธันวาคม 2025 ถึง 6 พฤษภาคม 2026 จัดแสดงครั้งใหญ่ที่พิพิธภัณฑ์ศิลปะผู่ตง

数字生命卡兹克 - inline image

เจ้าภาพ: พิพิธภัณฑ์ลูฟวร์, พิพิธภัณฑ์ศิลปะผู่ตง

数字生命卡兹克 - inline image

โปรดิวเซอร์: กลุ่ม Lujiazui

数字生命卡兹克 - inline image

แสดงเพิ่มเติม

73 162 992 135K

ภาพยนตร์สองเรื่องนี้ทำให้ผมแทบหยุดหายใจในตอนนั้น

ศิลปะ นี่คือศิลปะที่แท้จริง

ไลฟ์สดครั้งนี้เป็นการแชร์แบบไม่มีกั๊กโดยผู้สร้างหลักสองคนของภาพยนตร์ทั้งสองเรื่องนี้ ไห่ซิน และ อาเหวิน เกี่ยวกับ "แมวพิพิธภัณฑ์ลูฟวร์"

ต่อไปนี้คือบทถอดเทปไลฟ์สด ทั้งหมดเป็นเสียงของไห่ซินและอาเหวิน:

————

สวัสดีทุกคน เราคือไห่ซินและอาเหวิน เราเป็นศิลปินดิจิทัลและคู่หูสร้างสรรค์ที่ทำงานร่วมกับ AI

วันนี้เราอยากจะแชร์กระบวนการทั้งหมด ตั้งแต่แนวคิด การทำสตอรีบอร์ด ไปจนถึงการดำเนินการด้วยเครื่องมือ AI ของวิดีโอโปรโมทอย่างเป็นทางการที่เราเพิ่งผลิตให้กับพิพิธภัณฑ์ศิลปะผู่ตง

ก่อนหน้านี้เราทำภาพยนตร์สั้นที่ค่อนข้างมีชื่อเสียงสองเรื่อง เรื่องแรกคือช่วงต้นปีที่แล้ว เมื่อปักกิ่งเดลี่เชิญเราทำโปรโมทอารยธรรมเมืองให้กับปักกิ่งชื่อ "แมวต้องห้ามไปทำงาน" หลังจากเสร็จ มันแพร่กระจายได้ดีมากบนอินเทอร์เน็ตและนำโอกาสมากมายมาให้ รวมถึงการจัดแสดงที่งานโอซาก้าเอ็กซ์โป และเป็นภาพยนตร์เปิดสำหรับยูนิต 9 ที่งาน TED 2025 หลัก

ระหว่างงาน TED นั้น แซม อัลต์แมนก็ให้สัมภาษณ์ในยูนิต 11 ด้วย เราจึงรู้สึกเป็นเกียรติที่ได้อยู่บนเวทีเดียวกันในช่วงเวลาสั้นๆ เราไม่เคยคิดมาก่อนว่าภาพยนตร์ของเราจะเดินทางไปยังประเทศที่เราไม่เคยไปเยือนด้วยซ้ำ

数字生命卡兹克 - inline image

ภาพยนตร์เรื่องที่สองคือโปรโมทอารยธรรมเมืองของเซี่ยงไฮ้ผู่ตงในปีนี้ สานต่อธีม "ลูกแมว" ชื่อว่า "ลูกแมวอารยะเที่ยวผู่ตง" มันสร้างกระแสได้มากเมื่อปล่อยออกมา มีการรีโพสต์จากบัญชีทางการอย่าง Shanghai Release และ Pudong Civilization และข้อมูลก็ยอดเยี่ยมมาก

ในโลกออฟไลน์ มันปรากฏบนจอขนาดยักษ์ในทางเดินใต้ดินสถานีรถไฟใต้ดิน Lujiazui และจอใหญ่มากที่ Super Brand Mall ที่หันหน้าเข้าหาหอไข่มุกตะวันออก หมุนเวียนในพื้นที่หลักของ Lujiazui มันยังฉายบนจอ 12 จอใต้หอไข่มุกตะวันออกด้วย เรายังได้รับ "รางวัลผลงานสื่อสารคุณภาพสูงทางอินเทอร์เน็ต" จากสำนักงานบริหารไซเบอร์สเปซเทศบาลเซี่ยงไฮ้ เรามีซีรีส์เกี่ยวกับลูกแมวมาตลอด จะบอกว่าเราเป็นมืออาชีพในการทำแมวก็ได้

ปลายปี พิพิธภัณฑ์ศิลปะผู่ตงติดต่อเรา พวกเขาจัดนิทรรศการสำคัญของพิพิธภัณฑ์ลูฟวร์ในเซี่ยงไฮ้ ซึ่งเป็นนิทรรศการขนาดใหญ่ครั้งแรกในเมืองนี้ และต้องการให้เราสร้างโปรโมทอย่างเป็นทางการ พิพิธภัณฑ์ต้องการภาพยนตร์สั้นสองเรื่องเพื่อครอบคลุมรอบโปรโมทยาวประมาณหนึ่งถึงสองเดือน

ในที่สุดเราก็ส่งมอบภาพยนตร์สองเรื่อง ครึ่งแรกเล่าเรื่อง "ลูกแมวขาวจากฝรั่งเศสที่มาเซี่ยงไฮ้" พร้อมกับใส่ไข่อีสเตอร์สำหรับครึ่งหลัง

ครึ่งหลังเล่าเรื่อง "โฆษกแมวส้มของผู่ตงไปดูนิทรรศการที่พิพิธภัณฑ์ศิลปะผู่ตง"

ภาพยนตร์ทั้งสองเรื่องหมุนรอบสิ่งจัดแสดงจริงเพื่อการออกแบบการเล่าเรื่อง ครึ่งแรกเน้นที่จานลายนกยูง ครึ่งหลังเน้นที่ "แผ่นจารึกการแข่งขันกวีนิพนธ์" ในครึ่งหลัง เรายังปรับแต่งดนตรีใหม่ เพิ่มแซกโซโฟนเพื่อให้มีกลิ่นอายแจ๊สแบบเซี่ยงไฮ้มากขึ้น

หลังจากภาพยนตร์ปล่อยออกมา มันแพร่กระจายไปทั่วแพลตฟอร์มต่างๆ และข้อมูลบัญชีวิดีโอทางการของพิพิธภัณฑ์ก็ดีมาก บัญชีของเราได้รับข้อความส่วนตัวมากมายจากผู้ชมที่บอกว่าพวกเขาตัดสินใจดูนิทรรศการเพราะภาพยนตร์สั้นสองเรื่องนี้

数字生命卡兹克 - inline image

นอกจากนี้ยังมีสถานการณ์การฉายแบบออฟไลน์ เช่น จอเดอะบันด์ ซึ่งจะวนซ้ำไปจนถึงเดือนพฤษภาคมปีหน้า

ต่อไป เราอยากจะแชร์กระบวนการสร้างสรรค์ทั้งหมดและข้อมูลเชิงลึกบางอย่าง หวังว่ามันจะเป็นประโยชน์กับคุณ

I. การคัดเลือกนักแสดง

ประเด็นแรกที่เราอยากแชร์คือการคัดเลือกนักแสดง และทำไมเราถึงเลือกแมวขาวกับแมวส้มในที่สุด

ถึงแม้เราจะตัดสินใจสานต่อธีมแมว แต่ตัวแมวเองก็มีที่มาที่ไปมากมาย ตอนแรกเราเริ่มจากสีธีมของพิพิธภัณฑ์ศิลปะผู่ตง พิพิธภัณฑ์ส่วนใหญ่เป็นสีดำและสีขาว ดังนั้นความคิดแรกของเราสำหรับตัวเอกคือแมววัว (ดำและขาว)

เรื่องราวในเวอร์ชันเริ่มต้นแตกต่างจากภาพยนตร์สุดท้ายโดยสิ้นเชิง สิ่งจัดแสดงหลักไม่ใช่จานนกยูงและแผ่นจารึกกวี เราเลือกภาพวาดสีน้ำมัน เราตั้งว่าแมววัวกำลังนอนหลับอยู่ที่เท้าของกษัตริย์ในภาพวาด จากนั้นก็ "หลุดออกมา" เมื่อเจ้าหน้าที่พิพิธภัณฑ์เคลื่อนย้ายภาพวาด แมวเริ่มสำรวจพิพิธภัณฑ์ลูฟวร์ และในที่สุดก็เห็นสิ่งจัดแสดงออกจากพิพิธภัณฑ์ลูฟวร์ในรถบรรทุกมุ่งหน้าสู่เซี่ยงไฮ้ แมววัวตัดสินใจกระโดดขึ้นสเก็ตบอร์ดเพื่อไล่ตามรถบรรทุก มีเหตุการณ์เล็กๆ น่าตื่นเต้นมากมายเกิดขึ้นระหว่างทาง เรายังทำเดโมด้วยซ้ำ

ต่อมาเราล้มเลิกแผนนี้ด้วยเหตุผลหลายประการ เหตุผลที่ตรงที่สุดคือระยะเวลาโปรโมทยาวนาน พิพิธภัณฑ์ต้องการภาพยนตร์สองเรื่อง ถ้าเราทำแบบไล่ตามรถบรรทุก ตอนที่สองจะดูเหมือนภาพยนตร์แนวโรดมูฟวี่หลังจากแยก ซึ่งจะทำให้โทนเสียงเพี้ยนและใช้พลังงานมากเกินไปกับการไล่ล่า ไม่สอดคล้องกับบรรยากาศของ "โปรโมทพิพิธภัณฑ์ทางการ" ดังนั้นเราจึงทิ้งแผนแมววัวไปเลย

หลังจากพิพิธภัณฑ์ขอภาพยนตร์สองเรื่อง วิธีแก้ปัญหาแรกที่เราคิดคือง่ายๆ คือแยกแมววัวเป็นแมวขาวกับแมวดำ แต่เมื่อทำไป เราพบว่าแมวดำจะดูมืดเกินไปในภาพยนตร์สุดท้ายและไม่สะดุดตา เราต้องการให้ตัวเอก "สว่างกว่า" เพื่อดึงดูดความสนใจของผู้ชมได้เร็วขึ้น เราจึงปรับจาก "ดำหนึ่ง ขาวหนึ่ง" เป็น "ขาวหนึ่ง ส้มหนึ่ง" นอกจากนี้ แมวส้มยังสะท้อนถึงบทบาทของแมวส้มในฐานะโฆษกเซี่ยงไฮ้จากภาพยนตร์ก่อนหน้าของเรา ทำให้เหมาะสมกับส่วนเซี่ยงไฮ้มากกว่า ส่วนฝรั่งเศสเหมาะกับแมวขาวมากกว่า

数字生命卡兹克 - inline image

II. การกำหนดโทนเสียง

ประเด็นที่สองคือการกำหนดโทนเสียง

ตัดสินใจเรื่องภาพและดนตรีก่อน แล้วค่อยดำเนินการกับสตอรีบอร์ดทั้งหมด

เวลาทำภาพยนตร์ ขั้นตอนที่จำเป็นมากคือการตัดสินใจ "โทนเสียงของภาพยนตร์" โทนเสียงประกอบด้วยสองส่วน ส่วนแรกคือภาพหลักมีลักษณะอย่างไรและความรู้สึกของภาพยนตร์ ส่วนที่สองคือดนตรี สำหรับ TVC ดนตรีจะบอกผู้ชมโดยตรงว่ารู้สึกอย่างไร และในทางกลับกันก็ชี้นำจังหวะการตัดต่อ กำหนดว่าช็อตจะตัดต่อเร็วหรือช้า

โปรเจกต์นี้มีข้อมูลมากมาย: พิพิธภัณฑ์ศิลปะผู่ตง, พิพิธภัณฑ์ลูฟวร์, ศิลปะอิสลาม, เซี่ยงไฮ้, ปารีส ฯลฯ

ก่อนอื่นเราสังเกต "ห้องกระจก" ของพิพิธภัณฑ์ศิลปะผู่ตง และรู้สึกว่าแนวคิดเรื่องกระจกเหมาะกับโครงสร้างมาก พิพิธภัณฑ์ลูฟวร์และพิพิธภัณฑ์ศิลปะผู่ตงสามารถมีความสัมพันธ์แบบกระจกเงาได้ เช่นเดียวกับเซี่ยงไฮ้และปารีส และลูกแมวสองตัว ดังนั้นตอนแรกเราอยากทำ "แอนิเมชั่นจอแยก" เล่าเรื่องปารีสด้านหนึ่งและเซี่ยงไฮ้อีกด้านหนึ่ง ในที่สุดก็มาพบกันที่พิพิธภัณฑ์ศิลปะผู่ตง

เราทำภาพสำรวจเบื้องต้นบางอย่าง เช่น เดอะบันด์มองพิพิธภัณฑ์ศิลปะผู่ตงด้านบนและพิพิธภัณฑ์ลูฟวร์ด้านล่าง เรายังทำองค์ประกอบของแมวสองตัวมองโปสเตอร์บนโต๊ะของตัวเอง

ต่อมา อาเหวินทำ "การปรับโฉมครั้งใหญ่" โดยอิงจากภาพเหล่านี้ วาง "พิพิธภัณฑ์ลูฟวร์" ไว้ด้านบนและ "พิพิธภัณฑ์ศิลปะผู่ตง" เป็นเงาสะท้อนด้านล่าง ภาพดูโปร่งสบายมาก มีพื้นผิวแบบภาพยนตร์ อารมณ์สง่างาม และแสงสว่างสมจริง อีกชุดภาพได้รับการปรับปรุง ย้าย "โปสเตอร์" จากโต๊ะไปที่ตัวอาคารเพื่อให้ข้อมูลสภาพแวดล้อมเป็นธรรมชาติมากขึ้น

จากนี้ เรากำหนดบรรยากาศภาพของภาพยนตร์ทั้งหมด

数字生命卡兹克 - inline image

III. ดนตรี

ประเด็นที่สามคือดนตรี

โดยทั่วไปเราทำดนตรีเร็วมากเพราะมันกำหนดจังหวะ ซึ่งกำหนดจำนวนช็อตและกลยุทธ์การตัดต่อ สำหรับโปรเจกต์นี้ เราตัดสินใจว่าเครื่องดนตรีหลักจะเป็นเปียโน มีสองเหตุผล หนึ่งคือเราชอบพื้นผิวสะท้อน "ระลอกน้ำ" ในภาพกระจก ซึ่งทำให้เรานึกถึงคอร์ดเปียโนที่สะอาด อีกเหตุผลคือโครงสร้างตารางของห้องกระจกทำให้เรานึกถึงความเป็นระเบียบของคีย์บอร์ดเปียโน

สกอร์ภาพยนตร์สั้นเชิงเล่าเรื่องต้องมี "ส่วนโค้ง" ไม่สามารถมีจังหวะเดียวกันตั้งแต่ต้นจนจบเหมือนเสียงสีขาวได้ เรื่องราวต้องมีจุดเริ่มต้น การพัฒนา จุดไคลแมกซ์ และบทสรุป และดนตรีต้องมีโครงสร้างที่สอดคล้องกัน

เราใช้ Suno เพราะมันสร้างดนตรีที่ฟังดูดีและช่วยให้ควบคุมส่วนต่างๆ ได้ละเอียด คุณสามารถระบุความยาวของแต่ละทำนองและบอกมันอย่างชัดเจนว่าต้องการอารมณ์แบบไหน ณ จุดใดจุดหนึ่ง เช่น การพลิกผันกะทันหัน ความตึงเครียด หรือความระทึกขวัญ

โครงสร้างดนตรีของเราครั้งนี้ประมาณนี้: ช่วงเปิดใช้คอร์ดเปียโนที่เรียบง่ายมากเพื่อค่อยๆ ดึงดูดผู้ชมเข้าสู่เรื่องราว จากนั้นมีส่วนที่ติดตามตัวเอกและสภาพแวดล้อม หลังจากนั้นมีส่วนเปลี่ยนผ่านที่สร้างอุปสรรคเล็กน้อยเพื่อให้ผู้ชมดูต่อไป จากนั้นเข้าสู่ทำนองที่สอง ซึ่งบรรทุกการกระทำของตัวเอกและจุดไคลแมกซ์ สุดท้ายคือตอนจบ เราต้องการกลับไปที่คอร์ดเปียโนที่สวยงาม ดังนั้นเราจึงเพิ่ม outro โดยเฉพาะ

ข้อดีอย่างหนึ่งของ Suno คือคุณสามารถสร้างส่วนที่ไม่พอใจซ้ำได้ไม่จำกัด หลังจากทำดนตรีฝรั่งเศสเสร็จ เราส่งออกทั้งเพลงและอัปโหลดกลับไปที่ Suno เพื่อทำรูปแบบต่างๆ สำหรับส่วนเซี่ยงไฮ้ในขณะที่รักษาทำนองไว้ เราตั้งค่า Audio Influence เป็น 50% เพื่อให้แน่ใจว่าทำนองพื้นฐานยังคงอยู่ จากนั้นบอกให้เพิ่มแซกโซโฟนและทำให้รู้สึกเหมือนแจ๊สเซี่ยงไฮ้เก่า มันสร้างรูปแบบที่เหมาะสมมากบนทำนองเดิม

ครั้งหนึ่งมันให้ตอนจบที่ค่อนข้างเกินจริง แต่ในที่สุดเราก็เปลี่ยนกลับเป็นตอนจบเดิมเพื่อให้มันดูสงบเสงี่ยมมากขึ้น

นอกจากนี้ เรายังโพสต์สกอร์เหล่านี้ทางออนไลน์ภายใต้ตัวตนของแมวของเรา นิก้า นิก้าถือเป็น "นักดนตรีในตำนานบนดาวเคราะห์แมว" และมันรวมถึงสกอร์ TVC บางส่วนที่เราทำให้ลูกค้าด้วย

数字生命卡兹克 - inline image

IV. การทำสตอรีบอร์ด

ต่อไปคือวิธีการทำสตอรีบอร์ด

รสนิยมส่วนตัวของเราแข็งแกร่งมาก ดังนั้นนี่จึงเป็นการแบ่งปันประสบการณ์มากกว่า

ข้อกำหนดพื้นฐานของเราสำหรับสตอรีบอร์ดเปิดคือ "ความหนาแน่นของข้อมูลสูง"

พยายามบอกใบ้ว่าเรื่องราวเกี่ยวกับอะไรในช็อตแรก ตัวอย่างเช่น ช็อตแรกของ "แมวต้องห้ามไปทำงาน" คือแมวลืมตาพร้อมกับเงาสะท้อนของเมืองต้องห้ามในรูม่านตา อธิบายอย่างรวดเร็วว่า "แมวและเมืองต้องห้าม" จุดเริ่มต้นของ "ลูกแมวอารยะเที่ยวผู่ตง" คือแมวผลักแผนที่เซี่ยงไฮ้ อธิบายอย่างรวดเร็วว่า "แมวมาเซี่ยงไฮ้เพื่อท่องเที่ยว"

สำหรับส่วนลูกแมวขาวพิพิธภัณฑ์ลูฟวร์ เราต้องการอธิบายเรื่องราวภายในสามช็อต ช็อตแรกมีแมวมองโปสเตอร์ ปลูกฝังภาพหลัก "โปสเตอร์นิทรรศการ" ในใจผู้ชม ช็อตที่สองใช้ภาพใกล้เพื่อแนะนำตัวเอก ช็อตที่สามใช้ภาพกว้างเพื่อสร้างสภาพแวดล้อมในขณะที่แสดงความสัมพันธ์แบบกระจกเงาของ "พิพิธภัณฑ์ลูฟวร์สะท้อนพิพิธภัณฑ์ศิลปะผู่ตง"

สตอรีบอร์ดยังต้องมีจังหวะ จังหวะส่วนใหญ่มาจากการเปลี่ยนแปลงขนาดช็อต ภาพกว้างซ้ำแล้วซ้ำอีกดูซ้ำซากมาก ดังนั้นเราจึงตัดสลับระหว่างภาพกว้างและภาพใกล้เพื่อสร้างความรู้สึกขยายและหดตัว ถ้าช็อตเปิดมีข้อมูลมากเกินไป ผู้ชมจะไม่รู้ว่าควรมองตรงไหนในวินาทีแรก เราใช้แอนิเมชั่นง่ายๆ เพื่อนำทางสายตา ครึ่งแรกใช้วิธี "ดึงม่านเปิด" และครึ่งหลังก็ใช้การออกแบบเปิดแบบคลาสสิกเช่นกัน

จากนั้นมาถึงส่วนแรกของเรื่อง ซึ่งเป็นส่วนหลักและเป็นชุดสตอรีบอร์ดที่เราพอใจมาก

จุดประสงค์ของลำดับนี้คือเพื่อแสดงให้เห็นว่าแมวขาวเดินออกจากพิพิธภัณฑ์ลูฟวร์ ตกหลุมรักจานลายนกยูง และมีจินตนาการที่ยอดเยี่ยม

ลำดับนี้ต้องสื่อข้อมูลสองอย่าง: ตัวเอกอยู่ที่พิพิธภัณฑ์ลูฟวร์ และตัวเอกชอบจานนกยูง

ช็อตแรกใช้สิ่งจัดแสดงคลาสสิกของพิพิธภัณฑ์ลูฟวร์เพื่อสร้างสถานที่ เราเลือกเทพีไนกี้แห่งซาโมเทรซ ซึ่งเป็นประติมากรรมคลาสสิกมาก เราจงใจไม่เลือกโมนาลิซ่าเพราะมันธรรมดาเกินไปและจะดูซ้ำซาก ในแง่ขององค์ประกอบ เราไม่ได้โฟกัสกล้องไปที่ประติมากรรมเพียงอย่างเดียวเพราะเราต้องการให้ผู้ชมโฟกัสที่แมว ดังนั้นเราจึงวางประติมากรรมไว้ในพื้นหลังเป็นของตกแต่งและใช้มุมกล้องต่ำมาก ทำให้แมวขาวในเบื้องหน้าครองพื้นที่ในเฟรมมากขึ้น บังคับให้ผู้ชมโฟกัสที่แมวในขณะที่ยังจำได้ทันทีว่า "นี่คือพิพิธภัณฑ์ลูฟวร์"

ช็อตที่สองเริ่มแนะนำศิลปะอิสลามอย่างละเอียดอ่อน เราอ้างอิงศิลปินที่โด่งดังบน Instagram ซึ่งวิธีปฏิบัติทั่วไปคือถ่ายทำฉากชีวิตประจำวันแล้วทำให้สัญลักษณ์ภายในนั้นเคลื่อนไหว

ความรู้สึกนั้นยอดเยี่ยมมากเพราะมันเหนือจริงแต่ก็รู้สึกเหมือนเป็นสิ่งที่เกิดขึ้นได้ในชีวิตจริง ตอนแรกเราทำเวอร์ชันที่เกินจริงมากกว่า เช่น ทั้งฉากกลายเป็นลวดลายเมื่อแมวเลื่อนผ่าน แต่ต่อมารู้สึกว่ามันเคลื่อนไหวมากเกินไปและไม่เหมือนชีวิตจริง เราจึงเปลี่ยนเป็นแผนกล้องนิ่งที่ควบคุมมากขึ้น ปล่อยให้ลวดลายพื้นหลังเคลื่อนไหวอย่างละเอียดอ่อนเมื่อแมวเดินผ่าน

เราลองหลายเวอร์ชัน: ลวดลายเหมือนวงเวทย์, กล้องแพนลงสู่โลกศิลปะอิสลาม, ลวดลายยื่นออกมาจากหน้าจอ ฯลฯ ต่อมาเราตระหนักว่า "น่าสนใจ" อย่างเดียวยังไม่พอ เรายังต้องการผลตอบแทนทางอารมณ์ ดังนั้นเราจึงใช้การออกแบบที่ตัดกัน: เริ่มต้นด้วยมุมสูงที่กดดัน และเมื่อกล้องเคลื่อนไปยังเฟรมสุดท้าย มันจะเข้าสู่พื้นที่เปิดโล่งขนาดใหญ่ ทำให้ผู้ชมรู้สึกถึงความกระจ่างแจ้ง ในช็อตสุดท้าย ลวดลายทั้งสองด้านเคลื่อนไหวเหมือนสายพานลำเลียง นำแมวเข้าสู่พื้นที่จัดแสดงที่เปิดโล่ง

เรายังทำการแลกเปลี่ยน: ไม่มีภาพเหมือนในเฟรม เมื่อภาพเหมือนมนุษย์ปรากฏในเฟรม ผู้ชมจะมองหาภาพเหมือนทั้งหมดโดยไม่ตั้งใจ และความสนใจของพวกเขาจะถูกขโมยไปจากแมว เราต้องการให้ผู้ชมติดตามแมว ดังนั้นเราจึงลบองค์ประกอบที่ขโมยซีนได้ง่ายออกให้มากที่สุดเพื่อให้การแสดงออกยังคงละเอียดอ่อน

数字生命卡兹克 - inline image

ในการออกแบบเฟรมสุดท้ายของช็อตนี้ อาเหวินดำเนินการที่ชาญฉลาดมาก: วางจานลายนกยูงลงในพื้นที่จัดแสดงโดยตรง ปล่อยให้สิ่งจัดแสดงหลักปรากฏขึ้นในช่วงต้นของจุดไคลแมกซ์ หลังจากกำหนดเฟรมสุดท้ายแล้ว เรากลับไปออกแบบเฟรมแรกและการเคลื่อนไหวของกล้องใหม่ ทำให้ช็อตควบคุมได้มากขึ้น

หลังจากจุดไคลแมกซ์ทางอารมณ์ เราจำเป็นต้องเพิ่มสิ่งเร้าใหม่เล็กน้อย เราคิดถึงแมวที่เห็นพื้นที่หลังจากขึ้นไป หรือเห็นสิ่งจัดแสดงอื่น แต่ก็ไม่มีอะไรน่าสัมผัสพอ

ต่อมาเราคิดถึงแมวที่เห็นนกยูง และนกยูงมีชีวิต ประเด็นนี้ทำให้เรารู้สึกทันทีว่างานศิลปะมีชีวิตขึ้นมา ในแง่ของจังหวะ เรายังทำการค่อยเป็นค่อยไป: นกยูงหันหัวก่อน จากนั้นหันตัว และสุดท้ายกางปีก เก็บความประหลาดใจไว้จนถึงวินาทีสุดท้าย

หลังจากจุดไคลแมกซ์ มันต้องกลับสู่ความเป็นจริง เราใช้วิธีที่ง่ายมาก: ตัดกลับไปที่ภาพใกล้ของแมว ราวกับว่ามันกำลังจินตนาการ จากนั้นตัดไปที่ช็อตวัตถุประสงค์ที่สร้างความเป็นจริง แมวยืนอยู่หน้าจานนกยูงมองสิ่งจัดแสดง ผู้ชมจึงเข้าใจว่าส่วนที่เหนือจริงมาจากจินตนาการของแมว

จากนั้นมาถึงส่วนเปลี่ยนผ่าน โดยมีเป้าหมายเพื่ออธิบายว่า "สิ่งจัดแสดงกำลังจะไปเซี่ยงไฮ้" และ "แมวตัดสินใจเข้าไปในกล่องและไปด้วย"

เราใช้มอนเทจและการประมวลผลแบบจอแยกเพราะมันสามารถสื่อข้อมูลจำนวนมากในเวลาอันสั้น เวลาทำช็อตแบบนี้ เราตัดคนออกให้มากที่สุด ในภาพยนตร์สัตว์ ใบหน้ามนุษย์ขโมยซีนได้ง่าย ผู้ชมมีแนวโน้มที่จะเห็นอกเห็นใจคนมากกว่า และความสนใจของพวกเขาจะถูกดึงออกไป ดังนั้นเราจึงเก็บไว้เฉพาะภาพใกล้และการกระทำโดยไม่แสดงใบหน้า

数字生命卡兹克 - inline image

ส่วนที่สองเดิมทีจะเกี่ยวกับสิ่งที่เกิดขึ้นกับแมวในกล่องสินค้าบนเครื่องบิน

ก่อนที่จะกำหนดเนื้อเรื่องอย่างสมบูรณ์ เราใช้ Sora รันตัวอย่างบางส่วนเพื่อตรวจสอบจังหวะและองค์ประกอบอย่างรวดเร็ว มองหาความประหลาดใจและข้อมูลอ้างอิง หลังจากรันแล้ว เราไม่ชอบเพราะภาพไม่โปร่งสบาย สีเหลือง เก่า และมืด ไม่สอดคล้องกับโทนเสียงที่เรากำหนดไว้ก่อนหน้านี้ ตรรกะของเนื้อเรื่องก็ใช้ไม่ได้เพราะแมวในกล่องไม่สามารถมองเห็นสิ่งจัดแสดงภายนอกได้ และสิ่งจัดแสดงก็ควรอยู่ในกล่องเช่นกัน

ดังนั้นเราจึงทิ้งส่วน "แอบดูในกล่อง" ทั้งหมดและดึงโฟกัสกลับไปที่การเล่าเรื่องหลัก: แมวขาวพาจานนกยูงไปเซี่ยงไฮ้

สำหรับการมาถึงเซี่ยงไฮ้ ตอนแรกเราอยากทำการเปลี่ยนผ่านที่สมจริงของเครื่องบินบินจากพิพิธภัณฑ์ลูฟวร์ไปเซี่ยงไฮ้ และรันด้วย VEO 3 เรายังลองไมโครแอนิเมชั่นแผนที่คลาสสิก แต่แผนทั้งหมดนี้ถูกปฏิเสธโดยเรา

เพราะแผนที่ทำให้ผู้ชมกังวลเป็นพิเศษเกี่ยวกับความสมเหตุสมผล เช่น ตำแหน่งของปารีสและเซี่ยงไฮ้และระยะทางบินถูกต้องหรือไม่ ซึ่งเบี่ยงเบนความสนใจ เรายังลองแผน "แผนที่จุดไฟพร้อมรอยเท้า" ที่เป็นนามธรรมมากขึ้น แต่เราไม่ชอบที่ช็อตกว้างเกินไป เราชอบให้ผู้ชมเห็นวัตถุหลักครอบครองพื้นที่ส่วนใหญ่ของเฟรม

ในที่สุด เราตัดสินใจเปลี่ยนโดยตรงระหว่าง "เฟรมแรกของพิพิธภัณฑ์ลูฟวร์" และ "เฟรมแรกของพิพิธภัณฑ์ศิลปะผู่ตง" ทำให้การเปลี่ยนผ่านใกล้ชิดและโฟกัสมากขึ้น

เราทดสอบแอนิเมชั่นเปลี่ยนผ่านหลายประเภท: เช่น พรมคลี่ออก กระเบื้องพลิก ภาพเครื่องบิน ฯลฯ ในที่สุดเราเลือกเครื่องบินเพราะภาพเครื่องบินปรากฏในช็อตก่อนและหลังการเปลี่ยนผ่าน ภาพที่ต่อเนื่องกันทำให้ผู้ชมรู้สึกสบายขึ้น แม้ว่าจะกระโดดจากสมจริงไปสู่สไตล์ศิลปะโมเสกตรงกลางก็จะไม่กระทันหัน

数字生命卡兹克 - inline image

หลังจากมาถึงเซี่ยงไฮ้ สตอรีบอร์ดตรงไปตรงมามากขึ้น: ก่อนอื่นเห็นพิพิธภัณฑ์ศิลปะผู่ตงจากไกลไปใกล้ จากนั้นเห็นแมววิ่งไปทางพิพิธภัณฑ์ เราชอบช็อตหนึ่งมาก: แมววิ่งผ่านน้ำ โดยมีเงาสะท้อนในน้ำเป็นนกยูง

แนวคิดนี้ตอนแรก "ดุเดือด" กว่า เราหวังว่าเมื่อแมววิ่ง มันจะเห็นเงาของสัตว์หลายชนิด เช่น นกยูง ม้า อูฐ ฯลฯ ทำให้เกิดความรู้สึกว่า "ศิลปะอิสลามทั้งหมดมาถึงเซี่ยงไฮ้ด้วยกัน" เราลอง text-to-image และ text-to-video แต่ก็ไม่ได้ผล เรายังคิดถึงแมวที่เห็นตัวเองเป็นเสือในใจ โดยมีเงาเป็นเสือ แต่มันเกี่ยวข้องกับภาพยนตร์น้อยเกินไปและถูกลบออกอย่างรวดเร็ว

ต่อมาเราพบว่าการส่งมอบความคิดสร้างสรรค์หลักเช่นนี้ให้ AI โดยตรงในครั้งเดียวนั้นไม่น่าเชื่อถือ จำเป็นต้องแยกย่อยเพื่อดำเนินการ ก่อนอื่นเราวาดสตอรีบอร์ดด้วยมือ ตัดสินใจใช้มุมสูงเล็กน้อยเพื่อให้ความสนใจของผู้ชมตกอยู่ที่เงาสะท้อนในทะเลสาบโดยธรรมชาติ

องค์ประกอบถูกทำให้ง่ายขึ้นเป็น "เงาของแมวคือนกยูง" ซึ่งเกี่ยวข้องโดยตรงกับเส้นเรื่องหลักมากที่สุด เราจะใช้ Photoshop เพื่อประกอบความสัมพันธ์ที่ต้องการก่อน จากนั้นส่งมอบให้โมเดลเพื่อทำให้สไตล์และไดนามิกเป็นหนึ่งเดียวกัน ตลอดกระบวนการ เรารู้สึกอย่างแรงกล้าว่าแม้แต่การวาดด้วยมือคร่าวๆ ก็เข้าใจง่ายกว่าสำหรับ AI และสำหรับคนในการสื่อสาร

สำหรับตอนจบ เราสะท้อนแนวคิดเรื่อง "กระจก" อีกครั้ง จบลงด้วยภาพที่สงบเสงี่ยมและสวยงามมากขึ้น

数字生命卡兹克 - inline image

นั่นคือทั้งหมดสำหรับสตอรีบอร์ด

ต่อไป ส่วนศิลปะส่งมอบให้อาเหวิน

V. ศิลปะ

ผม (อาเหวิน) ทำสองอย่างเป็นหลัก

อย่างแรก แปลงสตอรีบอร์ดต้นฉบับของไห่ซินเป็นภาพสุดท้าย อย่างที่สอง ควบคุมสไตล์ศิลปะโดยรวม

หลังจากได้รับโปรเจกต์ เราก็ไปเรียนรู้เกี่ยวกับศิลปะอิสลามทันที มันเป็นสไตล์ศิลปะที่เรามักไม่ค่อยได้สัมผัส แต่มีเอกลักษณ์มาก หลังจากเข้าใจคำหลักสำคัญบางคำแล้ว ก็ง่ายที่จะสร้างงานศิลปะสไตล์โมเสกที่มีลักษณะแปลกใหม่ เราสรุปคำหลักที่มีประโยชน์มาก 4 คำในไลฟ์สด สองคำที่ใช้บ่อยที่สุดคือ "สไตล์ Iznik" และ "ศิลปะโมเสก" ที่นี่โมเสกหมายถึงศิลปะโมเสก ซึ่งแตกต่างจากพิกเซลอาร์ต

เรามีหลักการสองข้อในการทำภาพยนตร์ มันต้องดูดีตั้งแต่แรกเห็น และต้องทนทานเมื่อมองครั้งที่สอง ในยุค AI การที่ผู้ชมยินดีดูภาพยนตร์สั้นของคุณจนจบเป็นสิ่งที่มีค่า การดูดีสำหรับเราเท่ากับความรู้สึกแบบภาพยนตร์ ความทนทานเท่ากับรายละเอียดและรายละเอียดที่สร้างสรรค์มากที่สุดเท่าที่จะเป็นไปได้ รวมถึงรายละเอียดทางศิลปะ

ทุกคนจริงๆ แล้วไวต่อความรู้สึกแบบภาพยนตร์มาก สำหรับภาพเดียวกันและพรอมต์เดียวกัน ด้วยผลลัพธ์จากโมเดลต่างๆ คุณสามารถตัดสินได้ง่ายว่าอันไหนมีความรู้สึกแบบภาพยนตร์มากกว่า ดังนั้นขั้นตอนแรกในศิลปะคือการเลือกโมเดลที่เหมาะสม ปัจจุบันโมเดลสร้างภาพหลักของเราคือ Nano Banana Pro เป็นหลัก สำหรับการปรับเปลี่ยนภาพ เราส่วนใหญ่ใช้มันโดยตรงกับการปรับเปลี่ยนข้อความ บางครั้งรวมกับ Photoshop ผมยังปรับแต่งบางส่วนด้วยมือ

การเลือกโมเดลที่เหมาะสมมีค่าเท่ากับการเลือกผู้ขายที่เหมาะสม มันสามารถทำงานได้ดีและจัดการกับการปรับเปลี่ยนที่ยุ่งยากมากมาย ตัวอย่างเช่น มีช็อตหนึ่งที่เราพอใจมาก แต่หลังจากส่งร่างแรก พิพิธภัณฑ์บอกว่าช็อตนี้ต้องลบออกเพราะมันจะทำให้การเคลื่อนย้ายสิ่งจัดแสดงดูไม่เป็นมืออาชีพ และพวกเขาไม่ต้องการสื่อความรู้สึกนั้นให้ผู้ชม ในแง่ของการเล่าเรื่อง เราต้องการช็อตนี้เพื่ออธิบายว่าแมวซ่อนตัวในกล่องเพื่อติดตามสิ่งจัดแสดงไปเซี่ยงไฮ้ ในที่สุด เราใช้ Nano Banana "ห่อ" สิ่งจัดแสดง ทำให้การจัดการดูเป็นมืออาชีพมากขึ้น และมันก็ผ่าน

อีกตัวอย่างหนึ่ง: เฟรมสุดท้ายของภาพสวยมาก แต่คุณจะพบว่าความสนใจอยู่ที่ก้นแมวขาวเป็นเวลานาน นี่เป็นปัญหาที่เปิดเผยหลังจากเปลี่ยนเป็นแมวขาวเท่านั้น วิธีแก้ไขง่ายๆ: ปล่อยให้หางห้อยลงในเฟรมแรก และจะไม่มีปัญหาเมื่อเดินขึ้นไปในภายหลัง

ที่เกินจริงยิ่งกว่านั้นคือการช่วยสถานการณ์ด้วยการเปลี่ยนแมว เมื่อเราเปลี่ยนตัวเอกจากแมวดำเป็นแมวขาว halfway หลายเฟรมนิ่งและแอนิเมชั่นก็เสร็จแล้ว

ฟังดูเหลือเชื่อ แต่ AI สามารถเปลี่ยนมันได้จริงๆ

ในเวลานั้น เครื่องมือที่เราใช้ได้มีจำกัด มีเพียง Nano Banana รุ่นแรก ซึ่งเรามักใช้ใน Whisk ของ Google นิสัยของเราคือหนึ่งโฟลเดอร์ต่อหนึ่งช็อต ดังนั้นเราจึงเข้าไปในแต่ละโฟลเดอร์ทีละอันเพื่อเปลี่ยนสีแมว และทำเสร็จภายในวันครึ่ง

ต่อมา เมื่อตรวจทาน Banana Pro ออกมา เราพบว่าประสิทธิภาพที่เหลือเชื่อยิ่งกว่านั้นกำลังจะมา AI ไม่เพียงแต่เปลี่ยนมันได้ แต่ยังเปลี่ยนได้เร็วขึ้นอีกด้วย บนแพลตฟอร์มของบุคคลที่สาม คุณสามารถอัปโหลดเฟรมนิ่งทั้งหมดในครั้งเดียวและเปลี่ยนตัวเอกแมวดำเป็นแมวขาวด้วยประโยคเดียว ซึ่งมีประสิทธิภาพมากกว่า

数字生命卡兹克 - inline image

หลายคนถามว่า Nano Banana Pro ใช้งานได้ดีที่สุดตรงไหน

จากประสบการณ์ของเรา ระบบสมาชิกของ Google เองก็มีข้อผิดพลาดไม่น้อยเลย เราเป็นสมาชิกระดับสูงสุด Google Ultra ตั้งแต่เปิดตัวและใช้มาจนถึงตอนนี้ คุณจะเห็นคนอื่นพูดถึงส่วนลดของ Google บ่อยๆ เช่น 79 ดอลลาร์ต่อเดือน เป็นเวลาสามเดือน หรือราคาครึ่งปี แต่พอหันกลับไปดูราคาสมาชิกของคุณเอง มันอาจไม่เปลี่ยนแปลงเลยและยังแพงมาก แถมยิ่งแพงขึ้นเมื่อรวมภาษี

อีกจุดหนึ่งที่ทำให้เราไม่พอใจมากคือ จุดเริ่มต้นของ 4K นั้นไม่ชัดเจน บางคนบอกว่าอยู่ใน Flow แต่การสร้างเริ่มต้นของ Flow คือ 1K และมันจะ super-resolution เป็น 4K เฉพาะตอนดาวน์โหลด เราไม่แน่ใจว่ามันเป็น super-resolution หรือ native 4K กันแน่ Google AI Studio สามารถส่งออก 4K ได้แบบ native มากกว่า แต่คิดค่าบริการแยกต่างหาก

ถ้าคุณเป็นสมาชิก Ultra เหมือนเรา นี่คือวิธีใช้ที่ใช้งานได้จริงมากกว่า: ใช้ Flow สำหรับการสร้างแบบกาชาเร็วๆ เพราะมันเร็วด้วยฐาน 1K ใช้ Gemini สำหรับการปรับแต่งหลายรอบ การสนทนาแบบหลายรอบสะดวกมาก เมื่อคุณได้ผลลัพธ์ที่ดีแล้ว ก็ไปที่ AI Studio เพื่อ 4K แบบ native

นอกจากนี้ พรอมต์ของเราก็ยิ่งเรียบง่ายขึ้นเรื่อยๆ โมเดลมีความเข้าใจแบบ multimodal ที่แข็งแกร่ง และมักไม่ต้องการเรียงความยาวๆ ตัวอย่างเช่น ผมจะโยนรูปเข้าไป ให้มันแยกแมวกับผีเสื้อออกมา วางบนพื้นหลังสีพื้น แล้วเปลี่ยนเป็น pixel art หลังจากปรับสไตล์ให้มั่นคงแล้ว การขยาย素材 ก็มีประสิทธิภาพมาก

และพรอมต์ในทุกวันนี้จำเป็นต้องเป็นเรียงความยาวๆ จริงหรือ?

เรามีช็อตหนึ่งที่ต้องการมุมมองด้านหน้าของนิทรรศการ แต่ไม่มีใครเข้าไปได้ในช่วงติดตั้ง เจ้าหน้าที่ส่งมาได้แค่ภาพถ่ายด่วนสองภาพจากระยะไกล

ภาพทั้งสองนี้มีค่าสำหรับเรามาก เราจึงใช้มันเป็นข้อมูล และให้ Gemini สร้างมุมมองด้านหน้าของนิทรรศการจากสองภาพนี้โดยตรง ในอัตราส่วน 16:9

ผลลัพธ์ดีมาก และเราใช้มันทำช็อตสุดท้าย

ที่น่าประหลาดใจยิ่งกว่าคือตอนที่เราไปสถานที่จริงในวันเปิด และพบว่ามันเกือบจะเหมือนกับสถานที่จริงทุกประการ คนอื่นเข้าไปไม่ได้ แต่ AI กลับเข้าไปได้

数字生命卡兹克 - inline image

เมื่อโมเดลทรงพลังพอ มันไม่สนใจที่มาของสตอรีบอร์ด นั่นหมายความว่า บางครั้งคุณให้สตอรีบอร์ดที่ค่อนข้างเพี้ยนๆ กับมัน มันจะเข้าใจทันทีว่าคุณต้องการอะไร และสร้างภาพที่สวยงามมากออกมาโดยตรง ทั้งหมดนี้เป็นภาพที่ส่งออกโดยตรงจากโมเดลโดยใช้สตอรีบอร์ดของ Hai Xin และทุกภาพก็ดีมาก

数字生命卡兹克 - inline image

แต่สำหรับความคิดสร้างสรรค์ที่ซับซ้อน คุณต้องทำซ้ำเป็นขั้นตอน

ยกตัวอย่างช็อต "แมวเดินบนชายฝั่ง โดยเงาสะท้อนในน้ำเป็นนกยูง"

ขั้นแรก ผมต้องเข้าใจมุมมองของภาพสเก็ตช์สตอรีบอร์ด

ผมมักจะสร้างสเก็ตช์คร่าวๆ ใน PPT ผมบังเอิญมี PNG โปร่งใสของแมวขาว "นักแสดงมากประสบการณ์" อยู่ในมือ วางมันในเฟรมเพื่อสร้างมุมมอง จากนั้นโยนสเก็ตช์คร่าวๆ นี้เข้าโมเดลเพื่อเปลี่ยนให้เป็นสไตล์สมจริง ก่อนอื่นให้ได้ฉากพื้นฐานของ "แมวเดินบนชายฝั่งพร้อมทะเลสาบใกล้ๆ"

ขั้นตอนที่สองคือปูพื้น ฉันใช้พรอมต์ปูกระเบื้องบนพื้นคอนกรีตจริงๆ ลองหลายคีย์เวิร์ดจนเจอเวอร์ชันที่มี "ความหนาแน่นที่พอดี" หลังจากปูแล้ว ภาพก็เริ่มเป็นรูปเป็นร่าง แต่การทำซ้ำหลายครั้งจะทำให้ท่าทางของแมวผิดรูปไป เลยให้ AI ปรับอีกครั้ง

ขั้นตอนที่สามคือเพิ่มข้อมูลนิทรรศการ วิธีที่ง่ายที่สุดคือการวางซ้อนใน PS และปรับสไตล์เลเยอร์ แต่เราพบว่าเงาสะท้อนของนกยูงในทะเลสาบนั้นขยับได้ยาก เพราะนกยูงที่ถูกจัดสไตล์ไม่สามารถแปลงเป็นไดนามิกที่สมจริงได้ง่ายๆ ดังนั้นผมกลับไปที่ PS ลบนกยูงออก เปลี่ยนเป็นเงาของนกยูงที่สมจริง แล้วโยนกลับเข้าโมเดลเพื่อให้ทำงานต่อจากนั้น

ต่อมา ต้องเปลี่ยนสีแมว หลังจากเปลี่ยนแล้วพบว่าพื้น "กิน" แมวขาว เลยต้องปูพื้นใหม่เพื่อให้ได้เฟรมนิ่งสุดท้าย

数字生命卡兹克 - inline image

สุดท้าย การทำแอนิเมชันเป็นส่วนที่ง่ายที่สุด โดยปกติแล้วเป็นการส่งออกโดยตรง ลองสองสามครั้งก็ได้ไดนามิกที่ดี เช่น แมวเดินเลียบชายฝั่งและเงาสะท้อนนกยูงในน้ำตามไปด้วย

จากนั้นก็ประสบการณ์ด้านศิลปะบางอย่างเกี่ยวกับการประกอบภาพฉากจริง

มีสถานที่สำคัญและนิทรรศการมากมายในหนังสั้นที่ไม่สามารถผิดพลาดได้ ดังนั้นเราต้องการความแน่นอน หลายครั้งที่เราประกอบแมวเข้ากับสถานที่สำคัญที่มีอยู่จริง

ตอนนี้การประกอบภาพแบบนี้ง่ายมาก คุณแค่บอก Nano Banana Pro ว่ามีแมวสีส้มหันหลังให้กล้องกำลังไล่ผีเสื้อสีที่กำหนดในฉาก มันก็สามารถสร้างได้

เคล็ดลับเล็กๆ สองข้อเพื่อเพิ่มอัตราความสำเร็จ อย่างแรก ตัดก่อนสร้าง เช่น เราไม่ต้องการของตกแต่งด้านล่างของ素材 Peace Hotel ก็จะตัดออกก่อนให้โมเดล ภาพในร่มหลายช็อตก็เหมือนกัน ตัดส่วนที่ไม่จำเป็นออกก่อน โมเดลจะโฟกัสได้ดีขึ้น

ข้อสอง ถ้าคุณต้องการทำ match cut หรือใช้ตัวแบบซ้ำๆ แนะนำให้แยกแมวกับผีเสื้อไปไว้บนพื้นหลังสีพื้นก่อนแล้วค่อยเปลี่ยนพื้นหลังต่างๆ การให้โมเดลเปลี่ยนฉากในภาพเดียวกันบ่อยๆ จะทำให้ผีเสื้อหาย กินแมว หรือเปลี่ยนสีแมวได้ง่าย การแยกตัวแบบก่อนแล้วค่อยเปลี่ยนพื้นหลังมีอัตราความสำเร็จสูงกว่ามาก

数字生命卡兹克 - inline image

หลายคนถามว่าทำไมเราไม่ใช้การอ้างอิงหลายภาพสำหรับวิดีโอ

เกี่ยวกับผลิตภัณฑ์วิดีโอที่อ้างอิงหลายภาพ เราเกือบลองทุกอย่างในตลาดขณะทำหนังสั้นสองเรื่องนี้ ปัญหาความคมชัดรักษาได้ยาก องค์ประกอบต่างๆ เบลอแม้ขยับเพียงเล็กน้อย

แม้จะมีฟังก์ชันอ้างอิงหลายภาพใหม่ที่เพิ่งเปิดตัวบน Flow เราลองแล้ว ก็ยากที่จะรับประกันว่านิทรรศการที่เราต้องการจะไม่เปลี่ยนแปลง เรามีตัวแบบที่ต้องคงที่มากเกินไป รวมถึงนิทรรศการหลายชิ้น แมว และผีเสื้อ ดังนั้นสุดท้ายแล้ว วิธี first-and-last-frame ก็เสถียรกว่า

เพื่อนๆ หลายคนถามอีกว่า ยังต้องใช้ PS อยู่ไหม?

ผมคิดว่า PS ยังมีประโยชน์ แต่เราเปิดมันน้อยลงเรื่อยๆ ผมขอแนะนำฟีเจอร์ที่น้อยคนใช้มาก ชื่อว่า "Harmonize"

คุณวาง PNG หรือภาพลงบนเฟรมนิ่ง คลิก harmonize มันจะจับคู่แสงในสภาพแวดล้อมโดยอัตโนมัติ ทำให้ภาพประกอบกลมกลืนขึ้น ตัวอย่างเช่น ในช็อตที่มีจานลอย ผมคลิก harmonize ความแตกต่างของแสงก่อนและหลังชัดเจนมาก ประสิทธิภาพสูง

ในขณะเดียวกัน Banana Pro ก็ทรงพลังพอที่หลายสิ่งสามารถทำได้โดยตรง ตัวอย่างเช่น ในหนังสั้นแมวส้ม มีช็อตที่ผมใช้ Vidu สร้างตัวอย่างก่อน ความคมชัดไม่เพียงพอ และนิทรรศการไม่คงที่ แต่ความสัมพันธ์ระหว่างการเคลื่อนไหวของแมวกับนิทรรศการนั้นถูกต้อง

ดังนั้นผมจึงโยนทั้งตัวอย่างและ素材นิทรรศการเข้า Banana Pro ให้มันคงองค์ประกอบไว้และเปลี่ยนนิทรรศการลอยด้วยที่ผมให้ เพื่อให้มันปรากฏซ้ำๆ และกระจายตัว ผลลัพธ์คือภาพที่非常好的ในเวอร์ชันแรก และมันยังเพิ่มความชัดลึกพื้นหน้า/พื้นหลังและ motion blur โดยอัตโนมัติ ซึ่งโดยพื้นฐานแล้วตรงตามความต้องการในการผลิต

数字生命卡兹克 - inline image

VI. แอนิเมชัน

เครื่องมือวิดีโอหลักของเราคือ Flow โมเดลวิดีโอที่เราใช้บ่อยคือ VEO 3.1

Flow เพิ่งเปิดตัวฟังก์ชัน 4K ซึ่งช่วยเรื่องคุณภาพของภาพ สำหรับโมเดลวิดีโอเสริม เรายังใช้ Kling, Hailuo, Jimeng, Wanxiang, Luma ฯลฯ แต่ Flow ใช้งานสะดวกกว่า และภาพมีอารมณ์แบบภาพยนตร์มากกว่า

เรารู้สึกว่าเราเข้าสู่ยุคที่สามารถ "ตัดต่อวิดีโอ" ได้แล้ว เครื่องมือวิดีโอหลายตัวสามารถตัดต่อวิดีโอได้โดยตรง มีฟังก์ชันซ่อนใน Flow จุดเข้าใช้งานค่อนข้างลึก มีปุ่ม "edit" ทางซ้ายบนของวิดีโอที่สร้าง เมื่อเข้าไปแล้ว คุณสามารถเพิ่มสิ่งต่างๆ ลงในวิดีโอ ตัดสิ่งต่างๆ ออก หรือแม้แต่เปลี่ยนตำแหน่งและการเคลื่อนที่ของกล้อง มันค่อนข้างทดลอง แต่บางครั้งก็มีประโยชน์

ข้อจำกัดของมันก็ชัดเจน เช่น สามารถเพิ่มและตัดได้ แต่ยากที่จะทำ "edit and replace" เช่น เปลี่ยนแมวดำเป็นแมวขาว เพื่อให้ได้สิ่งนี้ คุณต้องเอาออกก่อนแล้วจึงใส่เข้าไป ซึ่งรู้สึกเทอะทะมาก

ใน Flow เรายังใช้ฟีเจอร์ doodle บ่อยมาก ข้อความเพียงอย่างเดียวนั้นยากที่จะให้แมวทำการกระทำบางอย่าง เช่น ให้แมวกระโดดข้ามโดยตรง เราไม่สามารถทำได้แม้จะลองหลายครั้ง

数字生命卡兹克 - inline image

แต่การวาด doodle บนเฟรมแรกเพื่อให้คำแนะนำการเคลื่อนไหว เช่น ผีเสื้อควรบินไปทางไหนและแมวตามไป แล้วเพิ่มพรอมต์ "ทำตามคำแนะนำในคำอธิบายประกอบแล้วลบคำอธิบายประกอบของฉัน" โมเดลจะสร้างตามกฎการเคลื่อนไหวที่คุณอธิบายไว้ และแมวจะเดินออกจากเฟรมได้อย่างราบรื่น

และ Luma's Ray3 ก็มีประโยชน์อย่างไม่คาดคิด เราทดสอบตอนคริสต์มาส อัปโหลดตัวอย่างที่หยาบมากและเพิ่มพรอมต์ มันสร้างได้สวยงามมาก มีความคมชัดสูง แม้กระทั่งสร้างสิ่งที่มีในวิดีโอต้นฉบับจากความว่างเปล่า

ข้อเสียคือสร้างช้า แต่ข้อดีคือคุณภาพการประกอบสูง เหมาะสำหรับการผลิต

ฟีเจอร์สร้างตัวละครใหม่ของ Wan 2.6 ก็ควรสังเกต ตัวละครมนุษย์ยังคงมีแนวโน้มจะหลุดจากคาแรกเตอร์ แต่ตัวละครสัตว์น่าตื่นเต้นกว่ามนุษย์มาก ผมอัปโหลดวิดีโอแมว Nika ของผมที่เบลอและมืดมากแบบไม่ตั้งใจ หลังจากสร้างตัวละครแล้ว ก็สามารถใช้ @ เรียกมันใน Wan 2.6 ได้ คุณภาพการสร้างอยู่ในระดับ "ผู้เชี่ยวชาญยอมรับ" และคมชัดมาก เราให้มันทำหลายสิ่ง เช่น ไดโนเสาร์มาช่วยมัน ฟีเจอร์นี้เปิดตัวหลังจากหนังสั้นสองเรื่องของเราโพสต์ไปแล้ว ซึ่งเป็นจังหวะที่ไม่ค่อยดีนัก

เคล็ดลับเล็กๆ อีกข้อ: เมื่อทำ micro-animations สำหรับ end screen คุณสามารถเลือก "โมเดลที่แย่กว่าเล็กน้อย" นั่นคือโมเดลรุ่นก่อน รุ่นก่อนมักมีขนาดการเคลื่อนไหวที่เล็กกว่า ซึ่งบางครั้งก็พอดีสำหรับ end screen ตัวอย่างเช่น สำหรับ end screen เราต้องการให้สภาพแวดล้อมขยับเล็กน้อย แต่ Flow อาจเพิ่มลวดลายในจินตนาการมากมายและขยับมากเกินไป

การใช้โมเดลรุ่นก่อนกลับขยับได้พอดี ครั้งนี้ผมใช้ Jimeng 3.0 และขนาดการเคลื่อนไหวระดับไมโครนั้นเหมาะสมมาก

VII. แบบร่างที่ถูกทิ้ง

มีแบบร่างที่ถูกทิ้งหลายครั้งในครั้งนี้ โดยเฉพาะสำหรับแมวส้ม เพราะหลังจาก Pro ออกมา การนำไอเดียบางอย่างไปใช้ทำได้เร็ว และปริมาณการสำรวจก็มากขึ้น นี่คือสองสามอันที่เราชอบมากแต่ต้องลบออกอย่างเจ็บปวด

อันหนึ่งคือ "ผีเสื้อพันพาย" ที่ผู้ชมเซี่ยงไฮ้ชอบถามถึง ผีเสื้อพันพายของเซี่ยงไฮ้มีชื่อเสียงมาก และเราทำผีเสื้อพันพายยักษ์ขึ้นมาจริงๆ และชอบภาพมาก แต่ใน AI เมื่อผีเสื้อพันพายขยับ มันจะกลายเป็นผีเสื้อจริงและไม่บินอีกเลย เราจึงต้องยกเลิก

อีกอันเป็นจุดเช็คอินยอดนิยมที่พิพิธภัณฑ์ศิลปะผู่ตง ซึ่งคุณสามารถถ่ายรูปกับหอไข่มุกตะวันออก เราทำช็อตที่ผีเสื้อเอาปีกครึ่งหนึ่งยื่นเข้ามาจากนอกหน้าต่าง และอีกครึ่งของปีกประกอบผ่านเงาของแสงแดด เกิดเป็นผีเสื้อทั้งตัว ภาพสวยงาม แต่เมื่อขยับ ผีเสื้อก็ยังไม่บิน จึงถูกลบ

อีกอันเป็นช็อตของหอศิลป์อิสลามพิพิธภัณฑ์ลูฟร์ ตอนแรกเราอยากให้มันอลังการยิ่งขึ้น แม้กระทั่งมีไดนามิกระดับสึนามิ แต่ต่อมารู้สึกว่ามันเพ้อฝันเกินไป และไม่เข้ากับความรู้สึก "เรียบๆ แต่แฟนตาซี" ที่เราต้องการ จึงถูกลบเช่นกัน

数字生命卡兹克 - inline image

สุดท้าย

สุดท้าย จุดหลักที่เราต้องการสื่อคือ:

ยิ่งโมเดลสะดวกเท่าไหร่ คุณยิ่งควรผลักดันตัวเองให้ทำได้ดีขึ้นเท่านั้น

ตอนนี้โมเดลต่างๆ สะดวกขึ้นเรื่อยๆ ผู้สร้างหลายคนมักใช้ agent เพื่อส่งออกชุดโซลูชันสตอรีบอร์ดทั้งหมดโดยตรง หรือให้มันทำงานสร้างสรรค์มากขึ้น แต่สิ่งที่เราอยากบอกคือ ความสะดวกของโมเดลไม่ควรเป็นข้ออ้างสำหรับความเกียจคร้าน

มันเป็นเหมือนการเตือนมากกว่า: คุณมีความสามารถมากขึ้นที่จะทำให้งานของคุณดีขึ้น

จบด้วยวลีที่เราพูดบ่อยๆ:

ตราบใดที่คุณลงมือทำ คุณกำลังก้าวไปข้างหน้า

ขอบคุณทุกคน การแบ่งปันของเราในวันนี้สิ้นสุดเพียงเท่านี้

ถ้าคุณพบว่ามีประโยชน์ สามารถส่งต่อให้เพื่อนของคุณดูได้ มันช่วยเราได้มากเลย!

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind
สำหรับครีเอเตอร์

เปลี่ยน Markdown ของคุณให้เป็นบทความ 𝕏 ที่สะอาดตา

เวลาคุณเผยแพร่งานเขียนยาวของตัวเอง การจัดรูปแบบรูปภาพ ตาราง และบล็อกโค้ดให้เข้ากับ 𝕏 นั้นน่าปวดหัว YouMind เปลี่ยนร่าง Markdown ทั้งฉบับให้เป็นบทความ 𝕏 ที่สะอาดตาและพร้อมโพสต์ทันที

ลอง Markdown เป็น 𝕏

แพตเทิร์นให้ถอดรหัสเพิ่มเติม

บทความไวรัลล่าสุด

สำรวจบทความไวรัลเพิ่มเติม