Công cụ tạo video đề xuất sách tự động của Xiaohongshu

madeBy
Yyyu624
installedBy
1
fromYouMind

Hướng dẫn

---

tên: book-video-pipeline

Mô tả: "Tự động tạo video giới thiệu sách Xiaohongshu v3 - Seedance 2.0: Âm thanh gốc + Phụ đề, hoàn toàn tự động từ khâu chọn sách đến xuất bản"

Giấy phép: MIT

gọi: "/book-video

---

# Xiaohongshu Video giới thiệu sách - Tự động tạo pipeline v3

book-video-pipeline

## Tổng quan

Một quy trình hoàn toàn tự động để tạo video giới thiệu sách cho Xiaohongshu dựa trên API Seedance 2.0 của Volcano Ark.

**Những cải tiến trong phiên bản v3 (dựa trên hướng dẫn từ khóa chính thức):**

- **Âm thanh gốc** — Chỉ định trực tiếp người thuyết minh trong lời nhắc, và Seedance sẽ tự động tạo giọng nói (không còn sử dụng edge-tts).

- **Phụ đề gốc** — Chỉ định nội dung phụ đề trong lời nhắc, và Seedance sẽ tạo phụ đề được đồng bộ hóa trong video.

- **Thẻ tiêu đề bìa** — Hiệu ứng lia/thu phóng + bản nhạc nền im lặng, đảm bảo khả năng ghép nối.

- **Tạo chuỗi** — Mỗi phân đoạn sử dụng khung hình cuối cùng của phân đoạn trước đó làm hình ảnh bắt đầu, tạo ra luồng hình ảnh liền mạch hơn.

- **Ghép nối hiệu ứng chuyển tiếp mượt mà** — Hiệu ứng chuyển tiếp video mượt dần + hiệu ứng chuyển tiếp âm thanh mượt dần, tạo sự chuyển tiếp âm thanh-hình ảnh đồng bộ.

**Quy trình cốt lõi:** Chọn sách → Chi tiết/Bìa → Kịch bản → Bảng phân cảnh → Tạo video (bao gồm âm thanh và phụ đề) → Ghép nối → Xem trước → Xuất bản

---

## Giao thức thực thi im lặng

Không cần yêu cầu xác nhận để tiếp tục.

Tạo toàn bộ kết quả đầu ra cùng một lúc.

Nếu thiếu dữ liệu, hãy sử dụng các giá trị mặc định đã được định sẵn.

- Tuyệt đối không sử dụng các câu ngắt lời như "Bạn có muốn tiếp tục không?", "Bạn có cần tôi giúp đỡ không?", hoặc "Vui lòng xác nhận".

---

## Yêu cầu về môi trường

| Các yêu cầu phụ thuộc | Cài đặt |

|------|------|

| Khóa API Volcano Ark | Biến môi trường `VOLCENGINE_API_KEY` |

| imageio-ffmpeg | `pip install imageio-ffmpeg` (đã bao gồm ffmpeg) |

| Docker (xiaohongshu-mcp) | Yêu cầu triển khai trên `localhost:18060` |

---

## Quy trình thực thi

**Phương thức kích hoạt: `/book-video` hoặc `/book-video 《tên sách》`**

Bước 1: Chọn sách

**Tình huống A - Người dùng đã chỉ định tiêu đề sách:** Sử dụng trực tiếp tiêu đề đó.

**Kịch bản B - Không chỉ định tiêu đề sách:** Chạy tập lệnh tìm kiếm (ưu tiên các sách bán chạy nhất có số lượng ít):

đập

python "D:\skills\xiaohongshu-book-publisher\scripts\search_hot_books_v2.py"

```

Tự động chọn Top 1 từ danh mục "Sách bán chạy nhất ít bột" (không bao gồm "[Đã xuất bản]").

**Xử lý lỗi:** Hết thời gian chờ của tập lệnh → Bộ nhớ đệm → Tìm kiếm trên web → Mặc định (Sự can đảm để bị ghét bỏ)

---

Bước 2: Lấy thông tin chi tiết về sách và bìa sách

**2.1 Lấy thông tin chi tiết từ Douban**

```

WebFetch: https://search.douban.com/book/subject_search?search_text={book title}

Trích đoạn: Tên sách, tác giả, xếp hạng Douban, tóm tắt nội dung, trích dẫn/quan điểm chính, URL bìa sách

```

**2.2 Tải xuống ảnh bìa (tên tệp tiếng Anh!)**

đập

curl -o "D:\xiaohongshu_data\cover_{english_name}.jpg" -H "Referer: https://book.douban.com/" "Cover URL"

```

Nếu lệnh curl không thành công, hãy sử dụng:

đập

python "D:\skills\xiaohongshu-book-publisher\scripts\get_cover_playwright.py" "{tên sách}"

```

---

Bước 3: Tạo kịch bản và bảng phân cảnh cho đề xuất sách

Hãy tạo kịch bản video hội thoại dựa trên nội dung cuốn sách.

**Công thức Callergy (dựa trên Hướng dẫn chính thức Seedance 2.0):**

Mỗi gợi ý kịch bản phân cảnh bao gồm ba phần:

1. **Lệnh âm thanh** — Tạo video có thuyết minh. Một lệnh `{voice_type}` sẽ nói: "văn bản tường thuật".

2. **Mô tả hình ảnh** — `Chủ thể + Hành động + Môi trường + Chuyển động máy quay + Bầu không khí`

3. **Hướng dẫn phụ đề** — Phụ đề sẽ hiển thị ở cuối màn hình. Phụ đề là "văn bản tường thuật" và phải được đồng bộ hoàn hảo với nhịp điệu âm thanh.

**Mẫu kịch bản (6-7 cảnh, ~35 giây):**

```markdown

## Kịch bản video giới thiệu sách

**Tên sách**: 《{Tên sách}》

**Phong cách:** Chữa lành (Tông màu vàng ấm áp)

### Cảnh 1 - Mở đầu gây hồi hộp (5 giây)

**Lời dẫn truyện:** {Một câu mở đầu thu hút sự chú ý}

**Mô tả hình ảnh:** {50-80 từ tiếng Anh: Chủ thể + Hành động + Môi trường + Góc quay + Bầu không khí}

### Cảnh 2 - Sách xuất hiện (5 giây)

Người dẫn chuyện: {Lời giới thiệu ngắn gọn về cuốn sách này}

**Hình ảnh:** {Bằng tiếng Anh, một cảnh liên quan đến sách}

### Kịch bản phân cảnh 3 - Tác giả/Bối cảnh (5 giây)

**Lời dẫn truyện:** {Thông tin cá nhân hoặc câu chuyện sáng tạo của tác giả}

**Bối cảnh**: {Tiếng Anh, viết luận, học tập, v.v.}

### Kịch bản phân cảnh 4 - Góc nhìn cốt lõi 1 (5 giây)

**Lời dẫn truyện:** {Một góc nhìn cảm động hoặc một câu nói đáng nhớ}

**Hình ảnh:** {Trong tiếng Anh, các phép ẩn dụ trực quan phù hợp với quan điểm}

### Cảnh 5 - Góc nhìn cốt lõi 2 (5 giây)

**Lời dẫn:** {Một quan điểm thuyết phục khác hoặc một câu nói đáng nhớ}

**Hình ảnh:** {Trong tiếng Anh, các phép ẩn dụ trực quan phù hợp với quan điểm}

### Kịch bản hình ảnh 6 - Suy ngẫm cá nhân (5 giây)

Người dẫn chuyện: {Cảm xúc thật của tôi, những thay đổi tôi trải qua sau khi đọc cuốn sách này}

**Hình ảnh:** {Tiếng Anh, cảnh cảm động}

### Cảnh 7 - Kêu gọi hành động (5 giây)

Người dẫn chuyện: {Lời kêu gọi hành động}

**Hình ảnh:** {Tiếng Anh, một cảnh kết thúc cảm động}

```

**Quy tắc mô tả màn hình:**

- **Phải bằng tiếng Anh**, 50-80 từ

- Theo công thức: Chủ thể + Hành động đang được thực hiện + Môi trường xung quanh + Ánh sáng/Không khí + Chuyển động của máy quay?

- **Không đề cập đến hình ảnh bìa/tiêu đề sách** (văn bản được tạo từ phụ đề)

- Mô tả các tình huống cụ thể nhất có thể và tránh các khái niệm trừu tượng.

**Các loại âm thanh tùy chọn:**

- Liệu pháp chữa lành: Giọng nữ nhẹ nhàng và êm dịu

- Thể loại: Giật gân/Bí ẩn: Giọng nam trầm ấm

- Phong cách tươi mới và trong trẻo: Giọng nữ nhẹ nhàng và sống động.

---

Bước 4: Sử dụng quy trình để tạo video.

**4.1 Lưu trữ JSON của Storyboard**

json

[

{"scene_id": 1, "prompt": "Mô tả hình ảnh bằng tiếng Anh...", "narration": "Lời dẫn truyện bằng tiếng Trung"},

{"scene_id": 2, "prompt": "Mô tả hình ảnh bằng tiếng Anh...", "narration": "Lời dẫn truyện bằng tiếng Trung"},

...

]

```

Lưu vào `D:\xiaohongshu_data\storyboard_{english_name}.json`.

**4.2 Gọi toàn bộ quy trình v3**

Python

nhập sys, json

sys.path.insert(0, r"D:\skills\book-video-pipeline\scripts")

from seedance_client import SeedanceClient

client = SeedanceClient(api_key="YOUR_API_KEY")

với mở(r"D:\xiaohongshu_data\storyboard_xxx.json", encoding="utf-8") as f:

storyboard = json.load(f)

kết quả = máy khách.tạo_video_đầy_đủ(

bảng phân cảnh = bảng phân cảnh,

cover_path=r"D:\xiaohongshu_data\cover_xxx.jpg",

book_title="Tên sách",

output_dir=r"D:\xiaohongshu_data",

voice_type="giọng nữ nhẹ nhàng và điềm tĩnh",

with_subtitles=True,

)

print(f"Video: {result['video_path']} ({result['size_kb']}KB, ~{result['duration']}s, audio: {result['has_audio']})")

```

**Quy trình v3 tự động thực thi:**

1. Ảnh bìa → Thẻ tiêu đề (quay/thu phóng 3 giây + tắt tiếng)

2. Tạo các đoạn video theo trình tự (mỗi đoạn video bao gồm âm thanh gốc và phụ đề).

3. Ghép nối hiệu ứng chuyển cảnh mượt mà (video chuyển cảnh mượt mà + âm thanh chuyển cảnh mượt mà)

4. Xuất video cuối cùng.

**Cấu hình khóa API:**

đập

đặt VOLCENGINE_API_KEY=ark-xxx

```

---

### Bước 5: Xem trước

Tạo trang xem trước HTML `D:\preview_video_{name}_{date}.html`, chứa nội dung sau:

- Trình phát video

- Tên sách, tác giả, xếp hạng

- Phiên bản văn bản tường thuật

- Phong cách chủ đề màu hồng trên Xiaohongshu

đập

Bắt đầu "" "D:\preview_video_xxx.html"

```

**Vui lòng xác nhận lại với người dùng.** Nếu không hài lòng, vui lòng:

- Điều chỉnh lời nhắc bảng phân cảnh → Tạo lại

- Thay đổi loại âm thanh → Tái tạo

- Điều chỉnh mô tả trực quan → Chỉ thay đổi lời nhắc

---

Bước 6: Đăng lên Xiaohongshu

**6.1 Kiểm tra trạng thái đăng nhập** → MCP `check_login_status`

**6.2 Tạo văn bản ghi chú video** (Không phải kịch bản video!)

- Tiêu đề ≤ 20 ký tự, góc nhìn người thứ nhất, có cảm xúc

- Văn bản chính khoảng 200-300 từ, kèm theo hơn 20 biểu tượng cảm xúc.

- 10-15 thẻ có dấu #

**MCP đã phát hành phiên bản 6.3**

Python

MCP_URL = 'http://localhost:18060'

# Khởi tạo → publish_content(title, content, video, tags)

# Đường dẫn video sử dụng đường dẫn của container: /app/data/xxx.mp4

```

**6.4 Bản ghi đã được xuất bản** → Thêm `"type": "video"` vào `published_books.json`

---

## Định dạng đầu ra

```markdown

## Video giới thiệu sách được tạo thành công

**Tên sách**: 《{Tên sách}》

**Tác giả**: {Author} | **Douban**: {Rating}

### Thông tin video

- Thời lượng: ~{N} giây (thẻ tiêu đề 3 giây + {M} cảnh x 5 giây)

- Tỷ lệ khung hình: 9:16 (Dọc)

- Độ phân giải: 720p

- Kích thước tệp: {N} MB

- Âm thanh: Có/Không

- Phụ đề: Tích hợp/Không có

- Đường dẫn: `D:\xiaohongshu_data\{name}_final.mp4`

### Thông cáo báo chí

- Tiêu đề: {title}

- Thẻ: {tags}

- Trạng thái: {Thành công/Thất bại}

```

---

## Các quy tắc chính

1. **Ưu tiên âm thanh gốc** — Seedance 2.0 hỗ trợ tạo âm thanh gốc; chỉ cần chỉ định phần tường thuật trong lời nhắc.

2. **Phụ đề gốc** — Chỉ định nội dung phụ đề trong lời nhắc, và Seedance sẽ tự động tạo phụ đề được đồng bộ hóa.

3. **Tiếp nối khung hình cuối cùng** — Mỗi phân đoạn sử dụng khung hình cuối cùng của phân đoạn trước đó làm hình ảnh bắt đầu, tạo ra một luồng hình ảnh liền mạch hơn.

4. **Các cảnh trong bảng phân cảnh nên được thực hiện bằng tiếng Anh** — Seedance sử dụng các cảnh quay bằng tiếng Anh để có chất lượng hình ảnh tốt hơn.

5. **Loại âm thanh thống nhất** — Toàn bộ phim sử dụng cùng một loại âm thanh.

6. **Tỷ lệ khung hình video 9:16** — Màn hình dọc Xiaohongshu

7. **Cần có xác nhận của người dùng trước khi đăng tải** — Vui lòng chờ quá trình xem trước hoàn tất trước khi đăng tải.

8. **Tên tệp hình ảnh phải bằng tiếng Anh** — Ký tự tiếng Trung sẽ gây ra lỗi tải lên không thành công.

9. **Kịch bản video ≠ Ghi chú bằng văn bản và hình ảnh** — Kịch bản được viết bằng ngôn ngữ giao tiếp thông thường, không phải dạng bài viết.

10. **Bảo toàn âm thanh** — chuyển tiếp video xfade + chuyển tiếp âm thanh acrossfade

## Tham khảo từ khóa gợi ý (Hướng dẫn Seedance 2.0)

### Mẫu lệnh âm thanh

```

Tạo video có lồng tiếng. Tùy chọn `{voice_type}` có nội dung: "{nội dung tường thuật}".

```

### Mẫu hướng dẫn phụ đề

```

Phụ đề sẽ xuất hiện ở cuối màn hình, với nội dung "{nội dung phụ đề}". Phụ đề phải được đồng bộ hoàn hảo với nhịp điệu âm thanh.

```

### Ví dụ về các gợi ý cảnh hoàn chỉnh

```

Tạo một video có lồng tiếng. Một giọng nữ nhẹ nhàng, điềm tĩnh nói: "Bạn đã bao giờ nghĩ về lý do tại sao chúng ta luôn sống theo kỳ vọng của người khác chưa?" Một bóng người đơn độc đứng ở ngã tư đường trên con đường mòn trong rừng mờ sương, ánh nắng len lỏi qua những tán cây cao, ánh sáng hoàng hôn ấm áp, máy quay lia chậm, độ sâu trường ảnh nông. Phụ đề xuất hiện ở cuối màn hình, với nội dung: "Bạn đã bao giờ nghĩ về lý do tại sao chúng ta luôn sống theo kỳ vọng của người khác chưa?" Phụ đề phải được đồng bộ hoàn hảo với âm thanh.

```

## Tham chiếu tệp

| Tệp | Mục đích |

|------|------|

| `D:\skills\book-video-pipeline\scripts\seedance_client.py` | API Seedance + Âm thanh/Phụ đề gốc + Ghép nối (v3) |

| `D:\skills\xiaohongshu-book-publisher\scripts\search_hot_books_v2.py` | Tìm kiếm sách phổ biến |

| `D:\skills\xiaohongshu-book-publisher\scripts\published_books.json` | Bản ghi đã xuất bản |

| `D:\skills\xiaohongshu-book-publisher\scripts\get_cover_playwright.py` | Truy xuất ảnh bìa (sao lưu) |

| `D:\xiaohongshu_data\` | Thư mục lưu trữ video và ảnh bìa |

## Cấu hình API

| Tham số | Giá trị |

|------|-----|

| Mô Hình Video | `doubao-seedance-2-0-fast-260128` |

| Loại giọng nói | Giọng nữ nhẹ nhàng và êm dịu (mặc định) |

| Tỷ lệ | 9:16 |

| Độ dài đoạn | 5 giây |

| Tiêu đề | Quay lia/thu phóng 3 giây + Tắt tiếng |

| Hiệu ứng chuyển tiếp mượt mà | Chuyển cảnh 0,5 giây (video + âm thanh) |

SKILL.md
YOUMIND_MARKET.md

description

Đây là công cụ hoàn toàn tự động tạo video giới thiệu sách trên Xiaohongshu (Sách Đỏ Nhỏ) dựa trên API Seedance 2.0 của Volcano Ark. Từ khâu chọn sách đến xuất bản, tất cả đều được thực hiện chỉ với một lệnh duy nhất. **Điểm nổi bật**: - **Âm thanh và phụ đề gốc** - Seedance 2.0 trực tiếp tạo lồng tiếng và phụ đề đồng bộ, loại bỏ nhu cầu chỉnh sửa hậu kỳ. - **Lựa chọn sách thông minh** - Tự động xác định các cuốn sách phổ biến nhưng ít tương tác trên Xiaohongshu, xác định chính xác các yếu tố thu hút lưu lượng truy cập. - **Kịch bản chuyên nghiệp** - 6-7 kịch bản được thiết kế tỉ mỉ, bao gồm phần mở đầu gây hồi hộp, quan điểm cốt lõi và sự cộng hưởng cảm xúc. - **Tạo chuỗi** - Mỗi phân đoạn video bắt đầu bằng khung hình cuối cùng của phân đoạn trước đó, đảm bảo sự liền mạch và tự nhiên. - **Xuất bản chỉ với một cú nhấp chuột** - Tự động tạo tiêu đề, thẻ và hashtag, cho phép xuất bản trực tiếp lên Xiaohongshu. **Các trường hợp phù hợp**: - Cập nhật video hàng ngày từ các blogger sách - Sản xuất nội dung kiến ​​thức trả phí

Find your next favorite skill

Explore more curated AI skills for research, creation, and everyday work.

Explore all skills
Công cụ tạo video đề xuất sách tự động của Xiaohongshu - Kỹ năng YouMind