Xiaohongshu पुस्तक अनुशंसा वीडियो स्वतः जनरेटर
निर्देश
---
नाम: बुक-वीडियो-पाइपलाइन
विवरण: "ज़ियाओहोंगशु पुस्तक अनुशंसा वीडियो स्वतः निर्माण v3 - सीडेंस 2.0: मूल ऑडियो + उपशीर्षक, पुस्तक चयन से प्रकाशन तक पूर्णतः स्वचालित"
लाइसेंस: एमआईटी
आह्वान: "/पुस्तक-वीडियो
---
# Xiaohongshu पुस्तक अनुशंसा वीडियो स्वचालित पाइपलाइन निर्माण v3
## अवलोकन
वोल्केनो आर्क के सीडेंस 2.0 एपीआई पर आधारित ज़ियाओहोंग्शु के लिए पुस्तक अनुशंसा वीडियो तैयार करने की एक पूरी तरह से स्वचालित प्रक्रिया।
**v3 में सुधार (आधिकारिक प्रॉम्प्ट शब्द मार्गदर्शिका के आधार पर):**
- **नेटिव ऑडियो** — प्रॉम्प्ट में सीधे कथन निर्दिष्ट करें, और सीडेंस स्वचालित रूप से आवाज उत्पन्न करेगा (अब एज-टीटीएस का उपयोग नहीं किया जा रहा है)।
- **नेटिव सबटाइटल्स** — प्रॉम्प्ट में सबटाइटल की सामग्री निर्दिष्ट करें, और सीडेंस वीडियो के भीतर सिंक्रोनाइज़्ड सबटाइटल्स उत्पन्न करेगा।
- **कवर टाइटल कार्ड** — पैन/ज़ूम प्रभाव + साइलेंट ऑडियो ट्रैक, जिससे एडिटिंग की अनुकूलता सुनिश्चित होती है।
- **श्रृंखला निर्माण** — प्रत्येक खंड पिछले खंड के अंतिम फ्रेम को प्रारंभिक छवि के रूप में उपयोग करता है, जिसके परिणामस्वरूप अधिक सुसंगत दृश्य प्रवाह होता है।
- **क्रॉसफ़ेड स्प्लिसिंग** — सिंक्रनाइज़्ड ऑडियो-विज़ुअल ट्रांज़िशन के लिए वीडियो क्रॉसफ़ेड + ऑडियो अक्रॉसफ़ेड।
**मुख्य प्रक्रिया:** पुस्तक चयन → विवरण/कवर → पटकथा → स्टोरीबोर्ड → वीडियो निर्माण (ऑडियो और उपशीर्षक सहित) → संयोजन → पूर्वावलोकन → प्रकाशन
---
## मौन निष्पादन प्रोटोकॉल
आगे बढ़ने के लिए पुष्टि न मांगें।
एक ही बार में पूरा आउटपुट जेनरेट करें।
यदि डेटा अनुपलब्ध है, तो निर्धारित डिफ़ॉल्ट मानों का उपयोग करें।
- कभी भी "क्या आप जारी रखना चाहते हैं?", "क्या आपको मेरी मदद चाहिए?", या "कृपया पुष्टि करें" जैसे व्यवधानकारी वाक्यों का प्रयोग न करें।
---
## पर्यावरण आवश्यकताएं
| निर्भरताएँ | स्थापना |
|------|------|
| वोल्केनो आर्क एपीआई कुंजी | पर्यावरण चर `VOLCENGINE_API_KEY` |
| imageio-ffmpeg | `pip install imageio-ffmpeg` (ffmpeg के साथ आता है) |
| डॉकर (xiaohongshu-mcp) | `localhost:18060` पर परिनियोजन आवश्यक है |
---
## निष्पादन प्रक्रिया
**ट्रिगर विधि: `/book-video` या `/book-video 《पुस्तक का शीर्षक》`**
चरण 1: पुस्तकों का चयन
**परिदृश्य ए - उपयोगकर्ता ने पुस्तक का शीर्षक निर्दिष्ट किया:** इसका सीधे उपयोग करें।
**परिदृश्य बी - पुस्तक का शीर्षक निर्दिष्ट नहीं है:** खोज स्क्रिप्ट चलाएँ (कम बिकने वाली बेस्टसेलर पुस्तकों को प्राथमिकता देते हुए):
दे घुमा के
python "D:\skills\xiaohongshu-book-publisher\scripts\search_hot_books_v2.py"
```
"लो-पाउडर बेस्टसेलर" श्रेणी से स्वचालित रूप से शीर्ष 1 का चयन करें ("[प्रकाशित]" को छोड़कर)।
**त्रुटि प्रबंधन:** स्क्रिप्ट टाइमआउट → कैश → वेब सर्च → डिफ़ॉल्ट (नापसंद किए जाने का साहस)
---
चरण 2: पुस्तक का विवरण और कवर प्राप्त करें
**2.1 डौबन से विवरण प्राप्त करें**
```
वेबफेच: https://search.douban.com/book/subject_search?search_text={पुस्तक का शीर्षक}
संक्षिप्त विवरण: पुस्तक का शीर्षक, लेखक, डौबन रेटिंग, सारांश, प्रमुख उद्धरण/मुख्य दृष्टिकोण, कवर यूआरएल
```
**2.2 कवर डाउनलोड करें (अंग्रेजी फ़ाइल नाम!)**
दे घुमा के
curl -o "D:\xiaohongshu_data\cover_{english_name}.jpg" -H "Referer: https://book.douban.com/" "Cover URL"
```
यदि कर्ल विफल हो जाता है, तो निम्न का उपयोग करें:
दे घुमा के
python "D:\skills\xiaohongshu-book-publisher\scripts\get_cover_playwright.py" "{पुस्तक का शीर्षक}"
```
---
चरण 3: पुस्तक अनुशंसा स्क्रिप्ट और स्टोरीबोर्ड तैयार करें
पुस्तक में दी गई जानकारी के आधार पर एक संवादात्मक वीडियो स्क्रिप्ट तैयार करें।
**कॉलर्जी फॉर्मूला (सीडेंस 2.0 आधिकारिक गाइड पर आधारित):**
प्रत्येक स्टोरीबोर्ड प्रॉम्प्ट में तीन भाग होते हैं:
1. **ऑडियो कमांड** — वॉइस-ओवर के साथ वीडियो बनाता है। `{voice_type}` का मतलब होगा: "नैरेटिव टेक्स्ट"।
2. **दृश्य विवरण** — `विषय + क्रिया + परिवेश + कैमरा गति + वातावरण`
3. **उपशीर्षक निर्देश** — उपशीर्षक स्क्रीन के नीचे दिखाई देते हैं। उपशीर्षक "नैरेटिव टेक्स्ट" हैं और इन्हें ऑडियो की लय के साथ पूरी तरह से सिंक्रनाइज़ किया जाना चाहिए।
**पटकथा का प्रारूप (6-7 दृश्य, लगभग 35 सेकंड):**
```मार्कडाउन
## पुस्तक अनुशंसा वीडियो स्क्रिप्ट
**पुस्तक का शीर्षक**: 《{पुस्तक का शीर्षक}》
**शैली:** हीलिंग (वार्म गोल्ड टोन)
### दृश्य 1 - प्रारंभिक सस्पेंस (5 सेकंड)
**वर्णन:** {एक आकर्षक प्रारंभिक पंक्ति}
**दृश्य विवरण:** {50-80 शब्द अंग्रेजी में: विषय + क्रिया + परिवेश + कैमरा शॉट + वातावरण}
### दृश्य 2 - पुस्तकें प्रकट होती हैं (5 सेकंड)
**वर्णनकर्ता:** {इस पुस्तक का संक्षिप्त परिचय}
**दृश्य:** {अंग्रेजी में, पुस्तकों से संबंधित एक दृश्य}
### स्टोरीबोर्ड 3 - लेखक/पृष्ठभूमि (5 सेकंड)
**वर्णन:** {लेखक की पृष्ठभूमि या रचनात्मक कहानी}
**दृश्य**: {अंग्रेजी, लेखन का माहौल, अध्ययन आदि}
### स्टोरीबोर्ड 4 - मुख्य दृष्टिकोण 1 (5 सेकंड)
**वर्णन:** {एक मार्मिक दृष्टिकोण या यादगार उद्धरण}
**दृश्य:** {अंग्रेजी में, दृष्टिकोण से मेल खाने वाले दृश्य रूपक}
### दृश्य 5 - मुख्य दृष्टिकोण 2 (5 सेकंड)
**वर्णन:** {एक और प्रभावशाली दृष्टिकोण या यादगार उद्धरण}
**दृश्य:** {अंग्रेजी में, दृष्टिकोण से मेल खाने वाले दृश्य रूपक}
### स्टोरीबोर्ड 6 - व्यक्तिगत विचार (5 सेकंड)
**वर्णनकर्ता**: {मेरी सच्ची भावनाएँ, इसे पढ़ने के बाद मुझमें आए बदलाव}
**दृश्य:** {अंग्रेजी, भावुक दृश्य}
### दृश्य 7 - कार्रवाई का आह्वान (5 सेकंड)
**वर्णनकर्ता:** {कार्रवाई के लिए आह्वान}
**दृश्य:** {अंग्रेजी, एक दिल को छू लेने वाला अंतिम दृश्य}
```
**स्क्रीन विवरण नियम:**
- **अंग्रेजी में होना अनिवार्य है**, 50-80 शब्द
- इस सूत्र के अनुसार: विषय + की जा रही क्रिया + वह किस वातावरण में है + वह किस प्रकाश/वातावरण में है + कैमरा कैसे चल रहा है?
- **कवर इमेज/पुस्तक के शीर्षक का उल्लेख न करें** (उपशीर्षकों से उत्पन्न पाठ)
- यथासंभव विशिष्ट परिदृश्यों का वर्णन करें और अमूर्त अवधारणाओं से बचें।
**वैकल्पिक ध्वनि प्रकार:**
- उपचार: `कोमल और शांत महिला आवाज`
- सस्पेंस/रहस्य: `गहरी, धीमी पुरुष आवाज`
- ताज़ा और स्वच्छ शैली: एक हल्की और जीवंत महिला आवाज।
---
चरण 4: वीडियो जनरेट करने के लिए पाइपलाइन का उपयोग करें।
**4.1 स्टोरीबोर्ड JSON को सहेजना**
JSON
[
{"scene_id": 1, "prompt": "अंग्रेजी दृश्य विवरण...", "narration": "चीनी वर्णन"},
{"scene_id": 2, "prompt": "अंग्रेजी दृश्य विवरण...", "narration": "चीनी वर्णन"},
...
]
```
इसे `D:\xiaohongshu_data\storyboard_{english_name}.json` में सेव करें।
**4.2 संपूर्ण पाइपलाइन v3 को कॉल करना**
पायथन
import sys, json
sys.path.insert(0, r"D:\skills\book-video-pipeline\scripts")
from seedance_client import SeedanceClient
क्लाइंट = सीडेंसक्लाइंट(एपीआई_की="आपकी_एपीआई_की")
with open(r"D:\xiaohongshu_data\storyboard_xxx.json", encoding="utf-8") as f:
स्टोरीबोर्ड = json.load(f)
परिणाम = क्लाइंट.जनरेट_फुल_वीडियो(
स्टोरीबोर्ड = स्टोरीबोर्ड,
cover_path=r"D:\xiaohongshu_data\cover_xxx.jpg",
पुस्तक का शीर्षक
आउटपुट_डायरेक्ट्री=आर"डी:\xiaohongshu_data",
आवाज का प्रकार="कोमल और शांत महिला आवाज",
with_subtitles=True,
)
print(f"वीडियो: {result['video_path']} ({result['size_kb']}KB, ~{result['duration']}s, ऑडियो: {result['has_audio']})")
```
**पाइपलाइन v3 स्वचालित रूप से निष्पादित होती है:**
1. कवर → टाइटल कार्ड (3 सेकंड का पैन/ज़ूम + ऑडियो ट्रैक म्यूट करें)
2. वीडियो क्लिप को क्रमबद्ध रूप से जेनरेट करें (प्रत्येक क्लिप में मूल ऑडियो और उपशीर्षक शामिल हैं)।
3. क्रॉसफ़ेड स्टिचिंग (वीडियो क्रॉसफ़ेड + ऑडियो क्रॉसफ़ेड)
4. अंतिम वीडियो आउटपुट करें।
**एपीआई कुंजी कॉन्फ़िगरेशन:**
दे घुमा के
VOLCENGINE_API_KEY=ark-xxx सेट करें
```
---
### चरण 5: पूर्वावलोकन
एक HTML पूर्वावलोकन पृष्ठ `D:\preview_video_{name}_{date}.html` बनाएं, जिसमें निम्नलिखित शामिल हों:
- वीडियो प्लेयर
- पुस्तक का शीर्षक, लेखक, रेटिंग
- कथन पाठ संस्करण
- Xiaohongshu पर गुलाबी रंग से प्रेरित स्टाइल
दे घुमा के
प्रारंभ "" "D:\preview_video_xxx.html"
```
कृपया उपयोगकर्ता से पुष्टि करें। यदि आप संतुष्ट नहीं हैं, तो कृपया:
स्टोरीबोर्ड प्रॉम्प्ट को समायोजित करें → पुनः उत्पन्न करें
ध्वनि का प्रकार बदलें → पुनः उत्पन्न करें
- दृश्य विवरण समायोजित करें → केवल प्रॉम्प्ट बदलें
---
चरण 6: Xiaohongshu पर पोस्ट करें
**6.1 लॉगिन स्थिति जांचें** → MCP `check_login_status`
**6.2 वीडियो नोट्स टेक्स्ट जनरेट करें** (वीडियो स्क्रिप्ट नहीं!)
- शीर्षक ≤ 20 अक्षर, प्रथम पुरुष दृष्टिकोण, भावपूर्ण प्रस्तुति
- मुख्य पाठ में 200-300 शब्द, 20 से अधिक इमोजी
- # के साथ 10-15 टैग
**MCP ने 6.3 संस्करण जारी किया**
पायथन
MCP_URL = 'http://localhost:18060'
# आरंभीकरण → publish_content(title, content, video, tags)
# कंटेनर के पथ का उपयोग करके वीडियो पथ: /app/data/xxx.mp4
```
**6.4 रिकॉर्ड प्रकाशित हो चुका है** → `published_books.json` में `"type": "video"` जोड़ें
---
## आउटपुट प्रारूप
```मार्कडाउन
## पुस्तक अनुशंसा वीडियो सफलतापूर्वक तैयार हो गया
**पुस्तक का शीर्षक**: 《{पुस्तक का शीर्षक}》
लेखक: {लेखक} | डौबन: {रेटिंग}
### वीडियो जानकारी
- अवधि: लगभग {N} सेकंड (3 सेकंड का टाइटल कार्ड + {M} दृश्य x 5 सेकंड)
- आस्पेक्ट रेशियो: 9:16 (पोर्ट्रेट)
- रिज़ॉल्यूशन: 720p
- फ़ाइल का आकार: {N} MB
ऑडियो: हां/नहीं
- उपशीर्षक: अंतर्निहित/कोई नहीं
- पथ: `D:\xiaohongshu_data\{name}_final.mp4`
### सूचना जारी करना
शीर्षक: {title}
टैग: {टैग}
- स्थिति: {सफलता/विफलता}
```
---
## मुख्य नियम
1. **नेटिव ऑडियो प्राथमिकता** — सीडेंस 2.0 ऑडियो जनरेशन को मूल रूप से सपोर्ट करता है; बस प्रॉम्प्ट में कथन निर्दिष्ट करें।
2. **नेटिव सबटाइटल्स** — प्रॉम्प्ट में सबटाइटल की सामग्री निर्दिष्ट करें, और सीडेंस स्वचालित रूप से सिंक्रोनाइज़्ड सबटाइटल्स उत्पन्न करेगा।
3. **अंतिम फ्रेम का निरंतरता** — प्रत्येक खंड पिछले खंड के अंतिम फ्रेम को प्रारंभिक छवि के रूप में उपयोग करता है, जिसके परिणामस्वरूप अधिक सुसंगत दृश्य प्रवाह होता है।
4. **स्टोरीबोर्ड शॉट्स अंग्रेजी में होने चाहिए** — सीडेंस बेहतर दृश्य गुणवत्ता के लिए अंग्रेजी शॉट्स का उपयोग करता है।
5. **एकीकृत ध्वनि प्रकार** — पूरी फिल्म में एक ही प्रकार की ध्वनि का प्रयोग किया गया है।
6. **वीडियो आस्पेक्ट रेशियो 9:16** — ज़ियाओहोंग्शु वर्टिकल स्क्रीन
7. **प्रकाशन से पहले उपयोगकर्ता की पुष्टि आवश्यक है** — प्रकाशन से पहले पूर्वावलोकन के पूरा होने की प्रतीक्षा करें।
8. **छवि फ़ाइलनाम अंग्रेज़ी में होने चाहिए** — चीनी अक्षर अपलोड में समय लगने का कारण बनेंगे।
9. **वीडियो स्क्रिप्ट ≠ पाठ और छवि नोट्स** — स्क्रिप्ट बोलचाल की भाषा में लिखी जाती है, लेख के रूप में नहीं।
10. **ऑडियो संरक्षण स्विच करें** — xfade वीडियो ट्रांज़िशन + acrossfade ऑडियो ट्रांज़िशन
## संकेत शब्द संदर्भ (सीडेंस 2.0 गाइड)
### ऑडियो कमांड टेम्पलेट
```
वॉइसओवर के साथ एक वीडियो बनाएं। `{voice_type}` विकल्प में लिखा है: "{narration content}"।
```
### उपशीर्षक निर्देश टेम्पलेट
```
स्क्रीन के निचले भाग में एक उपशीर्षक दिखाई देता है, जिसमें "{उपशीर्षक सामग्री}" लिखा होता है। उपशीर्षक ऑडियो की लय के साथ पूरी तरह से मेल खाना चाहिए।
```
### संपूर्ण दृश्य प्रॉम्प्ट का उदाहरण
```
एक वीडियो बनाएं जिसमें वॉइस ओवर हो। एक सौम्य, शांत महिला की आवाज़ में कहा जाता है, "क्या आपने कभी सोचा है कि हम हमेशा दूसरों की अपेक्षाओं पर क्यों खरे उतरते हैं?" धुंध भरे जंगल के रास्ते पर एक चौराहे पर एक अकेली आकृति खड़ी है, ऊंचे पेड़ों से छनकर आती धूप, सुनहरी रोशनी, धीरे-धीरे ज़ूम इन, शैलो डेप्थ ऑफ़ फील्ड। स्क्रीन के नीचे उपशीर्षक दिखाई देते हैं, "क्या आपने कभी सोचा है कि हम हमेशा दूसरों की अपेक्षाओं पर क्यों खरे उतरते हैं?" उपशीर्षक ऑडियो के साथ पूरी तरह से सिंक्रनाइज़ होने चाहिए।
```
## फ़ाइल संदर्भ
| फ़ाइल | उद्देश्य |
|------|------|
| `D:\skills\book-video-pipeline\scripts\seedance_client.py` | सीडेंस एपीआई + नेटिव ऑडियो/सबटाइटल + संयोजन (v3) |
| `D:\skills\xiaohongshu-book-publisher\scripts\search_hot_books_v2.py` | लोकप्रिय पुस्तक खोज |
| `D:\skills\xiaohongshu-book-publisher\scripts\published_books.json` | प्रकाशित रिकॉर्ड |
| `D:\skills\xiaohongshu-book-publisher\scripts\get_cover_playwright.py` | कवर इमेज पुनर्प्राप्ति (बैकअप) |
| `D:\xiaohongshu_data\` | वीडियो और कवर आउटपुट निर्देशिका |
## एपीआई कॉन्फ़िगरेशन
| पैरामीटर | मान |
|------|-----|
| वीडियो मॉडल | `डौबाओ-सीडांस-2-0-फास्ट-260128` |
| आवाज का प्रकार | सौम्य और शांत महिला आवाज (डिफ़ॉल्ट) |
अनुपात | `9:16` |
| खंड की लंबाई | 5 सेकंड |
| टाइटल कार्ड | 3 सेकंड में पैन/ज़ूम करें + ऑडियो म्यूट करें |
क्रॉसफ़ेड | 0.5 सेकंड का ट्रांज़िशन (वीडियो + ऑडियो) |
description
यह वोल्केनो आर्क के सीडेंस 2.0 एपीआई पर आधारित ज़ियाओहोंग्शु (लिटिल रेड बुक) पुस्तक अनुशंसा वीडियो बनाने का एक पूरी तरह से स्वचालित टूल है। पुस्तक चयन से लेकर प्रकाशन तक, सब कुछ एक ही कमांड से हो जाता है। **मुख्य विशेषताएं**: - **नेटिव ऑडियो और सबटाइटल** - सीडेंस 2.0 सीधे वॉइसओवर और सिंक्रोनाइज़्ड सबटाइटल तैयार करता है, जिससे पोस्ट-एडिटिंग की आवश्यकता समाप्त हो जाती है। - **बुद्धिमान पुस्तक चयन** - ज़ियाओहोंग्शु पर कम सहभागिता वाली लोकप्रिय पुस्तकों की स्वचालित रूप से पहचान करता है, जिससे ट्रैफ़िक बढ़ाने वाली पुस्तकों का सटीक पता चलता है। - **पेशेवर स्टोरीबोर्डिंग** - 6-7 सावधानीपूर्वक डिज़ाइन किए गए स्टोरीबोर्ड, जिनमें शुरुआती सस्पेंस, मुख्य दृष्टिकोण और भावनात्मक जुड़ाव शामिल हैं। - **श्रृंखलाबद्ध निर्माण** - प्रत्येक वीडियो खंड पिछले खंड के अंतिम फ्रेम से शुरू होता है, जिससे सहज और स्वाभाविक प्रवाह सुनिश्चित होता है। - **एक क्लिक में प्रकाशन** - शीर्षक, टैग और हैशटैग स्वचालित रूप से तैयार करता है, जिससे Xiaohongshu पर सीधे प्रकाशन संभव हो जाता है। **उपयुक्त परिदृश्य**: - पुस्तक ब्लॉगरों द्वारा दैनिक वीडियो अपडेट - सशुल्क ज्ञान सामग्री का उत्पादन
Xiaohongshu पुस्तक अनुशंसा वीडियो स्वतः जनरेटर
निर्देश
---
नाम: बुक-वीडियो-पाइपलाइन
विवरण: "ज़ियाओहोंगशु पुस्तक अनुशंसा वीडियो स्वतः निर्माण v3 - सीडेंस 2.0: मूल ऑडियो + उपशीर्षक, पुस्तक चयन से प्रकाशन तक पूर्णतः स्वचालित"
लाइसेंस: एमआईटी
आह्वान: "/पुस्तक-वीडियो
---
# Xiaohongshu पुस्तक अनुशंसा वीडियो स्वचालित पाइपलाइन निर्माण v3
## अवलोकन
वोल्केनो आर्क के सीडेंस 2.0 एपीआई पर आधारित ज़ियाओहोंग्शु के लिए पुस्तक अनुशंसा वीडियो तैयार करने की एक पूरी तरह से स्वचालित प्रक्रिया।
**v3 में सुधार (आधिकारिक प्रॉम्प्ट शब्द मार्गदर्शिका के आधार पर):**
- **नेटिव ऑडियो** — प्रॉम्प्ट में सीधे कथन निर्दिष्ट करें, और सीडेंस स्वचालित रूप से आवाज उत्पन्न करेगा (अब एज-टीटीएस का उपयोग नहीं किया जा रहा है)।
- **नेटिव सबटाइटल्स** — प्रॉम्प्ट में सबटाइटल की सामग्री निर्दिष्ट करें, और सीडेंस वीडियो के भीतर सिंक्रोनाइज़्ड सबटाइटल्स उत्पन्न करेगा।
- **कवर टाइटल कार्ड** — पैन/ज़ूम प्रभाव + साइलेंट ऑडियो ट्रैक, जिससे एडिटिंग की अनुकूलता सुनिश्चित होती है।
- **श्रृंखला निर्माण** — प्रत्येक खंड पिछले खंड के अंतिम फ्रेम को प्रारंभिक छवि के रूप में उपयोग करता है, जिसके परिणामस्वरूप अधिक सुसंगत दृश्य प्रवाह होता है।
- **क्रॉसफ़ेड स्प्लिसिंग** — सिंक्रनाइज़्ड ऑडियो-विज़ुअल ट्रांज़िशन के लिए वीडियो क्रॉसफ़ेड + ऑडियो अक्रॉसफ़ेड।
**मुख्य प्रक्रिया:** पुस्तक चयन → विवरण/कवर → पटकथा → स्टोरीबोर्ड → वीडियो निर्माण (ऑडियो और उपशीर्षक सहित) → संयोजन → पूर्वावलोकन → प्रकाशन
---
## मौन निष्पादन प्रोटोकॉल
आगे बढ़ने के लिए पुष्टि न मांगें।
एक ही बार में पूरा आउटपुट जेनरेट करें।
यदि डेटा अनुपलब्ध है, तो निर्धारित डिफ़ॉल्ट मानों का उपयोग करें।
- कभी भी "क्या आप जारी रखना चाहते हैं?", "क्या आपको मेरी मदद चाहिए?", या "कृपया पुष्टि करें" जैसे व्यवधानकारी वाक्यों का प्रयोग न करें।
---
## पर्यावरण आवश्यकताएं
| निर्भरताएँ | स्थापना |
|------|------|
| वोल्केनो आर्क एपीआई कुंजी | पर्यावरण चर `VOLCENGINE_API_KEY` |
| imageio-ffmpeg | `pip install imageio-ffmpeg` (ffmpeg के साथ आता है) |
| डॉकर (xiaohongshu-mcp) | `localhost:18060` पर परिनियोजन आवश्यक है |
---
## निष्पादन प्रक्रिया
**ट्रिगर विधि: `/book-video` या `/book-video 《पुस्तक का शीर्षक》`**
चरण 1: पुस्तकों का चयन
**परिदृश्य ए - उपयोगकर्ता ने पुस्तक का शीर्षक निर्दिष्ट किया:** इसका सीधे उपयोग करें।
**परिदृश्य बी - पुस्तक का शीर्षक निर्दिष्ट नहीं है:** खोज स्क्रिप्ट चलाएँ (कम बिकने वाली बेस्टसेलर पुस्तकों को प्राथमिकता देते हुए):
दे घुमा के
python "D:\skills\xiaohongshu-book-publisher\scripts\search_hot_books_v2.py"
```
"लो-पाउडर बेस्टसेलर" श्रेणी से स्वचालित रूप से शीर्ष 1 का चयन करें ("[प्रकाशित]" को छोड़कर)।
**त्रुटि प्रबंधन:** स्क्रिप्ट टाइमआउट → कैश → वेब सर्च → डिफ़ॉल्ट (नापसंद किए जाने का साहस)
---
चरण 2: पुस्तक का विवरण और कवर प्राप्त करें
**2.1 डौबन से विवरण प्राप्त करें**
```
वेबफेच: https://search.douban.com/book/subject_search?search_text={पुस्तक का शीर्षक}
संक्षिप्त विवरण: पुस्तक का शीर्षक, लेखक, डौबन रेटिंग, सारांश, प्रमुख उद्धरण/मुख्य दृष्टिकोण, कवर यूआरएल
```
**2.2 कवर डाउनलोड करें (अंग्रेजी फ़ाइल नाम!)**
दे घुमा के
curl -o "D:\xiaohongshu_data\cover_{english_name}.jpg" -H "Referer: https://book.douban.com/" "Cover URL"
```
यदि कर्ल विफल हो जाता है, तो निम्न का उपयोग करें:
दे घुमा के
python "D:\skills\xiaohongshu-book-publisher\scripts\get_cover_playwright.py" "{पुस्तक का शीर्षक}"
```
---
चरण 3: पुस्तक अनुशंसा स्क्रिप्ट और स्टोरीबोर्ड तैयार करें
पुस्तक में दी गई जानकारी के आधार पर एक संवादात्मक वीडियो स्क्रिप्ट तैयार करें।
**कॉलर्जी फॉर्मूला (सीडेंस 2.0 आधिकारिक गाइड पर आधारित):**
प्रत्येक स्टोरीबोर्ड प्रॉम्प्ट में तीन भाग होते हैं:
1. **ऑडियो कमांड** — वॉइस-ओवर के साथ वीडियो बनाता है। `{voice_type}` का मतलब होगा: "नैरेटिव टेक्स्ट"।
2. **दृश्य विवरण** — `विषय + क्रिया + परिवेश + कैमरा गति + वातावरण`
3. **उपशीर्षक निर्देश** — उपशीर्षक स्क्रीन के नीचे दिखाई देते हैं। उपशीर्षक "नैरेटिव टेक्स्ट" हैं और इन्हें ऑडियो की लय के साथ पूरी तरह से सिंक्रनाइज़ किया जाना चाहिए।
**पटकथा का प्रारूप (6-7 दृश्य, लगभग 35 सेकंड):**
```मार्कडाउन
## पुस्तक अनुशंसा वीडियो स्क्रिप्ट
**पुस्तक का शीर्षक**: 《{पुस्तक का शीर्षक}》
**शैली:** हीलिंग (वार्म गोल्ड टोन)
### दृश्य 1 - प्रारंभिक सस्पेंस (5 सेकंड)
**वर्णन:** {एक आकर्षक प्रारंभिक पंक्ति}
**दृश्य विवरण:** {50-80 शब्द अंग्रेजी में: विषय + क्रिया + परिवेश + कैमरा शॉट + वातावरण}
### दृश्य 2 - पुस्तकें प्रकट होती हैं (5 सेकंड)
**वर्णनकर्ता:** {इस पुस्तक का संक्षिप्त परिचय}
**दृश्य:** {अंग्रेजी में, पुस्तकों से संबंधित एक दृश्य}
### स्टोरीबोर्ड 3 - लेखक/पृष्ठभूमि (5 सेकंड)
**वर्णन:** {लेखक की पृष्ठभूमि या रचनात्मक कहानी}
**दृश्य**: {अंग्रेजी, लेखन का माहौल, अध्ययन आदि}
### स्टोरीबोर्ड 4 - मुख्य दृष्टिकोण 1 (5 सेकंड)
**वर्णन:** {एक मार्मिक दृष्टिकोण या यादगार उद्धरण}
**दृश्य:** {अंग्रेजी में, दृष्टिकोण से मेल खाने वाले दृश्य रूपक}
### दृश्य 5 - मुख्य दृष्टिकोण 2 (5 सेकंड)
**वर्णन:** {एक और प्रभावशाली दृष्टिकोण या यादगार उद्धरण}
**दृश्य:** {अंग्रेजी में, दृष्टिकोण से मेल खाने वाले दृश्य रूपक}
### स्टोरीबोर्ड 6 - व्यक्तिगत विचार (5 सेकंड)
**वर्णनकर्ता**: {मेरी सच्ची भावनाएँ, इसे पढ़ने के बाद मुझमें आए बदलाव}
**दृश्य:** {अंग्रेजी, भावुक दृश्य}
### दृश्य 7 - कार्रवाई का आह्वान (5 सेकंड)
**वर्णनकर्ता:** {कार्रवाई के लिए आह्वान}
**दृश्य:** {अंग्रेजी, एक दिल को छू लेने वाला अंतिम दृश्य}
```
**स्क्रीन विवरण नियम:**
- **अंग्रेजी में होना अनिवार्य है**, 50-80 शब्द
- इस सूत्र के अनुसार: विषय + की जा रही क्रिया + वह किस वातावरण में है + वह किस प्रकाश/वातावरण में है + कैमरा कैसे चल रहा है?
- **कवर इमेज/पुस्तक के शीर्षक का उल्लेख न करें** (उपशीर्षकों से उत्पन्न पाठ)
- यथासंभव विशिष्ट परिदृश्यों का वर्णन करें और अमूर्त अवधारणाओं से बचें।
**वैकल्पिक ध्वनि प्रकार:**
- उपचार: `कोमल और शांत महिला आवाज`
- सस्पेंस/रहस्य: `गहरी, धीमी पुरुष आवाज`
- ताज़ा और स्वच्छ शैली: एक हल्की और जीवंत महिला आवाज।
---
चरण 4: वीडियो जनरेट करने के लिए पाइपलाइन का उपयोग करें।
**4.1 स्टोरीबोर्ड JSON को सहेजना**
JSON
[
{"scene_id": 1, "prompt": "अंग्रेजी दृश्य विवरण...", "narration": "चीनी वर्णन"},
{"scene_id": 2, "prompt": "अंग्रेजी दृश्य विवरण...", "narration": "चीनी वर्णन"},
...
]
```
इसे `D:\xiaohongshu_data\storyboard_{english_name}.json` में सेव करें।
**4.2 संपूर्ण पाइपलाइन v3 को कॉल करना**
पायथन
import sys, json
sys.path.insert(0, r"D:\skills\book-video-pipeline\scripts")
from seedance_client import SeedanceClient
क्लाइंट = सीडेंसक्लाइंट(एपीआई_की="आपकी_एपीआई_की")
with open(r"D:\xiaohongshu_data\storyboard_xxx.json", encoding="utf-8") as f:
स्टोरीबोर्ड = json.load(f)
परिणाम = क्लाइंट.जनरेट_फुल_वीडियो(
स्टोरीबोर्ड = स्टोरीबोर्ड,
cover_path=r"D:\xiaohongshu_data\cover_xxx.jpg",
पुस्तक का शीर्षक
आउटपुट_डायरेक्ट्री=आर"डी:\xiaohongshu_data",
आवाज का प्रकार="कोमल और शांत महिला आवाज",
with_subtitles=True,
)
print(f"वीडियो: {result['video_path']} ({result['size_kb']}KB, ~{result['duration']}s, ऑडियो: {result['has_audio']})")
```
**पाइपलाइन v3 स्वचालित रूप से निष्पादित होती है:**
1. कवर → टाइटल कार्ड (3 सेकंड का पैन/ज़ूम + ऑडियो ट्रैक म्यूट करें)
2. वीडियो क्लिप को क्रमबद्ध रूप से जेनरेट करें (प्रत्येक क्लिप में मूल ऑडियो और उपशीर्षक शामिल हैं)।
3. क्रॉसफ़ेड स्टिचिंग (वीडियो क्रॉसफ़ेड + ऑडियो क्रॉसफ़ेड)
4. अंतिम वीडियो आउटपुट करें।
**एपीआई कुंजी कॉन्फ़िगरेशन:**
दे घुमा के
VOLCENGINE_API_KEY=ark-xxx सेट करें
```
---
### चरण 5: पूर्वावलोकन
एक HTML पूर्वावलोकन पृष्ठ `D:\preview_video_{name}_{date}.html` बनाएं, जिसमें निम्नलिखित शामिल हों:
- वीडियो प्लेयर
- पुस्तक का शीर्षक, लेखक, रेटिंग
- कथन पाठ संस्करण
- Xiaohongshu पर गुलाबी रंग से प्रेरित स्टाइल
दे घुमा के
प्रारंभ "" "D:\preview_video_xxx.html"
```
कृपया उपयोगकर्ता से पुष्टि करें। यदि आप संतुष्ट नहीं हैं, तो कृपया:
स्टोरीबोर्ड प्रॉम्प्ट को समायोजित करें → पुनः उत्पन्न करें
ध्वनि का प्रकार बदलें → पुनः उत्पन्न करें
- दृश्य विवरण समायोजित करें → केवल प्रॉम्प्ट बदलें
---
चरण 6: Xiaohongshu पर पोस्ट करें
**6.1 लॉगिन स्थिति जांचें** → MCP `check_login_status`
**6.2 वीडियो नोट्स टेक्स्ट जनरेट करें** (वीडियो स्क्रिप्ट नहीं!)
- शीर्षक ≤ 20 अक्षर, प्रथम पुरुष दृष्टिकोण, भावपूर्ण प्रस्तुति
- मुख्य पाठ में 200-300 शब्द, 20 से अधिक इमोजी
- # के साथ 10-15 टैग
**MCP ने 6.3 संस्करण जारी किया**
पायथन
MCP_URL = 'http://localhost:18060'
# आरंभीकरण → publish_content(title, content, video, tags)
# कंटेनर के पथ का उपयोग करके वीडियो पथ: /app/data/xxx.mp4
```
**6.4 रिकॉर्ड प्रकाशित हो चुका है** → `published_books.json` में `"type": "video"` जोड़ें
---
## आउटपुट प्रारूप
```मार्कडाउन
## पुस्तक अनुशंसा वीडियो सफलतापूर्वक तैयार हो गया
**पुस्तक का शीर्षक**: 《{पुस्तक का शीर्षक}》
लेखक: {लेखक} | डौबन: {रेटिंग}
### वीडियो जानकारी
- अवधि: लगभग {N} सेकंड (3 सेकंड का टाइटल कार्ड + {M} दृश्य x 5 सेकंड)
- आस्पेक्ट रेशियो: 9:16 (पोर्ट्रेट)
- रिज़ॉल्यूशन: 720p
- फ़ाइल का आकार: {N} MB
ऑडियो: हां/नहीं
- उपशीर्षक: अंतर्निहित/कोई नहीं
- पथ: `D:\xiaohongshu_data\{name}_final.mp4`
### सूचना जारी करना
शीर्षक: {title}
टैग: {टैग}
- स्थिति: {सफलता/विफलता}
```
---
## मुख्य नियम
1. **नेटिव ऑडियो प्राथमिकता** — सीडेंस 2.0 ऑडियो जनरेशन को मूल रूप से सपोर्ट करता है; बस प्रॉम्प्ट में कथन निर्दिष्ट करें।
2. **नेटिव सबटाइटल्स** — प्रॉम्प्ट में सबटाइटल की सामग्री निर्दिष्ट करें, और सीडेंस स्वचालित रूप से सिंक्रोनाइज़्ड सबटाइटल्स उत्पन्न करेगा।
3. **अंतिम फ्रेम का निरंतरता** — प्रत्येक खंड पिछले खंड के अंतिम फ्रेम को प्रारंभिक छवि के रूप में उपयोग करता है, जिसके परिणामस्वरूप अधिक सुसंगत दृश्य प्रवाह होता है।
4. **स्टोरीबोर्ड शॉट्स अंग्रेजी में होने चाहिए** — सीडेंस बेहतर दृश्य गुणवत्ता के लिए अंग्रेजी शॉट्स का उपयोग करता है।
5. **एकीकृत ध्वनि प्रकार** — पूरी फिल्म में एक ही प्रकार की ध्वनि का प्रयोग किया गया है।
6. **वीडियो आस्पेक्ट रेशियो 9:16** — ज़ियाओहोंग्शु वर्टिकल स्क्रीन
7. **प्रकाशन से पहले उपयोगकर्ता की पुष्टि आवश्यक है** — प्रकाशन से पहले पूर्वावलोकन के पूरा होने की प्रतीक्षा करें।
8. **छवि फ़ाइलनाम अंग्रेज़ी में होने चाहिए** — चीनी अक्षर अपलोड में समय लगने का कारण बनेंगे।
9. **वीडियो स्क्रिप्ट ≠ पाठ और छवि नोट्स** — स्क्रिप्ट बोलचाल की भाषा में लिखी जाती है, लेख के रूप में नहीं।
10. **ऑडियो संरक्षण स्विच करें** — xfade वीडियो ट्रांज़िशन + acrossfade ऑडियो ट्रांज़िशन
## संकेत शब्द संदर्भ (सीडेंस 2.0 गाइड)
### ऑडियो कमांड टेम्पलेट
```
वॉइसओवर के साथ एक वीडियो बनाएं। `{voice_type}` विकल्प में लिखा है: "{narration content}"।
```
### उपशीर्षक निर्देश टेम्पलेट
```
स्क्रीन के निचले भाग में एक उपशीर्षक दिखाई देता है, जिसमें "{उपशीर्षक सामग्री}" लिखा होता है। उपशीर्षक ऑडियो की लय के साथ पूरी तरह से मेल खाना चाहिए।
```
### संपूर्ण दृश्य प्रॉम्प्ट का उदाहरण
```
एक वीडियो बनाएं जिसमें वॉइस ओवर हो। एक सौम्य, शांत महिला की आवाज़ में कहा जाता है, "क्या आपने कभी सोचा है कि हम हमेशा दूसरों की अपेक्षाओं पर क्यों खरे उतरते हैं?" धुंध भरे जंगल के रास्ते पर एक चौराहे पर एक अकेली आकृति खड़ी है, ऊंचे पेड़ों से छनकर आती धूप, सुनहरी रोशनी, धीरे-धीरे ज़ूम इन, शैलो डेप्थ ऑफ़ फील्ड। स्क्रीन के नीचे उपशीर्षक दिखाई देते हैं, "क्या आपने कभी सोचा है कि हम हमेशा दूसरों की अपेक्षाओं पर क्यों खरे उतरते हैं?" उपशीर्षक ऑडियो के साथ पूरी तरह से सिंक्रनाइज़ होने चाहिए।
```
## फ़ाइल संदर्भ
| फ़ाइल | उद्देश्य |
|------|------|
| `D:\skills\book-video-pipeline\scripts\seedance_client.py` | सीडेंस एपीआई + नेटिव ऑडियो/सबटाइटल + संयोजन (v3) |
| `D:\skills\xiaohongshu-book-publisher\scripts\search_hot_books_v2.py` | लोकप्रिय पुस्तक खोज |
| `D:\skills\xiaohongshu-book-publisher\scripts\published_books.json` | प्रकाशित रिकॉर्ड |
| `D:\skills\xiaohongshu-book-publisher\scripts\get_cover_playwright.py` | कवर इमेज पुनर्प्राप्ति (बैकअप) |
| `D:\xiaohongshu_data\` | वीडियो और कवर आउटपुट निर्देशिका |
## एपीआई कॉन्फ़िगरेशन
| पैरामीटर | मान |
|------|-----|
| वीडियो मॉडल | `डौबाओ-सीडांस-2-0-फास्ट-260128` |
| आवाज का प्रकार | सौम्य और शांत महिला आवाज (डिफ़ॉल्ट) |
अनुपात | `9:16` |
| खंड की लंबाई | 5 सेकंड |
| टाइटल कार्ड | 3 सेकंड में पैन/ज़ूम करें + ऑडियो म्यूट करें |
क्रॉसफ़ेड | 0.5 सेकंड का ट्रांज़िशन (वीडियो + ऑडियो) |
description
यह वोल्केनो आर्क के सीडेंस 2.0 एपीआई पर आधारित ज़ियाओहोंग्शु (लिटिल रेड बुक) पुस्तक अनुशंसा वीडियो बनाने का एक पूरी तरह से स्वचालित टूल है। पुस्तक चयन से लेकर प्रकाशन तक, सब कुछ एक ही कमांड से हो जाता है। **मुख्य विशेषताएं**: - **नेटिव ऑडियो और सबटाइटल** - सीडेंस 2.0 सीधे वॉइसओवर और सिंक्रोनाइज़्ड सबटाइटल तैयार करता है, जिससे पोस्ट-एडिटिंग की आवश्यकता समाप्त हो जाती है। - **बुद्धिमान पुस्तक चयन** - ज़ियाओहोंग्शु पर कम सहभागिता वाली लोकप्रिय पुस्तकों की स्वचालित रूप से पहचान करता है, जिससे ट्रैफ़िक बढ़ाने वाली पुस्तकों का सटीक पता चलता है। - **पेशेवर स्टोरीबोर्डिंग** - 6-7 सावधानीपूर्वक डिज़ाइन किए गए स्टोरीबोर्ड, जिनमें शुरुआती सस्पेंस, मुख्य दृष्टिकोण और भावनात्मक जुड़ाव शामिल हैं। - **श्रृंखलाबद्ध निर्माण** - प्रत्येक वीडियो खंड पिछले खंड के अंतिम फ्रेम से शुरू होता है, जिससे सहज और स्वाभाविक प्रवाह सुनिश्चित होता है। - **एक क्लिक में प्रकाशन** - शीर्षक, टैग और हैशटैग स्वचालित रूप से तैयार करता है, जिससे Xiaohongshu पर सीधे प्रकाशन संभव हो जाता है। **उपयुक्त परिदृश्य**: - पुस्तक ब्लॉगरों द्वारा दैनिक वीडियो अपडेट - सशुल्क ज्ञान सामग्री का उत्पादन
Find your next favorite skill
Explore more curated AI skills for research, creation, and everyday work.