Xiaohongshu पुस्तक अनुशंसा वीडियो स्वतः जनरेटर

अवलोकन उपयोग के मामले कौशल प्रॉम्प्ट मूल्य निर्धारण ब्लॉग अपडेट

Xiaohongshu पुस्तक अनुशंसा वीडियो स्वतः जनरेटर

madeBy

Yyyu624

installedBy

fromYouMind

निर्देश

---

नाम: बुक-वीडियो-पाइपलाइन

विवरण: "ज़ियाओहोंगशु पुस्तक अनुशंसा वीडियो स्वतः निर्माण v3 - सीडेंस 2.0: मूल ऑडियो + उपशीर्षक, पुस्तक चयन से प्रकाशन तक पूर्णतः स्वचालित"

लाइसेंस: एमआईटी

आह्वान: "/पुस्तक-वीडियो

---

# Xiaohongshu पुस्तक अनुशंसा वीडियो स्वचालित पाइपलाइन निर्माण v3

बुक-वीडियो-पाइपलाइन

## अवलोकन

वोल्केनो आर्क के सीडेंस 2.0 एपीआई पर आधारित ज़ियाओहोंग्शु के लिए पुस्तक अनुशंसा वीडियो तैयार करने की एक पूरी तरह से स्वचालित प्रक्रिया।

**v3 में सुधार (आधिकारिक प्रॉम्प्ट शब्द मार्गदर्शिका के आधार पर):**

- **नेटिव ऑडियो** — प्रॉम्प्ट में सीधे कथन निर्दिष्ट करें, और सीडेंस स्वचालित रूप से आवाज उत्पन्न करेगा (अब एज-टीटीएस का उपयोग नहीं किया जा रहा है)।

- **नेटिव सबटाइटल्स** — प्रॉम्प्ट में सबटाइटल की सामग्री निर्दिष्ट करें, और सीडेंस वीडियो के भीतर सिंक्रोनाइज़्ड सबटाइटल्स उत्पन्न करेगा।

- **कवर टाइटल कार्ड** — पैन/ज़ूम प्रभाव + साइलेंट ऑडियो ट्रैक, जिससे एडिटिंग की अनुकूलता सुनिश्चित होती है।

- **श्रृंखला निर्माण** — प्रत्येक खंड पिछले खंड के अंतिम फ्रेम को प्रारंभिक छवि के रूप में उपयोग करता है, जिसके परिणामस्वरूप अधिक सुसंगत दृश्य प्रवाह होता है।

- **क्रॉसफ़ेड स्प्लिसिंग** — सिंक्रनाइज़्ड ऑडियो-विज़ुअल ट्रांज़िशन के लिए वीडियो क्रॉसफ़ेड + ऑडियो अक्रॉसफ़ेड।

**मुख्य प्रक्रिया:** पुस्तक चयन → विवरण/कवर → पटकथा → स्टोरीबोर्ड → वीडियो निर्माण (ऑडियो और उपशीर्षक सहित) → संयोजन → पूर्वावलोकन → प्रकाशन

---

## मौन निष्पादन प्रोटोकॉल

आगे बढ़ने के लिए पुष्टि न मांगें।

एक ही बार में पूरा आउटपुट जेनरेट करें।

यदि डेटा अनुपलब्ध है, तो निर्धारित डिफ़ॉल्ट मानों का उपयोग करें।

- कभी भी "क्या आप जारी रखना चाहते हैं?", "क्या आपको मेरी मदद चाहिए?", या "कृपया पुष्टि करें" जैसे व्यवधानकारी वाक्यों का प्रयोग न करें।

---

## पर्यावरण आवश्यकताएं

| निर्भरताएँ | स्थापना |

|------|------|

| वोल्केनो आर्क एपीआई कुंजी | पर्यावरण चर `VOLCENGINE_API_KEY` |

| imageio-ffmpeg | `pip install imageio-ffmpeg` (ffmpeg के साथ आता है) |

| डॉकर (xiaohongshu-mcp) | `localhost:18060` पर परिनियोजन आवश्यक है |

---

## निष्पादन प्रक्रिया

**ट्रिगर विधि: `/book-video` या `/book-video 《पुस्तक का शीर्षक》`**

चरण 1: पुस्तकों का चयन

**परिदृश्य ए - उपयोगकर्ता ने पुस्तक का शीर्षक निर्दिष्ट किया:** इसका सीधे उपयोग करें।

**परिदृश्य बी - पुस्तक का शीर्षक निर्दिष्ट नहीं है:** खोज स्क्रिप्ट चलाएँ (कम बिकने वाली बेस्टसेलर पुस्तकों को प्राथमिकता देते हुए):

दे घुमा के

python "D:\skills\xiaohongshu-book-publisher\scripts\search_hot_books_v2.py"

```

"लो-पाउडर बेस्टसेलर" श्रेणी से स्वचालित रूप से शीर्ष 1 का चयन करें ("[प्रकाशित]" को छोड़कर)।

**त्रुटि प्रबंधन:** स्क्रिप्ट टाइमआउट → कैश → वेब सर्च → डिफ़ॉल्ट (नापसंद किए जाने का साहस)

---

चरण 2: पुस्तक का विवरण और कवर प्राप्त करें

**2.1 डौबन से विवरण प्राप्त करें**

```

वेबफेच: https://search.douban.com/book/subject_search?search_text={पुस्तक का शीर्षक}

संक्षिप्त विवरण: पुस्तक का शीर्षक, लेखक, डौबन रेटिंग, सारांश, प्रमुख उद्धरण/मुख्य दृष्टिकोण, कवर यूआरएल

```

**2.2 कवर डाउनलोड करें (अंग्रेजी फ़ाइल नाम!)**

दे घुमा के

curl -o "D:\xiaohongshu_data\cover_{english_name}.jpg" -H "Referer: https://book.douban.com/" "Cover URL"

```

यदि कर्ल विफल हो जाता है, तो निम्न का उपयोग करें:

दे घुमा के

python "D:\skills\xiaohongshu-book-publisher\scripts\get_cover_playwright.py" "{पुस्तक का शीर्षक}"

```

---

चरण 3: पुस्तक अनुशंसा स्क्रिप्ट और स्टोरीबोर्ड तैयार करें

पुस्तक में दी गई जानकारी के आधार पर एक संवादात्मक वीडियो स्क्रिप्ट तैयार करें।

**कॉलर्जी फॉर्मूला (सीडेंस 2.0 आधिकारिक गाइड पर आधारित):**

प्रत्येक स्टोरीबोर्ड प्रॉम्प्ट में तीन भाग होते हैं:

1. **ऑडियो कमांड** — वॉइस-ओवर के साथ वीडियो बनाता है। `{voice_type}` का मतलब होगा: "नैरेटिव टेक्स्ट"।

2. **दृश्य विवरण** — `विषय + क्रिया + परिवेश + कैमरा गति + वातावरण`

3. **उपशीर्षक निर्देश** — उपशीर्षक स्क्रीन के नीचे दिखाई देते हैं। उपशीर्षक "नैरेटिव टेक्स्ट" हैं और इन्हें ऑडियो की लय के साथ पूरी तरह से सिंक्रनाइज़ किया जाना चाहिए।

**पटकथा का प्रारूप (6-7 दृश्य, लगभग 35 सेकंड):**

```मार्कडाउन

## पुस्तक अनुशंसा वीडियो स्क्रिप्ट

**पुस्तक का शीर्षक**: 《{पुस्तक का शीर्षक}》

**शैली:** हीलिंग (वार्म गोल्ड टोन)

### दृश्य 1 - प्रारंभिक सस्पेंस (5 सेकंड)

**वर्णन:** {एक आकर्षक प्रारंभिक पंक्ति}

**दृश्य विवरण:** {50-80 शब्द अंग्रेजी में: विषय + क्रिया + परिवेश + कैमरा शॉट + वातावरण}

### दृश्य 2 - पुस्तकें प्रकट होती हैं (5 सेकंड)

**वर्णनकर्ता:** {इस पुस्तक का संक्षिप्त परिचय}

**दृश्य:** {अंग्रेजी में, पुस्तकों से संबंधित एक दृश्य}

### स्टोरीबोर्ड 3 - लेखक/पृष्ठभूमि (5 सेकंड)

**वर्णन:** {लेखक की पृष्ठभूमि या रचनात्मक कहानी}

**दृश्य**: {अंग्रेजी, लेखन का माहौल, अध्ययन आदि}

### स्टोरीबोर्ड 4 - मुख्य दृष्टिकोण 1 (5 सेकंड)

**वर्णन:** {एक मार्मिक दृष्टिकोण या यादगार उद्धरण}

**दृश्य:** {अंग्रेजी में, दृष्टिकोण से मेल खाने वाले दृश्य रूपक}

### दृश्य 5 - मुख्य दृष्टिकोण 2 (5 सेकंड)

**वर्णन:** {एक और प्रभावशाली दृष्टिकोण या यादगार उद्धरण}

**दृश्य:** {अंग्रेजी में, दृष्टिकोण से मेल खाने वाले दृश्य रूपक}

### स्टोरीबोर्ड 6 - व्यक्तिगत विचार (5 सेकंड)

**वर्णनकर्ता**: {मेरी सच्ची भावनाएँ, इसे पढ़ने के बाद मुझमें आए बदलाव}

**दृश्य:** {अंग्रेजी, भावुक दृश्य}

### दृश्य 7 - कार्रवाई का आह्वान (5 सेकंड)

**वर्णनकर्ता:** {कार्रवाई के लिए आह्वान}

**दृश्य:** {अंग्रेजी, एक दिल को छू लेने वाला अंतिम दृश्य}

```

**स्क्रीन विवरण नियम:**

- **अंग्रेजी में होना अनिवार्य है**, 50-80 शब्द

- इस सूत्र के अनुसार: विषय + की जा रही क्रिया + वह किस वातावरण में है + वह किस प्रकाश/वातावरण में है + कैमरा कैसे चल रहा है?

- **कवर इमेज/पुस्तक के शीर्षक का उल्लेख न करें** (उपशीर्षकों से उत्पन्न पाठ)

- यथासंभव विशिष्ट परिदृश्यों का वर्णन करें और अमूर्त अवधारणाओं से बचें।

**वैकल्पिक ध्वनि प्रकार:**

- उपचार: `कोमल और शांत महिला आवाज`

- सस्पेंस/रहस्य: `गहरी, धीमी पुरुष आवाज`

- ताज़ा और स्वच्छ शैली: एक हल्की और जीवंत महिला आवाज।

---

चरण 4: वीडियो जनरेट करने के लिए पाइपलाइन का उपयोग करें।

**4.1 स्टोरीबोर्ड JSON को सहेजना**

JSON

[

{"scene_id": 1, "prompt": "अंग्रेजी दृश्य विवरण...", "narration": "चीनी वर्णन"},

{"scene_id": 2, "prompt": "अंग्रेजी दृश्य विवरण...", "narration": "चीनी वर्णन"},

...

]

```

इसे `D:\xiaohongshu_data\storyboard_{english_name}.json` में सेव करें।

**4.2 संपूर्ण पाइपलाइन v3 को कॉल करना**

पायथन

import sys, json

sys.path.insert(0, r"D:\skills\book-video-pipeline\scripts")

from seedance_client import SeedanceClient

क्लाइंट = सीडेंसक्लाइंट(एपीआई_की="आपकी_एपीआई_की")

with open(r"D:\xiaohongshu_data\storyboard_xxx.json", encoding="utf-8") as f:

स्टोरीबोर्ड = json.load(f)

परिणाम = क्लाइंट.जनरेट_फुल_वीडियो(

स्टोरीबोर्ड = स्टोरीबोर्ड,

cover_path=r"D:\xiaohongshu_data\cover_xxx.jpg",

पुस्तक का शीर्षक

आउटपुट_डायरेक्ट्री=आर"डी:\xiaohongshu_data",

आवाज का प्रकार="कोमल और शांत महिला आवाज",

with_subtitles=True,

)

print(f"वीडियो: {result['video_path']} ({result['size_kb']}KB, ~{result['duration']}s, ऑडियो: {result['has_audio']})")

```

**पाइपलाइन v3 स्वचालित रूप से निष्पादित होती है:**

1. कवर → टाइटल कार्ड (3 सेकंड का पैन/ज़ूम + ऑडियो ट्रैक म्यूट करें)

2. वीडियो क्लिप को क्रमबद्ध रूप से जेनरेट करें (प्रत्येक क्लिप में मूल ऑडियो और उपशीर्षक शामिल हैं)।

3. क्रॉसफ़ेड स्टिचिंग (वीडियो क्रॉसफ़ेड + ऑडियो क्रॉसफ़ेड)

4. अंतिम वीडियो आउटपुट करें।

**एपीआई कुंजी कॉन्फ़िगरेशन:**

दे घुमा के

VOLCENGINE_API_KEY=ark-xxx सेट करें

```

---

### चरण 5: पूर्वावलोकन

एक HTML पूर्वावलोकन पृष्ठ `D:\preview_video_{name}_{date}.html` बनाएं, जिसमें निम्नलिखित शामिल हों:

- वीडियो प्लेयर

- पुस्तक का शीर्षक, लेखक, रेटिंग

- कथन पाठ संस्करण

- Xiaohongshu पर गुलाबी रंग से प्रेरित स्टाइल

दे घुमा के

प्रारंभ "" "D:\preview_video_xxx.html"

```

कृपया उपयोगकर्ता से पुष्टि करें। यदि आप संतुष्ट नहीं हैं, तो कृपया:

स्टोरीबोर्ड प्रॉम्प्ट को समायोजित करें → पुनः उत्पन्न करें

ध्वनि का प्रकार बदलें → पुनः उत्पन्न करें

- दृश्य विवरण समायोजित करें → केवल प्रॉम्प्ट बदलें

---

चरण 6: Xiaohongshu पर पोस्ट करें

**6.1 लॉगिन स्थिति जांचें** → MCP `check_login_status`

**6.2 वीडियो नोट्स टेक्स्ट जनरेट करें** (वीडियो स्क्रिप्ट नहीं!)

- शीर्षक ≤ 20 अक्षर, प्रथम पुरुष दृष्टिकोण, भावपूर्ण प्रस्तुति

- मुख्य पाठ में 200-300 शब्द, 20 से अधिक इमोजी

- # के साथ 10-15 टैग

**MCP ने 6.3 संस्करण जारी किया**

पायथन

MCP_URL = 'http://localhost:18060'

# आरंभीकरण → publish_content(title, content, video, tags)

# कंटेनर के पथ का उपयोग करके वीडियो पथ: /app/data/xxx.mp4

```

**6.4 रिकॉर्ड प्रकाशित हो चुका है** → `published_books.json` में `"type": "video"` जोड़ें

---

## आउटपुट प्रारूप

```मार्कडाउन

## पुस्तक अनुशंसा वीडियो सफलतापूर्वक तैयार हो गया

**पुस्तक का शीर्षक**: 《{पुस्तक का शीर्षक}》

लेखक: {लेखक} | डौबन: {रेटिंग}

### वीडियो जानकारी

- अवधि: लगभग {N} सेकंड (3 सेकंड का टाइटल कार्ड + {M} दृश्य x 5 सेकंड)

- आस्पेक्ट रेशियो: 9:16 (पोर्ट्रेट)

- रिज़ॉल्यूशन: 720p

- फ़ाइल का आकार: {N} MB

ऑडियो: हां/नहीं

- उपशीर्षक: अंतर्निहित/कोई नहीं

- पथ: `D:\xiaohongshu_data\{name}_final.mp4`

### सूचना जारी करना

शीर्षक: {title}

टैग: {टैग}

- स्थिति: {सफलता/विफलता}

```

---

## मुख्य नियम

1. **नेटिव ऑडियो प्राथमिकता** — सीडेंस 2.0 ऑडियो जनरेशन को मूल रूप से सपोर्ट करता है; बस प्रॉम्प्ट में कथन निर्दिष्ट करें।

2. **नेटिव सबटाइटल्स** — प्रॉम्प्ट में सबटाइटल की सामग्री निर्दिष्ट करें, और सीडेंस स्वचालित रूप से सिंक्रोनाइज़्ड सबटाइटल्स उत्पन्न करेगा।

3. **अंतिम फ्रेम का निरंतरता** — प्रत्येक खंड पिछले खंड के अंतिम फ्रेम को प्रारंभिक छवि के रूप में उपयोग करता है, जिसके परिणामस्वरूप अधिक सुसंगत दृश्य प्रवाह होता है।

4. **स्टोरीबोर्ड शॉट्स अंग्रेजी में होने चाहिए** — सीडेंस बेहतर दृश्य गुणवत्ता के लिए अंग्रेजी शॉट्स का उपयोग करता है।

5. **एकीकृत ध्वनि प्रकार** — पूरी फिल्म में एक ही प्रकार की ध्वनि का प्रयोग किया गया है।

6. **वीडियो आस्पेक्ट रेशियो 9:16** — ज़ियाओहोंग्शु वर्टिकल स्क्रीन

7. **प्रकाशन से पहले उपयोगकर्ता की पुष्टि आवश्यक है** — प्रकाशन से पहले पूर्वावलोकन के पूरा होने की प्रतीक्षा करें।

8. **छवि फ़ाइलनाम अंग्रेज़ी में होने चाहिए** — चीनी अक्षर अपलोड में समय लगने का कारण बनेंगे।

9. **वीडियो स्क्रिप्ट ≠ पाठ और छवि नोट्स** — स्क्रिप्ट बोलचाल की भाषा में लिखी जाती है, लेख के रूप में नहीं।

10. **ऑडियो संरक्षण स्विच करें** — xfade वीडियो ट्रांज़िशन + acrossfade ऑडियो ट्रांज़िशन

## संकेत शब्द संदर्भ (सीडेंस 2.0 गाइड)

### ऑडियो कमांड टेम्पलेट

```

वॉइसओवर के साथ एक वीडियो बनाएं। `{voice_type}` विकल्प में लिखा है: "{narration content}"।

```

### उपशीर्षक निर्देश टेम्पलेट

```

स्क्रीन के निचले भाग में एक उपशीर्षक दिखाई देता है, जिसमें "{उपशीर्षक सामग्री}" लिखा होता है। उपशीर्षक ऑडियो की लय के साथ पूरी तरह से मेल खाना चाहिए।

```

### संपूर्ण दृश्य प्रॉम्प्ट का उदाहरण

```

एक वीडियो बनाएं जिसमें वॉइस ओवर हो। एक सौम्य, शांत महिला की आवाज़ में कहा जाता है, "क्या आपने कभी सोचा है कि हम हमेशा दूसरों की अपेक्षाओं पर क्यों खरे उतरते हैं?" धुंध भरे जंगल के रास्ते पर एक चौराहे पर एक अकेली आकृति खड़ी है, ऊंचे पेड़ों से छनकर आती धूप, सुनहरी रोशनी, धीरे-धीरे ज़ूम इन, शैलो डेप्थ ऑफ़ फील्ड। स्क्रीन के नीचे उपशीर्षक दिखाई देते हैं, "क्या आपने कभी सोचा है कि हम हमेशा दूसरों की अपेक्षाओं पर क्यों खरे उतरते हैं?" उपशीर्षक ऑडियो के साथ पूरी तरह से सिंक्रनाइज़ होने चाहिए।

```

## फ़ाइल संदर्भ

| फ़ाइल | उद्देश्य |

|------|------|

| `D:\skills\book-video-pipeline\scripts\seedance_client.py` | सीडेंस एपीआई + नेटिव ऑडियो/सबटाइटल + संयोजन (v3) |

| `D:\skills\xiaohongshu-book-publisher\scripts\search_hot_books_v2.py` | लोकप्रिय पुस्तक खोज |

| `D:\skills\xiaohongshu-book-publisher\scripts\published_books.json` | प्रकाशित रिकॉर्ड |

| `D:\skills\xiaohongshu-book-publisher\scripts\get_cover_playwright.py` | कवर इमेज पुनर्प्राप्ति (बैकअप) |

| `D:\xiaohongshu_data\` | वीडियो और कवर आउटपुट निर्देशिका |

## एपीआई कॉन्फ़िगरेशन

| पैरामीटर | मान |

|------|-----|

| वीडियो मॉडल | `डौबाओ-सीडांस-2-0-फास्ट-260128` |

| आवाज का प्रकार | सौम्य और शांत महिला आवाज (डिफ़ॉल्ट) |

अनुपात | `9:16` |

| खंड की लंबाई | 5 सेकंड |

| टाइटल कार्ड | 3 सेकंड में पैन/ज़ूम करें + ऑडियो म्यूट करें |

क्रॉसफ़ेड | 0.5 सेकंड का ट्रांज़िशन (वीडियो + ऑडियो) |

SKILL.md

YOUMIND_MARKET.md

description

यह वोल्केनो आर्क के सीडेंस 2.0 एपीआई पर आधारित ज़ियाओहोंग्शु (लिटिल रेड बुक) पुस्तक अनुशंसा वीडियो बनाने का एक पूरी तरह से स्वचालित टूल है। पुस्तक चयन से लेकर प्रकाशन तक, सब कुछ एक ही कमांड से हो जाता है। **मुख्य विशेषताएं**: - **नेटिव ऑडियो और सबटाइटल** - सीडेंस 2.0 सीधे वॉइसओवर और सिंक्रोनाइज़्ड सबटाइटल तैयार करता है, जिससे पोस्ट-एडिटिंग की आवश्यकता समाप्त हो जाती है। - **बुद्धिमान पुस्तक चयन** - ज़ियाओहोंग्शु पर कम सहभागिता वाली लोकप्रिय पुस्तकों की स्वचालित रूप से पहचान करता है, जिससे ट्रैफ़िक बढ़ाने वाली पुस्तकों का सटीक पता चलता है। - **पेशेवर स्टोरीबोर्डिंग** - 6-7 सावधानीपूर्वक डिज़ाइन किए गए स्टोरीबोर्ड, जिनमें शुरुआती सस्पेंस, मुख्य दृष्टिकोण और भावनात्मक जुड़ाव शामिल हैं। - **श्रृंखलाबद्ध निर्माण** - प्रत्येक वीडियो खंड पिछले खंड के अंतिम फ्रेम से शुरू होता है, जिससे सहज और स्वाभाविक प्रवाह सुनिश्चित होता है। - **एक क्लिक में प्रकाशन** - शीर्षक, टैग और हैशटैग स्वचालित रूप से तैयार करता है, जिससे Xiaohongshu पर सीधे प्रकाशन संभव हो जाता है। **उपयुक्त परिदृश्य**: - पुस्तक ब्लॉगरों द्वारा दैनिक वीडियो अपडेट - सशुल्क ज्ञान सामग्री का उत्पादन