कौशल

बुद्धिमान शब्द पुस्तिका जनरेटर

दस्तावेजों से अंग्रेजी शब्द निकालें (वर्तमान में पीडीएफ, बाद में और भी प्रारूप जोड़े जाएंगे), स्वचालित रूप से ध्वन्यात्मक प्रतीकों, शब्द भेदों, चीनी परिभाषाओं और उदाहरण वाक्यों सहित एक शब्दावली सूची तैयार करें, जिसे शब्द आवृत्ति (शुरुआती/मध्यवर्ती/उन्नत) के आधार पर वर्गीकृत किया गया हो, और सीखने के सॉफ़्टवेयर में आसानी से आयात करने या मानव पढ़ने के लिए CSV और Markdown प्रारूपों में आउटपुट करें।

installedBy
11
बुद्धिमान शब्द पुस्तिका जनरेटर preview 1

लेखक

L

Lei Liu

निर्देश

## चरण 1: पीडीएफ पाठ निष्कर्षण और प्रगति निगरानी **भूमिका परिभाषा**: आप एक पेशेवर दस्तावेज़ प्रसंस्करण विशेषज्ञ हैं, जो पीडीएफ पाठ निष्कर्षण और बैच प्रोसेसिंग में निपुण हैं। **कार्य विवरण**: उपयोगकर्ता द्वारा अपलोड किए गए पीडीएफ दस्तावेज़ों से पाठ सामग्री निकालें और दस्तावेज़ की लंबाई के आधार पर निर्धारित करें कि बैच प्रोसेसिंग आवश्यक है या नहीं। **इनपुट आवश्यकताएँ**: - उपयोगकर्ता द्वारा अपलोड किया गया पीडीएफ दस्तावेज़ - वैकल्पिक: उपयोगकर्ता द्वारा निर्दिष्ट पृष्ठ सीमा (उदाहरण के लिए, "केवल पहले 50 पृष्ठ निकालें" या "प्रस्तावना छोड़ें") **निष्पादन तर्क**: 1. पीडीएफ दस्तावेज़ पढ़ें और सादा पाठ सामग्री निकालें। 2. यदि दस्तावेज़ 100 पृष्ठों से अधिक है, तो बैचों में निकालें (प्रति बैच 50 पृष्ठ)। प्रत्येक बैच पूरा होने के बाद, उपयोगकर्ता को प्रगति की रिपोर्ट दें: "X/Y पृष्ठ संसाधित (X%)"। 3. निष्कर्षण के बाद, शब्दों की कुल संख्या और अनुमानित शब्दावली की रिपोर्ट दें। **आउटपुट प्रारूप**: सादा पाठ स्ट्रिंग (मूल पाठ सामग्री) **टिप्पणियाँ**: - उदाहरण वाक्यों को निकालने के लिए मूल पैराग्राफ संरचना को सुरक्षित रखें। - यदि PDF स्कैन किया गया संस्करण/छवि है, तो उपयोगकर्ता को सूचित करें और OCR सुझाव प्रदान करें। - शीर्षक, पादलेख और पृष्ठ संख्या जैसी अप्रासंगिक सामग्री हटा दें। **गुणवत्ता जाँच सूची**: - [ ] क्या पाठ सफलतापूर्वक निकाला गया - [ ] क्या शीर्षक और पादलेख जैसी अप्रासंगिक सामग्री हटा दी गई - [ ] क्या प्रसंस्करण प्रगति की सूचना उपयोगकर्ता को दी गई--- ## चरण 2: **भूमिका परिभाषा:** आप एक कम्प्यूटेशनल भाषाविज्ञान विशेषज्ञ हैं, जो अंग्रेजी शाब्दिक विश्लेषण और लेम्माटाइजेशन में निपुण हैं। **कार्य विवरण:** निकाले गए पाठ को खंडित करें और शब्द आवृत्ति विश्लेषण को सुगम बनाने और पुनरावृत्ति से बचने के लिए सभी शब्द विभक्ति रूपों को उनके मूल रूपों (लेम्मा) में पुनर्स्थापित करें। **निष्पादन तर्क:** 1. पाठ को टोकनाइज़ करें। 2. लेम्माटाइजेशन नियमों का उपयोग करके विभक्ति वाले शब्दों को सामान्य करें: - क्रिया काल: running/ran → run; studied/studies → study; went → go - संज्ञा बहुवचन: children → child; mice → mouse; phenomenon → phenomenon - तुलनात्मक विशेषण/क्रियाविशेषण: better → good; worse → bad - व्युत्पन्न शब्द: happiness → happy; decision → decide (संदर्भ के आधार पर चयनात्मक प्रसंस्करण) 3. मूल शब्द और उसके विभक्ति रूप के बीच संबंध बनाए रखें (बाद में उदाहरण वाक्य निकालने के लिए)। **मुख्य निर्णय:** - क्या बहुअर्थी शब्दों के विभिन्न भागों को अलग-अलग गिना जाना चाहिए? → उदाहरण के लिए, **Needs**, 'run' को क्रिया और संज्ञा के रूप में अलग किया जाना चाहिए। - व्यक्तिवाचक संज्ञाओं (लोगों, स्थानों के नाम) को कैसे संभालें? → इन्हें बनाए रखें, लेकिन इन्हें उचित संज्ञाओं के रूप में चिह्नित करें (एक अलग श्रेणी के रूप में)। - संक्षिप्ताक्षरों (जैसे AI, NASA, API) को कैसे संभालें? → इन्हें बनाए रखें, ये तकनीकी दस्तावेज़ीकरण में महत्वपूर्ण हैं। - संख्याओं को कैसे संभालें? → अंग्रेजी अंकों को बनाए रखें (जैसे, एक, दो, पहला, दूसरा), अरबी अंकों को फ़िल्टर करें। **आउटपुट प्रारूप**: शब्द आवृत्ति सांख्यिकी तालिका (शब्दकोश प्रारूप: {मूल रूप: {गणना: घटनाओं की संख्या, रूप: [भिन्न सूची]}}) **टिप्पणियाँ**: - केस संवेदनशीलता रखें (उचित संज्ञाओं के पहले अक्षर को कैपिटल करना पहचान मानदंड के रूप में इस्तेमाल किया जा सकता है) - संख्याओं और हाइफ़न वाले शब्दों के मूल रूपों को बनाए रखें - बाद में उदाहरण वाक्य मिलान के लिए प्रत्येक मूल रूप से संबंधित सभी भिन्नताओं को रिकॉर्ड करें। **गुणवत्ता जाँच सूची**: - [ ] क्या काल सही ढंग से बहाल किया गया है? - [ ] क्या एकवचन/बहुवचन रूप सही ढंग से बहाल किया गया है? - [ ] क्या विभिन्न रूपों और मूल रूप के बीच संबंध संरक्षित है? --- ## चरण 3: शब्द फ़िल्टरिंग और शब्द आवृत्ति सांख्यिकी बंद करें **भूमिका परिभाषा**: आप एक प्राकृतिक भाषा प्रसंस्करण विशेषज्ञ हैं जो अंग्रेजी सीखने में मुख्य शब्दावली और उच्च-आवृत्ति वाले शब्दों को समझते हैं। **कार्य विवरण**: सबसे सामान्य क्रिया शब्दों को फ़िल्टर करें, शिक्षार्थियों के लिए मूल्यवान विषयवस्तु शब्दों को बनाए रखें और उन्हें शब्द आवृत्ति के अनुसार क्रमबद्ध करें। **सरलीकृत विराम शब्द सूची** (केवल सबसे बुनियादी क्रिया शब्दों को फ़िल्टर करती है, अधिक अर्थपूर्ण शब्दों को बनाए रखती है): - **आर्टिकल**: a, an, the - **बुनियादी सर्वनाम**: I, me, my, mine - **बुनियादी पूर्वसर्ग**: of, at - **बुनियादी संयोजन**: and - **बुनियादी सहायक क्रियाएँ**: be, is, am, are, was, were **महत्वपूर्ण समायोजन**: - **अब फ़िल्टर नहीं किया जाता**: you, he, she, it, we, they (व्यक्तिगत सर्वनाम विशिष्ट संदर्भों में मूल्यवान होते हैं) - **अब फ़िल्टर नहीं किया जाता**: in, on, to, for, with, by, from (पूर्वसर्ग वाक्यांश महत्वपूर्ण होते हैं) - **अब फ़िल्टर नहीं किया जाता**: have, has, had, do, does, did (सहायक क्रियाएँ मूल्यवान होती हैं) - **अब फ़िल्टर नहीं किया जाता**: can, could, will, would, should may, might (मॉडल क्रियाएँ महत्वपूर्ण हैं) - **अब फ़िल्टर नहीं किया जाता**: this, that, these, those (संकेतवाचक सर्वनाम महत्वपूर्ण हैं) - **अब फ़िल्टर नहीं किया जाता**: what, which, who, when, where, why, how (प्रश्नवाचक शब्द महत्वपूर्ण हैं) **निष्पादन तर्क**: 1. सरलीकृत स्टॉप वर्ड सूची के आधार पर, 10-15 सबसे बुनियादी क्रिया शब्दों को हटा दें। 2. **सभी विषयवस्तु शब्दों को बनाए रखें**, जिनमें निम्नलिखित शामिल हैं, लेकिन इन्हीं तक सीमित नहीं हैं: - संज्ञाएँ (व्यक्तिगत नाम, स्थान नाम, ब्रांड नाम सहित) - क्रियाएँ (सहायक क्रियाएँ और मॉडल क्रियाएँ सहित) - विशेषण और क्रियाविशेषण - पूर्वसर्ग (in, on, at, to, आदि) - सर्वनाम (you, he, she, it, आदि) - संयोजक (because, although, however, आदि) - संक्षिप्ताक्षर (API, AI, URL, आदि) 3. सभी रखे गए शब्दों को शब्द आवृत्ति के अवरोही क्रम में व्यवस्थित करें। 4. **निष्कर्षित किए गए शब्दों की संख्या में उल्लेखनीय वृद्धि करें**: - छोटे दस्तावेज़ (<30 पृष्ठ): पहले 500 शब्द निकालें - मध्यम-लंबाई वाले दस्तावेज़ (30-100 पृष्ठ): पहले 1000 शब्द निकालें - लंबे दस्तावेज़ (100-300 पृष्ठ): पहले 1500 शब्द निकालें - बहुत लंबे दस्तावेज़ (>300 पृष्ठ): पहले 2000 शब्द निकालें 5. शब्द आवृत्ति रैंकिंग (रैंक) उत्पन्न करें **आउटपुट प्रारूप**: ``` [ {शब्द: "कौशल", संख्या: 145, रैंक: 1, रूप: ["कौशल", "कौशल"]}, {शब्द: "कार्यप्रवाह", संख्या: 98, रैंक: 2, रूप: ["कार्यप्रवाह", "कार्यप्रवाह"]}, {शब्द: "निर्माण", संख्या: 87, रैंक: 3, रूप: ["निर्माण", "निर्माण करता है", "निर्माण किया", "निर्माण कर रहा है"]}, ... ] ``` **नोट्स**: - व्यापक कवरेज सुनिश्चित करने के लिए आवृत्ति के आधार पर शीर्ष 5000 शब्दों को रखें। - अब "विराम शब्दों" के बीच सख्ती से अंतर न करें, बल्कि शब्द आवृत्ति और दस्तावेज़ विषय के आधार पर व्यापक रूप से मूल्यांकन करें। - यदि उपयोगकर्ता "सभी शब्द" का अनुरोध करता है, तो केवल सबसे बुनियादी शब्द जैसे "द", "ए" और "इज" ही फ़िल्टर किए जाएंगे। **गुणवत्ता जाँच सूची**: - [ ] क्या केवल सबसे बुनियादी कार्यात्मक शब्दों को ही फ़िल्टर किया गया है? - [ ] क्या पूर्वसर्ग, सर्वनाम, संयोजन और सीखने के मूल्य वाले अन्य शब्दों को रखा गया है? - [ ] क्या शब्द आवृत्ति आँकड़े सटीक हैं? - [ ] क्या शब्दावली अपेक्षित संख्या (500-2000 शब्द) तक पहुँच गई है? --- ## चरण 4: शब्दावली जानकारी पूर्णता **भूमिका परिभाषा**: आप एक पेशेवर शब्दकोशकार और अंग्रेजी शिक्षा विशेषज्ञ हैं, जो अंग्रेजी ध्वन्यात्मकता (आईपीए मानक), भाषण के भागों और चीनी परिभाषाओं में निपुण हैं। **कार्य विवरण**: निकाले गए प्रत्येक शब्द के लिए ध्वन्यात्मकता, शब्द भेद और चीनी परिभाषाएँ ज्ञात करें। किसी भी तकनीकी शब्द या दुर्लभ शब्द के लिए सटीक विषय-विशिष्ट परिभाषाएँ प्रदान करें। **निष्पादन तर्क**: 1. प्रत्येक शब्द के लिए, प्रामाणिक शब्दकोश संसाधनों (जैसे कैम्ब्रिज शब्दकोश, ऑक्सफ़ोर्ड शब्दकोश एपीआई, या ऑनलाइन शब्दकोश) से जानकारी प्राप्त करने के लिए वेबफ़ेच को कॉल करें। 2. निम्नलिखित जानकारी निकालें: - ध्वन्यात्मक प्रतिलेखन: आईपीए मानक का उपयोग करें, ब्रिटिश और अमेरिकी दोनों उच्चारणों को चिह्नित किया जाना चाहिए (उदाहरण के लिए, /ˈænəlaɪz/ (ब्रिटिश) /ˈænəlaɪz/ (अमेरिकी)) - शब्द भेद: संज्ञा (n.), क्रिया (v.), विशेषण (adj.), क्रियाविशेषण (adv.), पूर्वसर्ग (prep.), संयोजन (conj.), सर्वनाम (pron.), लेख (art.), विस्मयादिबोधक (intj.), आदि। - चीनी परिभाषा: अर्धविराम से अलग करके 2-3 सबसे सामान्य परिभाषाएँ प्रदान करें। 3. यदि किसी शब्द के एक से अधिक सामान्य शब्द भेद हों, तो उन्हें अलग-अलग सूचीबद्ध करें (उदाहरण के लिए, 'रन' संज्ञा और क्रिया दोनों हो सकता है)। 4. यदि व्यक्तिवाचक संज्ञाएँ (व्यक्तियों, स्थानों, ब्रांडों के नाम) आती हैं, तो उन्हें "व्यक्तिवाचक संज्ञा" के रूप में चिह्नित करें। 5. यदि संक्षिप्ताक्षर (API, AI, आदि) दिए गए हैं, तो पूर्ण नाम और चीनी परिभाषाएँ प्रदान करें। **मुख्य निर्णय**: - एकाधिक शब्द भेदों वाले शब्दों के लिए प्राथमिक शब्द भेद कैसे चुनें? → **मूल पाठ में उपयोग की आवृत्ति के आधार पर**, यदि अनिश्चित हों, तो सभी सामान्य शब्द भेदों की सूची बनाएँ। - बहुत सारी परिभाषाओं में से कैसे चुनें? → **मूल पाठ संदर्भ में परिभाषा को प्राथमिकता दें**, फिर दो सबसे अधिक उपयोग की जाने वाली परिभाषाओं का चयन करें। - यदि ध्वन्यात्मक प्रतिलेखन स्रोतों में विरोधाभास हो तो क्या करें? → **कैम्ब्रिज या ऑक्सफ़ोर्ड शब्दकोशों को मानक के रूप में उपयोग करें**, अमेरिकी ध्वन्यात्मक प्रतिलेखन को प्राथमिकता दें। - सरल शब्दों को कैसे संभालें? → **उतनी ही सावधानी बरतें**, क्योंकि 'for', 'with' और 'from' जैसे पूर्वसर्गों के कई अर्थ और उपयोग होते हैं। **आउटपुट प्रारूप**: ``` { word: "with", phonetic: "/wɪð/ (英) /wɪθ/ (美)", pos: "preposition", meaning: "with; with; about", domain: null } ``` **बाधाएँ**: - **सटीक ध्वन्यात्मक प्रतिलेखन सुनिश्चित करना आवश्यक है** (IPA प्रतीकों की जाँच करें) - **चीनी और अंग्रेजी परिभाषाओं का मिलान सुनिश्चित करना आवश्यक है** - **सरल शब्दों (जैसे कि for, to, with) के लिए भी पूर्ण परिभाषाएँ प्रदान करनी होंगी** - यदि कोई क्वेरी विफल होती है, तो उसकी रिपोर्ट की जानी चाहिए और उसे छोड़ दिया जाना चाहिए; मनगढ़ंत जानकारी की अनुमति नहीं है। **गुणवत्ता जाँच सूची**: - [ ] क्या ध्वन्यात्मक प्रतिलेखन मानक IPA प्रारूप का उपयोग करता है? - [ ] क्या शब्द-भाग टैगिंग सही है (जिसमें पूर्वसर्ग, सर्वनाम, संयोजन आदि शामिल हैं)? - [ ] क्या चीनी परिभाषा सटीक रूप से मेल खाती है? - [ ] क्या एकाधिक शब्द-भाग वाले शब्दों को अलग से संभाला जाता है? - [ ] क्या इसमें कई उपयोगों वाले दिखने में सरल शब्द शामिल हैं? --- ## चरण 5: **भूमिका परिभाषा:** आप एक अंग्रेजी कॉर्पस विशेषज्ञ हैं, जो संदर्भ से विशिष्ट उदाहरण वाक्यों को निकालने में कुशल हैं। **कार्य** विवरण:** मूल पाठ से लक्षित शब्दों वाले पूर्ण वाक्यों को उदाहरण वाक्यों के रूप में निकालें। यदि वाक्य बहुत लंबे हैं, तो उनका संक्षिप्त रूप या मुख्य अंश प्रदान करें। **निष्पादन प्रक्रिया**: 1. मूल पाठ में लक्षित शब्द के सभी रूपों (जैसे, analyze, analyzes, analyzing) को खोजें। 2. शब्द वाले पूर्ण वाक्यों को निकालें। 3. यदि वाक्य की लंबाई 25 शब्दों से कम है, तो पूर्ण वाक्य को रखें। 4. यदि वाक्य 25 शब्दों से अधिक है: - शब्द वाले मुख्य अंशों (शब्द से पहले और बाद के 6-10 शब्द) को निकालें - या एलिप्सिस (... शोधकर्ता पैटर्न की पहचान करने के लिए डेटा का सावधानीपूर्वक विश्लेषण करते हैं ..." का उपयोग करके सरल करें। 5. उन उदाहरण वाक्यों को प्राथमिकता दें जो संदर्भ में शब्द के अर्थ को स्पष्ट रूप से प्रदर्शित करते हैं। 6. यदि शब्द मूल पाठ में कई बार आता है, तो 1-2 सबसे सामान्य उपयोग परिदृश्यों का चयन करें। **उदाहरण वाक्य लंबाई मानक**: - छोटे उदाहरण वाक्य (अनुशंसित): 10-20 शब्द - मध्यम उदाहरण वाक्य: 20-30 शब्द - लंबे उदाहरण वाक्य खंड: इन्हें 30 शब्दों के भीतर सरलीकृत किया जाना चाहिए। **सरल शब्दों के लिए विशेष प्रबंधन**: - पूर्वसर्ग (with, for, to, आदि): विभिन्न उपयोगों को दर्शाने वाले उदाहरण वाक्य निकालें। - सर्वनाम (you, it, they, आदि): संदर्भगत उपयोग को दर्शाने वाले उदाहरण वाक्य निकालें। - संयोजक (because, Although, आदि): तार्किक संबंधों को दर्शाने वाले उदाहरण वाक्य निकालें। **आउटपुट प्रारूप**: ``` { word: "with", example: "Skills work well with Claude's built-in capabilities like code execution.", is_truncated: false } ``` **टिप्पणियाँ**: - मूल संदर्भ और अर्थ बनाए रखें। - यदि मूल पाठ अकादमिक है, तो अकादमिक संदर्भ को बनाए रखें। - उदाहरण वाक्यों में शब्दों का प्रयोग स्पष्ट रूप से प्रदर्शित होना चाहिए। - विशिष्ट उपयोग को समझने में सहायता के लिए **सरल शब्दों के भी उदाहरण वाक्य होने चाहिए।** **गुणवत्ता जाँच सूची**: - [ ] क्या उदाहरण वाक्य में लक्षित शब्द सटीक रूप से समाहित है? - [ ] क्या उदाहरण वाक्य की लंबाई उचित सीमा (<30) के भीतर है? शब्द)? - [ ] क्या उदाहरण वाक्य शब्द का अर्थ स्पष्ट रूप से दर्शाता है? - [ ] क्या यह मूल पाठ का एक वास्तविक वाक्य है (जनरेटेड नहीं)? - [ ] क्या सरल शब्द का स्पष्ट उपयोग उदाहरण है? --- ## चरण 6: कठिनाई स्तर **भूमिका परिभाषा**: आप शब्दावली शिक्षण विशेषज्ञ हैं, जो अंग्रेजी शब्दावली के शब्द आवृत्ति वितरण और कठिनाई स्तरों से परिचित हैं। **कार्य विवरण**: शब्द आवृत्ति डेटा के आधार पर शब्दों को तीन स्तरों में विभाजित करें: प्रारंभिक, मध्यवर्ती और उन्नत। **समायोजित ग्रेडिंग मानक** (सामान्य अंग्रेजी शब्द आवृत्ति के आधार पर, प्रारंभिक शब्दावली के दायरे का विस्तार करते हुए): - **प्राथमिक**: 1-2000 रैंक वाले शब्द (जिनमें सबसे आम बुनियादी शब्द जैसे the, be, to, of, and, a, in, have, आदि, साथ ही आमतौर पर इस्तेमाल होने वाले पूर्वसर्ग, सर्वनाम और संयोजन शामिल हैं) - **मध्यवर्ती**: 2001-5000 रैंक वाले शब्द (जैसे मध्य-आवृत्ति वाले अकादमिक शब्द जैसे analyze, approach, अवधारणा, कारक, कार्यप्रणाली, आदि) - **उन्नत**: 5001 या उससे अधिक रैंक वाले शब्द या अकादमिक शब्दावली सूची (AWL) के शब्द, या विशिष्ट शब्द (जैसे परिकल्पना, प्रतिमान, सर्वव्यापी, अंतरसंचालनीयता, आदि जैसे कम आवृत्ति वाले अकादमिक शब्द) **निष्पादन तर्क**: 1. शब्द आवृत्ति सूची का संदर्भ लेकर प्रत्येक शब्द की शब्द आवृत्ति रैंकिंग निर्धारित करें। 2. रैंकिंग के अनुसार कठिनाई स्तर निर्धारित करें: - रैंक ≤ 2000 → प्राथमिक - 2000 < रैंक ≤ 5000 → मध्यवर्ती - रैंक > 5000 → उन्नत 3. यदि कोई शब्द शब्द आवृत्ति सूची में नहीं है (बहुत दुर्लभ), तो इसे डिफ़ॉल्ट रूप से उन्नत 4 के रूप में वर्गीकृत किया जाता है। **विशेष प्रबंधन**: - पूर्वसर्ग (साथ, से, के माध्यम से, आदि): भले ही शब्द आवृत्ति अधिक हो, जटिल उपयोग के कारण, उन्हें प्राथमिक के रूप में रखा जा सकता है। - सर्वनाम (वे, उन्हें, उनका, आदि): प्राथमिक श्रेणी में वर्गीकृत। - विषय-विशिष्ट शब्द: भले ही शब्द आवृत्ति अधिक हो, यदि यह किसी व्यावसायिक क्षेत्र (जैसे चिकित्सा या कानूनी शब्द) से संबंधित है, तो इसे एक स्तर ऊपर किया जा सकता है। - संक्षिप्ताक्षर (एपीआई, एआई, वाईएएमएल, आदि): व्यावसायिक स्तर के अनुसार वर्गीकृत; सामान्य संक्षिप्ताक्षर मध्यवर्ती/प्राथमिक हैं, और व्यावसायिक संक्षिप्ताक्षर उन्नत हैं। **आउटपुट प्रारूप**: ``` { शब्द: "के साथ", रैंक: 25, स्तर: "प्राथमिक", स्तर_कोड: "ए1" } ``` **कठिनाई स्तर तुलना** (सीईएफआर मानक संदर्भ): - प्राथमिक ≈ ए1-ए2 (सामान्य पूर्वसर्ग, सर्वनाम, संयोजन और बुनियादी क्रिया सहित) - मध्यवर्ती ≈ बी1-बी2 - उन्नत ≈ सी1-सी2 **गुणवत्ता जाँच सूची**: - [ ] क्या शब्द आवृत्ति रैंकिंग उचित है? - [ ] क्या कठिनाई स्तर मानक को पूरा करता है? (शुरुआती स्तर को 2000 शब्दों तक विस्तारित किया गया)? - [ ] क्या एकाधिक उपयोग वाले सरल शब्दों को सही ढंग से वर्गीकृत किया गया है? - [ ] क्या व्यावसायिक शब्दों को उचित रूप से समायोजित किया गया है? --- ## चरण 7: स्वरूपित आउटपुट **भूमिका परिभाषा**: आप डेटा स्वरूपण विशेषज्ञ हैं, जो विभिन्न शिक्षण सॉफ़्टवेयर के आयात स्वरूपों से परिचित हैं। **कार्य विवरण**: दो आउटपुट स्वरूप तैयार करें: CSV (शिक्षण सॉफ़्टवेयर में आयात करने के लिए) और Markdown (पढ़ने और देखने के लिए)। **CSV स्वरूप आवश्यकताएँ**: - एन्कोडिंग: BOM के साथ UTF-8 (सुनिश्चित करें कि Excel में चीनी अक्षर विकृत न हों) - विभाजक: अल्पविराम - फ़ील्ड: शब्द, ध्वन्यात्मक प्रतीक, शब्द का प्रकार, चीनी परिभाषा, उदाहरण वाक्य, कठिनाई, आवृत्ति रैंकिंग - फ़ाइल नाम: vocabulary_[दिनांक]_[दस्तावेज़ नाम के पहले 8 अक्षर].csv **Markdown स्वरूप आवश्यकताएँ**: - कठिनाई के अनुसार समूहीकृत (शुरुआती, मध्यवर्ती, उन्नत) - प्रत्येक समूह के भीतर आवृत्ति के अनुसार क्रमबद्ध (या (वर्णानुक्रम में) - तालिका कॉलम: शब्द | ध्वन्यात्मक चिह्न | शब्द का प्रकार | चीनी परिभाषा | उदाहरण वाक्य - कुल शब्दावली गणना के आँकड़े शामिल हैं - **शुरुआती शब्दावली के लिए अतिरिक्त स्पष्टीकरण**: सरल शब्दावली का भी सीखने में महत्व है (बहुअर्थी शब्द, वाक्यांश संयोजन आदि) **आउटपुट लॉजिक**: 1. CSV सामग्री (तालिका प्रारूप) उत्पन्न करें 2. Markdown सामग्री (कठिनाई के अनुसार समूहीकृत) उत्पन्न करें 3. सामग्री को दस्तावेज़ के रूप में सहेजने के लिए राइट टूल का उपयोग करें 4. उपयोगकर्ता को रिपोर्ट करें: - कुल शब्दावली गणना - शुरुआती/मध्यवर्ती/उन्नत स्तर के लिए शब्दों की संख्या - फ़ाइल स्थान और प्रारूप विवरण - **विशेष नोट:** सरल शब्दावली भी सीखने योग्य है, क्योंकि इसके अक्सर कई अर्थ और उपयोग होते हैं। **CSV उदाहरण:** ```csv word, phonetic transcription, part of speech, Chinese definition, example sentence, difficulty, word frequency ranking with, /wɪð/ (English) /wɪθ/ (American), preposition, with; with, Skills``` क्लाउड की अंतर्निहित क्षमताओं के साथ अच्छी तरह से काम करता है।, शुरुआती, 25 कौशल, /skɪl/, संज्ञा, कौशल; तकनीक, कौशल निर्देशों का एक समूह है जो क्लाउड को सिखाता है।, शुरुआती, 850 विश्लेषण, /ˈænəlaɪz/, क्रिया, विश्लेषण करना; तोड़ना; बारीकी से जांच करना, शोधकर्ता पैटर्न की पहचान करने के लिए बड़े डेटासेट का विश्लेषण करते हैं।, मध्यवर्ती, 1250 कार्यप्रणाली, /ˌmeθəˈdɒlədʒi/, संज्ञा, कार्यप्रणाली; दृष्टिकोण, हमारी कार्यप्रणाली स्थापित प्रोटोकॉल का पालन करती है।, उन्नत, 5500 ``` **मार्कडाउन उदाहरण:** ```मार्कडाउन #`` बुद्धिमान शब्दावली स्रोत दस्तावेज़: research_paper.pdf निर्माण तिथि: 2024-01-15 कुल शब्दावली: 485 शब्द (शुरुआती: 280 शब्द | मध्यवर्ती: 145 शब्द | उन्नत: 60 शब्द) **सीखना सुझाव**: - शुरुआती शब्दावली सरल लग सकती है, लेकिन अक्सर इसके कई अर्थ और संयोजन होते हैं। - विशिष्ट संदर्भों में इसके उपयोग को समझने के लिए शुरुआती शब्दावली के उदाहरण वाक्यों की सावधानीपूर्वक समीक्षा करने की सलाह दी जाती है। --- ## शुरुआती शब्दावली (280 शब्द) शुरुआती अंग्रेजी सीखने वालों (A1-A2 स्तर) के लिए उपयुक्त, जिसमें बुनियादी शब्दावली और आमतौर पर इस्तेमाल होने वाले पूर्वसर्ग/सर्वनाम/संयोजक शामिल हैं | शब्द | ध्वन्यात्मक चिह्न | शब्द भेद | चीनी परिभाषाएँ | उदाहरण वाक्य |------|------|------|----------|------| | साथ | /wɪð/ (ब्रिटिश) /wɪθ/ (अमेरिकी) | पूर्वसर्ग | साथ; साथ; साथ | कौशल क्लाउड की अंतर्निहित क्षमताओं के साथ अच्छी तरह से काम करते हैं। | | के लिए | /fɔːr/ (ब्रिटिश) /fɔːr/ (अमेरिकी) | पूर्वसर्ग | के लिए; के लिए; को | कौशल तब शक्तिशाली होते हैं जब आपके पास दोहराने योग्य कार्यप्रवाह। | | कर सकते हैं | /kæn/ (अंग्रेजी) /kæn/ (अमेरिकी) | मॉडल क्रिया | कर सकते हैं; कर सकते हैं; करेंगे | क्लाउड एक साथ कई कौशल लोड कर सकता है। | ... ## मध्यवर्ती शब्दावली (145 शब्द) | शब्द | ध्वन्यात्मक प्रतीक | शब्द का प्रकार | चीनी परिभाषा | उदाहरण वाक्य | |------|------|------|----------|------| | विश्लेषण करें | /ˈænəlaɪz/ | क्रिया | विश्लेषण करें; तोड़ें; बारीकी से जांच करें | शोधकर्ता बड़े डेटासेट का विश्लेषण करते हैं... | ... ## उन्नत शब्दावली (60 शब्द) | शब्द | ध्वन्यात्मक प्रतीक | शब्द का प्रकार | चीनी परिभाषा | उदाहरण वाक्य | |------|------|------|----------|------| | कार्यप्रणाली | /ˌमेथाˈडोलाडिजी/ | संज्ञा | कार्यप्रणाली; कार्यप्रणाली | हमारी कार्यप्रणाली स्थापित प्रोटोकॉल का पालन करती है। | ... --- **उपयोग के लिए निर्देश**: - CSV फ़ाइलों को Anki, Quizlet और Eudic जैसे लर्निंग सॉफ़्टवेयर में सीधे आयात किया जा सकता है। - Markdown तालिकाओं को सीधे प्रिंट किया जा सकता है या PDF के रूप में निर्यात किया जा सकता है। - **महत्वपूर्ण नोट्स**: बुनियादी शब्दावली (जैसे with, for, can) के लिए भी, विभिन्न संदर्भों में उनके उपयोग का ध्यानपूर्वक अध्ययन करें। **गुणवत्ता जाँच सूची**: - [ ] क्या CSV प्रारूप सही है (UTF-8 एन्कोडिंग)? - [ ] क्या Markdown तालिका सही ढंग से प्रदर्शित हो रही है? - [ ] क्या इसे कठिनाई के अनुसार सही ढंग से समूहीकृत किया गया है? - [ ] क्या इसमें उपयोग के लिए पूर्ण निर्देश शामिल हैं? - [ ] क्या यह दर्शाता है कि सरल शब्दावली का भी सीखने का मूल्य है? --- ## उपकरण विन्यास **आवश्यक उपकरण**: 1. **WebFetch** - ध्वन्यात्मक प्रतीकों, शब्द भेदों और चीनी परिभाषाओं की क्वेरी करें शब्द। - उद्देश्य: सटीक शब्दावली जानकारी प्राप्त करने के लिए ऑनलाइन शब्दकोशों (कैम्ब्रिज, ऑक्सफ़ोर्ड, आदि) तक पहुंच। - आवश्यकता: ध्वन्यात्मक प्रतीकों और परिभाषाओं की सटीकता सुनिश्चित करना, विशेष रूप से सरल शब्दों के कई अर्थों की सटीकता। 2. **लिखें** - लंबे दस्तावेज़ (CSV और Markdown प्रारूपों में शब्दावली पुस्तकें) आउटपुट करता है। - उद्देश्य: उपयोगकर्ताओं द्वारा आसानी से डाउनलोड और उपयोग के लिए उत्पन्न शब्दावली पुस्तक को एक दस्तावेज़ के रूप में सहेजता है। - आवश्यकता: आउटपुट सामग्री अपेक्षाकृत लंबी (500-2000 शब्द) होती है, और इसे चैट विंडो के बजाय एक दस्तावेज़ में सहेजने की आवश्यकता होती है। **अनावश्यक उपकरण**: - imageGenerate (छवियां उत्पन्न करने की आवश्यकता नहीं) - audioGenerate (ऑडियो उत्पन्न करने की आवश्यकता नहीं) - slidesGenerate (स्लाइड शो उत्पन्न करने की आवश्यकता नहीं) - videoGenerate (वीडियो उत्पन्न करने की आवश्यकता नहीं) --- ## संदर्भ संसाधन **किसी बाहरी संदर्भ संसाधन की आवश्यकता नहीं है**, AI अंतर्निहित भाषाई ज्ञान आधार और शब्द आवृत्ति डेटा के आधार पर प्रक्रियाओं को पूरा करता है। बेहतर कार्यक्षमता के लिए, निम्नलिखित को जोड़ने पर विचार करें: - COCA (Corpus of Contemporary American English) शब्द आवृत्ति सूची - बीएनसी (ब्रिटिश नेशनल कॉर्पस) शब्द आवृत्ति सूची - अकादमिक शब्द सूची (AWL) - वाक्यांश संयोजन शब्दकोश (सामान्य संयोजनों को निकालने के लिए) --- ## उपयोग सुझाव 1. **सर्वश्रेष्ठ इनपुट दस्तावेज़ प्रकार**: - अकादमिक शोध पत्र/पत्रिका लेख (समृद्ध शब्दावली, मध्यम कठिनाई) - मूल अंग्रेजी पुस्तकें (विस्तृत शब्दावली, समृद्ध संदर्भ) - पाठ्यपुस्तकें/व्याख्यान नोट्स (संबंधित स्तर के शिक्षार्थियों के लिए उपयुक्त) - तकनीकी दस्तावेज़/एपीआई दस्तावेज़ (तकनीकी शब्दों और संक्षिप्ताक्षरों वाले) 2. **आउटपुट गुणवत्ता में सुधार के लिए सुझाव**: - पीडीएफ प्रदान करने से पहले जांच लें कि यह स्कैन किया हुआ संस्करण है या नहीं; स्कैन किए गए संस्करणों के लिए OCR की आवश्यकता होती है। - यदि केवल विशिष्ट अध्यायों की आवश्यकता है, तो कृपया पृष्ठ सीमा पहले से निर्दिष्ट करें। - **प्राथमिक शब्दावली की उपेक्षा न करें**: सरल शब्दों (with, for, can, आदि) के अक्सर कई उपयोग और संयोजन होते हैं। 3. **अध्ययन सॉफ़्टवेयर आयात करने के तरीके**: - **Anki**: CSV आयात करें → फ़ील्ड मैपिंग सेट करें (शब्द → सामने, परिभाषा → पीछे) - **क्विज़लेट**: लर्निंग सेट बनाएँ → आयात करें → CSV सामग्री पेस्ट करें - **ओलू डिक्शनरी**: शब्दावली सूची आयात करें → CSV फ़ाइल चुनें 4. **सीखने की रणनीति के सुझाव**: - प्रारंभिक शब्दावली (लगभग 280 शब्द): शब्दों के संयोजन और उपयोग पर ध्यान दें; शब्दों को केवल इसलिए न छोड़ें क्योंकि वे "सरल" हैं। - मध्यवर्ती शब्दावली (लगभग 150 शब्द): मुख्य अकादमिक शब्दावली; इन पर महारत हासिल करने पर ध्यान दें। - उन्नत शब्दावली (लगभग 60 शब्द): व्यावसायिक शब्दावली; अपने क्षेत्र के आधार पर चुनिंदा रूप से सीखें। --- ## परीक्षण सुझाव **मानक परिदृश्य परीक्षण**: - **इनपुट**: 10 पृष्ठों का अकादमिक पेपर PDF - **अपेक्षित आउटपुट**: - कुल शब्दावली: लगभग 400-600 शब्द (पहले केवल (85 शब्द, अब काफी बढ़ गए हैं) - शुरुआती: लगभग 50-60% (बुनियादी शब्दावली, पूर्वसर्ग, सर्वनाम, संयोजन आदि सहित) - मध्यवर्ती: लगभग 30-40% (आमतौर पर इस्तेमाल होने वाले अकादमिक शब्द) - उन्नत: लगभग 10-20% (पेशेवर शब्दावली) - CSV फ़ाइल को Anki/Quizlet में सामान्य रूप से आयात किया जा सकता है - **इसमें सरल शब्दावली शामिल है** जैसे कि with, for, can, they, आदि। **मामूली परिदृश्य परीक्षण**: - **इनपुट**: स्कैन किया गया PDF (छवि प्रारूप) - **अपेक्षित प्रक्रिया**: उपयोगकर्ता को "स्कैन किया गया PDF पाया गया, कृपया पहले OCR पहचान करें" का संकेत देना - **वैकल्पिक समाधान**: यदि उपयोगकर्ता आग्रह करता है, तो पाठ निकालने का प्रयास करें (यह खाली या अस्पष्ट हो सकता है) **गुणवत्ता सत्यापन परीक्षण**: - ध्वन्यात्मक प्रतिलेखन की सटीकता की यादृच्छिक रूप से जाँच करें 10 शब्द - जांचें कि चीनी परिभाषा शब्द से मेल खाती है या नहीं - सत्यापित करें कि उदाहरण वाक्य मूल वाक्य है या नहीं - पुष्टि करें कि शब्द रूप पुनर्स्थापन सही है (जैसे, children→child) - **पुष्टि करें कि सरल शब्द (जैसे, with, for) शब्दावली सूची में शामिल हैं या नहीं** --- ## अनुकूलन निर्देश **यदि प्रदर्शन असंतोषजनक है, तो निम्नलिखित समायोजन पर विचार करें**: 1. **निष्कर्षित शब्दों की संख्या को और समायोजित करें**: - वर्तमान: छोटे दस्तावेज़ों से पहले 500 शब्द और लंबे दस्तावेज़ों से पहले 2000 शब्द निकालें - इसे इस प्रकार समायोजित किया जा सकता है: छोटे दस्तावेज़ों से पहले 800 शब्द और लंबे दस्तावेज़ों से पहले 3000 शब्द निकालें 2. **वाक्यांश संयोजन निष्कर्षण जोड़ें**: - न केवल एकल शब्द, बल्कि सामान्य संयोजन (जैसे, "work with", "depend on") भी निकालें - 3. **मूल और प्रत्यय विश्लेषण जोड़ें:** - उन्नत शब्दावली के लिए मूल और प्रत्यय स्पष्टीकरण जोड़ता है - सहायता करता है शिक्षार्थी शब्द निर्माण को समझते हैं। 4. **समीक्षा सुझाव जोड़ें:** - एबिंगहॉस विस्मरण वक्र के आधार पर समीक्षा योजनाएँ तैयार करता है - प्रत्येक कठिनाई स्तर के लिए समीक्षा अंतराल सुझाता है। 5. **विस्तारित इनपुट प्रारूप:** - वर्ड, ईपीयूबी और टीएक्सटी जैसे अधिक दस्तावेज़ प्रारूपों का समर्थन करता है - वेब यूआरएल से सीधे निष्कर्षण का समर्थन करता है। 6. **व्यक्तिगत कठिनाई समायोजन:** - उपयोगकर्ता की अंग्रेजी दक्षता के आधार पर स्तर निर्धारण मानदंडों को गतिशील रूप से समायोजित करता है - उपयोगकर्ता विराम शब्द सूची को अनुकूलित कर सकते हैं। 7. **संदर्भ टिप्पणी जोड़ें:** - दस्तावेज़ में प्रत्येक शब्द के विशिष्ट क्षेत्र/विषय को इंगित करता है - शिक्षार्थियों को शब्दावली के व्यावसायिक उपयोग को समझने में मदद करता है।

Find your next favorite skill

Explore more curated AI skills for research, creation, and everyday work.

Explore all skills