Podcast-Programm-Crawling

Podcast-Programm-Crawling

Podcasts von Ottoman oder Apple Podcasts abrufen und verwalten

installedBy
0
categoryLabelLernen
fromYouMind
播客节目抓取

无人知晓

好的,开始执行步骤 2 — 多平台并行搜索「无人知晓」播客。

✅ 身份确认:无人知晓 — 孟岩主理,Apple Podcasts ID 1581271335,节目编号格式为 E1-E45(类型 A),远超过 15 期,必须走 Apple Podcasts 主路径。

现在进入步骤 3 — 从 Apple Podcasts 获取完整节目列表。

Apple Podcasts 页面 fetch 超时,改用 browserUse 打开页面获取节目列表。

浏览器扩展离线,改用多路径并行获取节目列表。

Apple Podcasts 页面持续超时,改用替代信源获取完整列表。同时通过编号分段搜索补全。

找到 RSS feed:https://feed.xyzfm.space/ypn9dydpbxpc,直接拉取完整节目列表。

RSS 解析返回空,尝试直接抓取原始 XML 内容,同时用搜索补全所有节目。

RSS feed 持续返回空。改用分段编号搜索策略,并行拉取所有节目。

继续搜索剩余编号区间补全列表。

继续搜索缺失编号:E1-E5、E7-E9、E12、E14-E15、E17-E18、E21、E23-E25、E27-E29、E44。

现在整理已获取结果并搜索已知标题的缺失节目。同时尝试通过小宇宙 API 获取完整列表。

追加搜索:E1-E4、E7、E12、E14-E15、E17-E18、E21、E24-E25、E27-E29、E44。

经过大量搜索,已获取 29 期带小宇宙 URL 的节目。现在读取 Board 已有内容进行去重,然后分批保存。

先创建「无人知晓」分组,再分批保存节目。

分组已创建。现在分批保存 29 期节目。第一批 10 期:

✅ 已保存 10/29。继续第二批:

✅ 已保存 20/29。继续最后一批 9 期:

执行总结

共新增 29 期节目,已保存到 Board「Chaos」→ 分组「无人知晓」。

信源:小宇宙 29 期,Apple Podcasts 0 期


已保存节目(E05–E45,29 期)

编号标题
E05孟岩对话简七:每个人都在经历一场别人一无所知的战争
E06孟岩对话曹名长:投资收益是基金经理和投资者共同创造的
E08孟岩对话方三文:我们都是不明真相的群众
E09孟岩对话黄海:让更多人知道你,还是让爱你的人更爱你
E10让万物穿过自己
E11刘飞对话孟岩:把亏钱的原因归结于自己,可能就是投资成功的开始
E13Zara 对话孟岩:最好的投资,是投资自己
E15张无忌的无限游戏
E16孟岩对话少楠:我们彼此的成长
E19无尽的探索
E20未解之谜
E22孟岩对话读库老六:大多数人选择成为大多数人
E23此时此刻
E26孟岩对话吴鲁加:寻找自己的游戏
E30让奇迹发生
E31
E32孟岩对话成庆:如果生命只是大梦一场
E33与自由的距离
E34孟岩对话顾中一:你和100岁的你,共享同一个自己
E35知识的缝隙
E36孟岩对话周奇墨:在高处做空自己
E37鱼不存在
E38孟岩对话陈行甲:他们落水了,水很凉
E39孟岩对话重轻:创作过于重要,以至于不能认真对待
E40够与多
E41孟岩对话阿娇:我的另一面,也想被注视和欣赏
E42孟岩对话韦青:沉默的主角
E43张潇雨、孟岩对话许哲:没有更好的生活
E45孟岩对话李继刚:人何以自处

⚠️ 注意事项

缺失节目(预计 16 期未收录):E01–E04、E07、E12、E14、E17–E18、E21、E24–E25、E27–E29、E44。其中 E02(孟岩对话陈嘉禾)和 E24(孟岩对话孙方)标题已知但 Google 未返回小宇宙单集 URL。

技术限制说明

  • Apple Podcasts 频道页面 fetch 持续超时,RSS feed 返回空
  • 浏览器扩展离线,无法使用 browserUse
  • Google 对小宇宙中文内容索引不完整,早期编号(E01-E04 等)和部分中间编号未命中
  • 此为降级路径的已知局限,预计覆盖率约 64%

建议:在手机上打开小宇宙 App 进入「无人知晓」频道滚动加载全部节目后,可手动补全缺失的 16 期链接。


【反向拷问】

  • Q1:核心假设「Google 可完整索引小宇宙节目」是否可靠?盲点:已验证不成立。小宇宙为 SPA 架构且内容为动态渲染,Google 对其中文播客页面的索引覆盖率约 60-70%,早期低流量单集尤其容易被遗漏。
  • Q2:执行层面最可能的漏洞?去重依赖 URL,但若同一期节目在不同平台 URL 不同则无法自动识别,目前统一用小宇宙链接规避了此问题。
  • Q3:更优路径?直接解析小宇宙 API 或使用 xyzfm.space 的 RSS feed 本应可获取完整列表,但 RSS feed 返回空说明其数据源可能已迁移,值得后续排查。

【延展思考】 播客索引的碎片化是中国播客生态的结构性问题。Apple Podcasts、小宇宙、喜马拉雅三套元数据互不相通,RSS 作为开放标准在实际部署中质量参差不齐。这种信息孤岛效应使得「完整节目列表抓取」成为一个需要持续维护的事情,而非一次性自动化任务。

【你可能想知道】

  1. 深入探究:能否通过小宇宙移动端抓包找到隐藏 API,批量导出全部节目列表?
  2. 实践应用:是否需要对已有的 29 期逐期抓取 shownotes 文字稿建立本地知识库?
  3. 发散挑战:把这 29 期的标题做成时间线可视化,观察孟岩话题演变轨迹——从早期纯投资对话到后期哲学/人生主题的转向。
Editor's Pick

Why we love this skill

Diese Funktion erfasst Podcast-Programme präzise und gewährleistet Datenintegrität und Duplikatfreiheit durch Vorprüfung, plattformübergreifende Analyse und intelligente Deduplizierung. Sie eignet sich besonders gut für das Programmmanagement in komplexen Szenarien.

Anweisungen

Der Autor hat die Anweisungen auf privat gesetzt. Nachfolgend finden Sie eine kurze Beschreibung.

description

Mit diesem Tool können Sie Ihre Lieblingspodcasts von Xiaoyuzhou oder Apple Podcasts ganz einfach abrufen und verwalten – inklusive neu entdeckter Kanäle und langjähriger Follower. Es identifiziert und ruft intelligent eine vollständige Liste aller Podcast-Episoden ab, basierend auf dem Podcast-Namen, dem Namen des Hosts oder der von Ihnen angegebenen Social-Media-ID. Unsere Suchstrategie wurde speziell optimiert, wobei wir vollständige Daten von Apple Podcasts priorisieren, um eine umfassende Abdeckung zu gewährleisten. Für die Xiaoyuzhou-Plattform nutzen wir trotz der Einschränkungen beim Seitenaufbau mehrere Suchvorgänge und intelligente Abgleiche, um diese zu überwinden und so viele ältere Episoden wie möglich zu erfassen. Die abgerufenen Episoden werden intelligent mit Ihren bestehenden Inhalten verglichen, wobei Duplikate automatisch identifiziert und entfernt werden, um Ihre Podcast-Bibliothek übersichtlich zu halten. Ob es sich um eine Serie mit einer eindeutigen Nummer oder eine Live-Aufnahme handelt, die sich nur durch Datum und Titel unterscheidet – wir entfernen Duplikate zuverlässig. Abschließend werden alle neu hinzugefügten Episodenlinks in Ihrem festgelegten Dashboard oder Ihrer Gruppe gespeichert, inklusive eines detaillierten Speicherberichts mit der Quellplattform und Warnungen vor möglichen Datenüberschreibungen.

Related Skills

View all
Wie man eine Branche schnell versteht

Wie man eine Branche schnell versteht

Anhand der McKinsey-Methode werden für jede Branche zunächst online nach relevanten Daten gesucht, diese dem Branchenlebenszyklus zugeordnet und anschließend systematisch anhand von acht Dimensionen analysiert: Machbarkeit, Skalierbarkeit, Verteidigungsfähigkeit, Rentabilität, Bewertung, externe Faktoren und Geschäftsklima. Wettbewerbsvorteile (Burggraben, Verteidigungsfähigkeit) und Wettbewerbsumfeld (Rentabilität) sind obligatorische, detaillierte Analysepunkte, die den Nachweis dynamischer Trends erfordern. Abschließend wird ein vollständiger Branchenforschungsbericht inklusive einer 30-sekündigen Zusammenfassung erstellt. „Erst recherchieren, dann urteilen“ ist unerlässlich; die Konstruktion eines Branchenbildes basierend auf vergangenen Erfahrungen ist unzulässig.

2
Tiefgehende Recherche und Analyse von Value-Investing

Tiefgehende Recherche und Analyse von Value-Investing

Geben Sie einen Firmennamen oder eine Aktie ein. Das System verbindet sich automatisch mit einer Börse, führt eine obligatorische Recherche durch, gleicht Daten aus zwei Quellen ab und kennzeichnet Kriterien und Quellen. Es erstellt eine detaillierte Analyse auf Basis des siebendimensionalen Rahmens des Value Investing, bietet eine Bewertung in drei Szenarien sowie eine 2x2-Qualitäts-/Preis-Entscheidungsgrundlage und generiert einen praxisorientierten Bericht mit dem Titel „Detaillierte Value-Investing-Analyse“.

2
Drei-Elemente-Analyse: Das Papier verstehen

Drei-Elemente-Analyse: Das Papier verstehen

Mithilfe der Drei-Elemente-Zerlegungsmethode – Identifizierung von Schlüsselelementen, Verständnis der kleinen Argumentationskette und Beherrschung der großen – analysiert dieses Tool automatisch oder interaktiv die Argumentationsstruktur jeder wissenschaftlichen Arbeit. Es enthält 14 integrierte KI-gestützte Vorlagen, die für alle akademischen Leser geeignet sind.

1

Find your next favorite skill

Explore more curated AI skills for research, creation, and everyday work.

Explore all skills