Bio/Med深度可靠调研

适用场景:完成一轮生物/生物医学类科研文献检索并给用户提供详实可靠的输出 1. 用户发起检索后系统拆解问题和关键词 2. 使用公开、可复现的数据源检索文献 3. 对检索结果进行去重、分层、证据分级和排序 4. 回复中使用可点击正文引用 5. 文末逐条列出完整文献信息,并用公开可查路线标注 IF;如果无法高置信核验,必须标为“待核验”或“未检出”。

installedBy
7
Bio/Med深度可靠调研 preview 1
Bio/Med深度可靠调研 preview 2
编辑精选
Y

精选自

YouMind

为什么我们推荐这个技能

这项技能是生物医学研究的可靠指南,通过结构化查询、多阶段文献筛选和严谨的IF核查,确保提供高度准确且可验证的科研信息。

分类

research

工具

指令

这套流程的核心是:先用多 query 在 PubMed / NCBI E-utilities 做可复现初筛,再用 PMID 去重和摘要证据分级;只有少量关键文献进入 PMC / BioC 全文复核;正文引用必须可点击;文末必须列完整文献信息;IF 只能通过公开可访问来源保守核查,不能默认有 JCR 或本地数据库,不能猜,不能把低置信匹配当成确定结果。

1. 用户发起检索后的预处理

1.1 先解析用户问题

收到用户问题后,先把自然语言问题拆成结构化要素。

必须识别:

• 研究对象:基因、蛋白、药物、通道、细胞类型、组织、疾病、模型。

• 生物系统:人、小鼠、大鼠、斑马鱼、类器官、视网膜、脑区、细胞系等。

• 关系类型:表达、调控、功能、机制、表型、死亡、生存、治疗、毒性、发育、退化等。

• 证据需求:是否需要直接证据、机制证据、全文证据、图表、剂量参数、实验方法。

• 时间范围:不限时间、近 5 年、近 1 年、最新进展、经典文献。

• 输出类型:简答、代表文献、综述式总结、实验设计建议、证据表、机制图谱。

示例:

用户问题:

“帮我找视网膜类器官死亡相关文献。”

结构化拆解(示例):

• 核心模型:retinal organoid, retina organoid, hPSC-derived retinal organoid, optic cup organoid。

• 表型:cell death, apoptosis, degeneration, survival loss, stress, necrosis。

• 相关细胞:photoreceptor, cone, rod, retinal ganglion cell, Müller glia。

• 潜在机制:oxidative stress, ER stress, mitochondrial dysfunction, hypoxia, inflammation, ferroptosis, necroptosis。

• 证据目标:优先找直接在人源或动物源 retinal organoid 中观察到细胞死亡/凋亡/退化的原始研究;再找间接机制文献。

1.2 关键词拆分原则(示例)

不要只写一个检索式。每个概念至少准备三类词。

第一类:精确词。

• retinal organoid

• retina organoid

• human retinal organoid

• hPSC-derived retinal organoid

• iPSC-derived retinal organoid

第二类:同义词和上位词。

• optic cup organoid

• 3D retinal culture

• stem cell-derived retina

• retinal differentiation

• retinal tissue model

第三类:机制和表型词。

• apoptosis

• cell death

• degeneration

• survival

• stress

• oxidative stress

• ER stress

• mitochondrial dysfunction

• hypoxia

• necroptosis

• ferroptosis

如果用户限定细胞类型,加入:

• photoreceptor

• cone

• rod

• retinal ganglion cell

• Müller glia

• bipolar cell

• amacrine cell

如果用户限定物种或来源,加入:

• human

• mouse

• rat

• zebrafish

• hESC

• iPSC

• pluripotent stem cell

1.3 生成分层检索式

至少生成 3–6 组 query。每组 query 对应一个检索目的。

第一层:直接证据检索。

用于找目标模型 + 目标表型直接命中的文献。

```text

("retinal organoid" OR "retina organoid" OR "human retinal organoid") AND (apoptosis OR "cell death" OR degeneration)

```

第二层:扩展模型检索。

用于捕捉作者没有使用 retinal organoid 精确词但实际相关的文献。

```text

("optic cup organoid" OR "3D retinal culture" OR "stem cell-derived retina") AND (survival OR apoptosis OR stress)

```

第三层:机制专项检索。

用于验证具体通路或机制。

```text

("retinal organoid" OR "retina organoid") AND ("oxidative stress" OR "ER stress" OR hypoxia OR mitochondria)

```

第四层:细胞类型专项检索。

```text

("retinal organoid" OR "retina organoid") AND (photoreceptor OR cone OR rod OR "retinal ganglion cell") AND (death OR apoptosis OR degeneration)

```

第五层:疾病模型检索。

```text

("retinal organoid" OR "retina organoid") AND (disease OR degeneration OR dystrophy OR retinitis OR glaucoma)

```

第六层:综述/背景检索。

```text

("retinal organoid" OR "retina organoid") AND (review OR protocol OR model)

```

研究

2. 使用什么方法、在什么网站检索

2.1 首选:PubMed / NCBI E-utilities

PubMed 是生物医学文献检索首选。不要默认抓 PubMed 网页。应使用 NCBI E-utilities API。

2.1.1 ESearch:用 query 获取 PMID

接口:

```text

https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi

```

参数:

```text

db=pubmed

term=<检索式>

retmode=json

retmax=20

sort=relevance

```

也可按时间排序:

```text

sort=pub+date

```

示例:

```text

https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?db=pubmed&term=(%22retinal%20organoid%22%20OR%20%22retina%20organoid%22)%20AND%20(apoptosis%20OR%20%22cell%20death%22)&retmode=json&retmax=20&sort=relevance

```

返回中读取:

```text

esearchresult.idlist

```

这就是 PMID 列表。

2.1.2 ESummary:获取文献 metadata

接口:

```text

https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esummary.fcgi

```

参数:

```text

db=pubmed

id=PMID1,PMID2,PMID3

retmode=json

```

提取字段:

• PMID

• title

• fulljournalname

• source / journal abbreviation

• pubdate

• authors

• articleids 中的 DOI、PMCID

• volume、issue、pages

2.1.3 EFetch:获取摘要和 XML 细节

接口:

```text

https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi

```

参数:

```text

db=pubmed

id=PMID1,PMID2

retmode=xml

rettype=abstract

```

提取字段:

• ArticleTitle

• AbstractText

• Journal Title

• ISOAbbreviation

• ISSN / eISSN

• PubDate

• DOI

• PMCID

• MeSH terms

2.1.4 批量检索策略

推荐流程:

1. 对每个 query 调用 ESearch。

2. 每个 query 取前 5–20 篇。

3. 合并所有 PMID。

4. 按 PMID 去重。

5. 用 ESummary / EFetch 批量获取 metadata 和 abstract。

6. 初筛阶段只读 metadata + abstract,不要一开始抓全文。

────────────────

2.2 第二阶段:PMC / BioC 全文复核

只有以下情况才进入全文:

• 用户要求精读全文。

• 摘要不足以判断机制。

• 需要图表、实验方法、浓度、剂量、IC50、EC50、Kd、Ki。

• 已筛出少量关键 PMID,需要逐篇机制复核。

2.2.1 PMID 转 PMCID

接口:

```text

https://www.ncbi.nlm.nih.gov/pmc/utils/idconv/v1.0/?ids=<PMID>&format=json

```

如果返回 PMCID,说明可能有 PMC 开放全文。

2.2.2 优先 BioC JSON

接口:

```text

https://www.ncbi.nlm.nih.gov/research/bionlp/RESTful/pmcoa.cgi/BioC_json/<PMCID>/unicode

```

优点:结构化程度高,适合抽取正文段落。

2.2.3 BioC 不可用时尝试 PMC XML

接口:

```text

https://www.ncbi.nlm.nih.gov/pmc/articles/<PMCID>/?report=xml

```

抽取正文时跳过:

• references

• bibliography

• acknowledgements

• author contributions

• competing interests

全文复核必须设置停止判据:

• 每篇文献只扫描一次。

• 默认只抽取与问题相关的段落。

• 如果未命中目标字段,标注“未见直接证据”。

• 不要无限换关键词重复抓取。

────────────────

2.3 bioRxiv / medRxiv

用于补充最新预印本。

可以使用官方 API:

```text

https://api.biorxiv.org/details/biorxiv/YYYY-MM-DD/YYYY-MM-DD

https://api.biorxiv.org/details/medrxiv/YYYY-MM-DD/YYYY-MM-DD

```

也可用普通搜索作为补充:

```text

site:biorxiv.org retinal organoid apoptosis

site:medrxiv.org retina organoid degeneration

```

预印本必须标注:

```text

预印本,未经同行评议。

```

────────────────

2.4 Crossref / OpenAlex / Unpaywall

用于补全 DOI、开放全文地址、出版信息。

Crossref:

```text

https://api.crossref.org/works?query.title=<title>

```

OpenAlex:

```text

https://api.openalex.org/works?search=<title or topic>

```

Unpaywall:

```text

https://api.unpaywall.org/v2/<DOI>?email=<your_email>

```

用途:

• DOI 补全。

• OA PDF 链接查找。

• 期刊名核验。

• 出版年份核验。

────────────────

2.5 出版商页面

只有在 API 信息不足时才访问出版商页面。

访问规则:

• 每个出版商 URL 只尝试一次。

• 遇到验证码、登录墙、Cloudflare、Access Denied、机构权限墙,立即停止。

• 不要反复刷新、换同站路径、循环等待。

• 改用 PubMed、PMC、Crossref、OpenAlex、Unpaywall、DOI metadata 兜底。

研究

3. 检索后如何整理信息

3.1 建立统一记录结构

每篇文献整理成统一 record。

字段:

```text

pmid

doi

pmcid

title

authors

journal

journal_abbrev

issn

eissn

year

abstract

query_source

evidence_level

evidence_tags

paper_type

url

```

3.2 去重

优先级:

1. PMID 去重。

2. 没有 PMID 时用 DOI 去重。

3. 没有 DOI 时用 lower(title) + year + first_author 去重。

保留第一次命中的 query_source,同时记录该文献被哪些 query 命中。

3.3 证据分级

必须区分:

直接证据:

目标物种、组织、细胞类型、模型、处理条件直接命中。

间接证据:

相邻系统、相似模型、相近机制支持,但不是用户问题的直接系统。

未见直接证据:

只能找到背景、推测、综述或相邻模型,没有直接实验结果。

3.4 文献类型标注

至少标注:

• original research

• review

• protocol

• preprint

• dataset/resource

• clinical study

• method paper

3.5 排序规则

推荐排序:

1. 直接证据原始研究。

2. 关键机制研究。

3. 最新重要研究。

4. 经典奠基研究。

5. 高质量综述。

6. 间接证据。

不要只按 IF 排序。IF 是期刊层面指标,不等于单篇文献质量。

写作

4. 回复中如何组织引用

4.1 正文引用格式

正文引用必须可点击。

格式:

```markdown

[[1. **Journal**, Year]](https://pubmed.ncbi.nlm.nih.gov/PMID/)

```

示例:

```markdown

已有研究在人源 retinal organoids 中观察到发育阶段相关的光感受器应激和退化现象[[1. **Cell Stem Cell**, 2019]](https://pubmed.ncbi.nlm.nih.gov/xxxxxxx/)。

```

不要写成:

```text

[1]

(PMID: xxxxx)

见文献1

```

4.2 推荐回答结构

第一段:直接结论。

```text

结论:已有相关报道,但直接证据主要集中在……;关于……仍缺少直接证据。

```

第二段:证据分级。

```text

直接证据:

- 文献 A:……

间接证据:

- 文献 B:……

未见直接证据:

- 本轮未找到……

```

第三段:机制归纳。

按主题分组,例如:

• apoptosis / caspase pathway

• oxidative stress

• mitochondrial dysfunction

• ER stress

• hypoxia / metabolic stress

• inflammation

• developmental mismatch

第四段:研究空白。

明确说明哪些问题没有直接证据。

第五段:实验启发。

如果用户需要实验设计,给出 marker、assay、time point、control。

写作

5. 文末完整文献信息列表

只要正文引用具体文献,文末必须附完整列表。

格式:

```markdown

## 完整文献信息列表

1. Smith J et al., **Journal Name** (2021), [PMID: 12345678](https://pubmed.ncbi.nlm.nih.gov/12345678/). *{IF=X,Qn}*

2. Wang X et al., **Journal Name** (2022), [DOI: 10.xxxx/xxxxx](https://doi.org/10.xxxx/xxxxx). *{IF=待核验}*

```

作者格式:

• 1–3 位作者:列出全部。

• 超过 3 位:第一作者 et al.

PMID / DOI / URL 必须可点击。

研究

6. IF 核查与标注

6.1 先说明 IF 核查的现实限制

正常情况下,官方 Journal Impact Factor 来自 Clarivate Journal Citation Reports(JCR)。但任意外部 Agent 通常没有 Clarivate/JCR 账号,也没有本地 JCR 表,所以不要通过这个路径核查。

```

6.2 IF skill 的实际方法

主要路线:

1. 如果输入是 PMID,先用 NCBI E-utilities 获取 PubMed metadata。

- 获取 FullJournalName。 - 获取 Source / ISO abbreviation。 - 获取 ISSN / eISSN。 - 获取标题、年份、DOI 等辅助字段。

2. 用公开的 iikx / 爱科学移动端 JSON 接口查询期刊。

搜索接口:

```text

https://m.iikx.com/api/restfull/?m=sci&c=index&a=info&keyword=<journal_query>

```

详情接口:

```text

https://m.iikx.com/api/restfull/?m=sci/index/detail&id=<id>&classid=<classid>

```

3. 对搜索结果做保守匹配。

- 优先 exact normalized journal title match。 - 其次 exact abbreviation match。 - 对短词和宽泛词非常谨慎。 - 不接受明显 substring 误配,例如 Nature 被误配成 Nature Reviews 系列。 - 如果匹配不稳,返回 ambiguous / not_found,而不是猜。

4. 如果 PubMed 给的是缩写,尝试用 NLM Catalog 扩展为全称或 alternate title。

NLM Catalog 搜索接口仍然是 NCBI E-utilities:

```text

https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?db=nlmcatalog&term=<abbr>[Title Abbreviation]&retmode=xml&retmax=1

```

然后用 ESummary 取 Title / TitleAlternate。

5. 从 iikx detail 结果中读取:

- impact factor。 - IF 年份。 - JCR quartile。 - CAS / 中科院分区,如果有。 - source URL。 - match confidence。

6. 标注时不把 IF 年份写进正文紧凑标注。

最终标注只写:

```text

*{IF=X,Qn}*

```

如果失败:

```text

*{IF=待核验}*

```

或:

```text

*{IF=未检出}*

```

6.3 具体步骤

对每篇文献执行以下流程。

第一步:准备期刊查询名。

优先从 PubMed metadata 取:

```text

FullJournalName

ISOAbbreviation / Source

ISSN

eISSN

```

如果只有 DOI,则先用 Crossref 或 OpenAlex 取期刊名。

Crossref:

```text

https://api.crossref.org/works/<DOI>

```

OpenAlex:

```text

https://api.openalex.org/works/https://doi.org/<DOI>

```

第二步:规范化期刊名。

规范化规则:

• 全部小写。

• HTML unescape。

• 将 & 替换为 and。

• 去除标点。

• 多个空格合并。

• 比较时可同时使用 compact 形式,即去除所有空格。

示例伪代码:

```python

import re, html

def norm(s):

s = html.unescape(s or '').lower()

s = re.sub(r'&', ' and ', s)

s = re.sub(r'[^a-z0-9]+', ' ', s)

return re.sub(r'\s+', ' ', s).strip()

def compact(s):

return norm(s).replace(' ', '')

```

第三步:查询 iikx 搜索接口。

```text

https://m.iikx.com/api/restfull/?m=sci&c=index&a=info&keyword=<journal_query>

```

建议设置 User-Agent,例如:

```text

Mozilla/5.0

```

如果第一页没找到 exact match,可以有限翻页,例如最多 8 页。

翻页参数通常为:

```text

page=2

page=3

```

第四步:从搜索结果中选候选。

候选字段通常包括:

```text

id

classid

title

smalltitle

IF 或 IF2024

zky2020

url

```

匹配规则:

• 如果 compact(query) == compact(candidate.title),接受。

• 如果 norm(query) == norm(candidate.title),接受。

• 如果 compact(query) == compact(candidate.smalltitle),接受。

• 如果 norm(query) == norm(candidate.smalltitle),接受。

• 如果只是 substring,不要直接接受,除非 query 足够长且无歧义。

• 对 Nature、Science、Cell、Brain、Vision、Retina 等短词尤其谨慎。

第五步:如果没有匹配,用 NLM Catalog 扩展缩写。

例如 PubMed 里 Source 是:

```text

Free Radic Biol Med

```

可以查:

```text

https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?db=nlmcatalog&term=Free%20Radic%20Biol%20Med%5BTitle%20Abbreviation%5D&retmode=xml&retmax=1

```

拿到 NLM Catalog ID 后,再用:

```text

https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esummary.fcgi?db=nlmcatalog&id=<id>&retmode=xml

```

读取:

```text

Title

TitleAlternate

```

然后用这些全称再查 iikx。

第六步:查 iikx 详情接口。

如果搜索结果里有:

```text

id=<id>

classid=<classid>

```

调用:

```text

https://m.iikx.com/api/restfull/?m=sci/index/detail&id=<id>&classid=<classid>

```

从 detail 中读取:

```text

IF2024, IF2023, IF2022 ...

IF

zky2020 或其他 JCR quartile 字段

jcr22 / jcr12 或分区字段

issn

eissn

title

smalltitle

category

```

第七步:选择最新 IF。

在返回字段中查找所有形如:

```text

IF20xx

```

例如:

```text

IF2024

IF2023

IF2022

```

选年份最大的有效数字。

如果没有 IF20xx,则尝试读取:

```text

IF

if_value

```

如果没有有效值,则标为未检出。

第八步:输出置信度和标注。

如果 exact title / abbreviation 命中,并且 detail 返回有效 IF:

```text

*{IF=X,Qn}*

```

如果匹配不确定:

```text

*{IF=待核验}*

```

如果公开接口没有结果:

```text

*{IF=未检出}*

```

6.4 IF 标注格式

固定格式:

```text

*{IF=X,Qn}*

```

示例:

```markdown

Smith J et al., **Neuron** (2020), [PMID: 12345678](https://pubmed.ncbi.nlm.nih.gov/12345678/). *{IF=15.0,Q1}*

```

注意:

• IF 标注内部不写 JCR 年份。

• 不写“2024 JCR IF”。

• 不写“JCR 2024”。

• 年份只保留在文献发表年份处。

• 如果 IF 为 0.0、空值、来源不稳、匹配不稳,不展示数字。

6.5 IF 核查失败时的标准处理

不要猜。

不要用期刊名印象补数字。

不要用大模型记忆补 IF。

失败时只允许三种状态:

```text

*{IF=待核验}*

```

用于:

• 搜索结果模糊。

• 有多个相似期刊。

• 只找到缩写但无法确认全称。

• 公开来源返回的 IF 可疑。

```text

*{IF=未检出}*

```

用于:

• 公开接口没有结果。

• 期刊不在 SCI / JCR 覆盖范围。

• 新刊暂无 IF。

```text

*{IF=不可公开核验}*

```

用于:

• 用户要求必须官方 JCR,但当前 Agent 没有 Clarivate/JCR 权限。

研究

7. 最终回复自检清单

发出前必须检查:

• 是否先回答用户核心问题。

• 是否区分直接证据、间接证据、未见直接证据。

• 是否所有正文引用都可点击。

• 是否文末有完整文献信息列表。

• 是否每篇文献都带 IF 标注或待核验/未检出标注。

• PMID/DOI/URL 是否可点击。

• 是否避免把整体组织结果偷换成特定细胞类型结论。

• 是否避免把活化/磷酸化偷换成总表达量升高。

• 是否标注预印本。

• 是否说明检索边界。

• IF 是否没有凭记忆猜测。

8. 可复现伪代码

```python

queries = build_queries(user_question)

all_pmids = []

for query in queries:

pmids = ncbi_esearch(query, retmax=20, sort='relevance')

all_pmids.extend(pmids)

pmids = deduplicate_keep_order(all_pmids)

metadata = ncbi_esummary(pmids)

abstracts = ncbi_efetch_abstract(pmids)

records = merge_metadata_and_abstracts(metadata, abstracts)

records = tag_evidence(records, user_question)

records = rank_records(records)

selected = select_top_records(records)

if need_fulltext:

for record in selected_key_records:

pmcid = idconv_pmid_to_pmcid(record.pmid)

if pmcid:

record.fulltext = fetch_bioc_or_pmc_xml(pmcid)

for record in selected:

journal_query = record.full_journal_name or record.journal_abbrev

if_result = lookup_if_public_iikx(journal_query)

if if_result.confident:

record.if_annotation = f'*{IF={if_result.if_value},{if_result.quartile}}*'

elif if_result.ambiguous:

record.if_annotation = '*{IF=待核验}*'

else:

record.if_annotation = '*{IF=未检出}*'

answer = compose_answer(

conclusion,

evidence_groups,

clickable_body_citations,

full_reference_list_with_if

)

```

9. 推荐最终交付模板

```markdown

结论:

……

证据等级:

直接证据:

- ……[[1. **Journal**, Year]](https://pubmed.ncbi.nlm.nih.gov/PMID/)

间接证据:

- ……[[2. **Journal**, Year]](https://pubmed.ncbi.nlm.nih.gov/PMID/)

未见直接证据:

- ……

机制归纳:

1. ……

2. ……

检索边界:

本轮主要检索 PubMed / PMC / BioC / bioRxiv;初筛基于 metadata + abstract,仅对关键文献进入全文复核。IF 标注基于公开可访问来源核查;无法高置信匹配时标为待核验或未检出。

完整文献信息列表:

1. Smith J et al., **Journal Name** (2021), [PMID: 12345678](https://pubmed.ncbi.nlm.nih.gov/12345678/). *{IF=X,Q1}*

2. Wang X et al., **Journal Name** (2022), [DOI: 10.xxxx/xxxxx](https://doi.org/10.xxxx/xxxxx). *{IF=待核验}*

```

写作

相关技能

查看全部

哈佛框架财报分析师

基于哈佛分析框架,自动完成上市公司年报的战略、会计、财务、前景四维深度分析,输出专业级研究报告和可视化图表

哈佛框架财报分析师

非共识引擎

这个提示词的核心,不是“帮用户想反常识标题”,而是把你的方法论固化成一个稳定流程: 刻板印象识别 → 错误因果拆解 → 反例反证 → 新框架建立 → 概念定义 → 内容展开 也就是说,它本质上不是一个“写作 Skill”,而是一个认知重构型内容生成 Skill。这会让它比普通选题工具更有辨识度。

非共识引擎

MM-文章

基于最近 3 天信源的轻量级选题研究与写作 Skill。从用户信源中提炼编号锚点(Anchor Bank),再推荐 5 个候选选题(3 共识热点 + 2 前瞻信号),用户选定后深挖资料、生成可修改大纲;仅在用户明确确认大纲后才进入正文写作。

MM-文章

发现下一个适合你的技能

继续探索更多精选 AI 技能,用于研究、创作和日常工作。

探索全部技能