Claude Science 完整指南

@shunxneuro
日语3天前 · 2026年7月02日
104K
140
16
0
237

TL;DR

Claude Science 是由 Anthropic 开发的一款专业 AI 工作台,旨在为研究人员将文献检索、代码执行和数据分析统一到一个安全且本地优先的环境中。

Anthropic 发布面向研究人员的 AI 工作台 "Claude Science"

2026 年 6 月 30 日,Anthropic 发布了 "Claude Science",这是一款专为科学研究设计的新型桌面应用程序。目前,Pro、Max、Team 和 Enterprise 计划已提供测试版。本文基于官方公告和产品文档,总结了 Claude Science 的要点。

TL;DR

  • 一个 AI 工作台,将研究人员日常执行的任务——从文献综述、代码生成到计算资源连接和执行——整合到一个环境中。
  • 生成的图表和数据会自动与执行的代码、环境和对话历史关联,便于后续验证和复现。
  • 与标准聊天格式最大的区别在于 "Reviewer Agent",它默认运行,用于根据实际执行结果检查声明。

什么是 Claude Science?

研究人员的日常工作包含许多繁琐但耗时的任务。在 PubMed 上搜索文献、在 Jupyter 中编写代码、在 R 中进行统计处理、从集群终端提交作业。研究人员必须在操作方法和数据格式各不相同的工具之间切换。Claude Science 是一款在本地主机上运行的应用程序,将这些分散的工具集统一到一个研究环境中。

Anthropic 的 Opus 4.8 等现有模型在此平台上运行。请注意,截至 7 月 1 日,Fable 5 不受支持。

该产品的核心在于它是一个 "专为研究设计的环境"。

三大支柱机制

Anthropic 通过三个主要视角解释了 Claude Science 的核心。

① 可复现的 "活" Artifacts

科学研究本质上是一项可视化工作。当 Claude Science 生成图表或手稿草稿时,它会将其与创建时使用的代码和环境一起保存。3D 蛋白质结构、基因组浏览器轨道和化学式可以直接在应用程序中显示,无需额外软件。

Shun Yamamoto - inline image

这些内容作为 Artifacts 保存在 Files 中。

生成的图形与用于执行的代码和环境、生成过程的通俗语言解释以及整个对话历史(文档中称为 "provenance")相关联。人类可以添加 "注释",向模型提供批量反馈以进行修正。

Shun Yamamoto - inline image

② 计算资源和上下文管理

以前,诸如蛋白质折叠或大规模基因组学流程等重型计算任务,需要研究人员手动设置作业、提交到集群、检查成功/失败并检索结果。Claude Science 处理此工作流程。

会话在内存中维护上下文的同时运行,因此大型数据集在加载一次后即可重复使用。处理发生在用户的基础设施(笔记本电脑、Linux 机器、HPC 登录节点等)上,确保大型或敏感数据永远不会离开该环境。

此外,上下文管理可视化已得到升级。通过左侧 "+" 选项卡底部的 "Context Usage" 选项,您可以跟踪 Agent 在整个研究过程中的上下文转换,如下所示。

Shun Yamamoto - inline image

③ 原生支持超过 60 个数据库

生命科学知识分散在数百个专业数据源中,如 UniProt、PDB、Ensembl、Reactome、ClinVar、ChEMBL 和 GEO,每个数据源都有不同的模式和查询语言。当您用自然语言向 Claude Science 提问时,专门的 Agent 会跨功能地搜索和整合这些数据源。

这得益于超过 60 个预配置的技能和连接器,这些技能和连接器针对基因组学、单细胞分析、蛋白质组学、结构生物学和化学信息学进行了定制。实验室还可以将自己的专有模型、数据和流程注册为可重用的技能或连接器,以便在未来的会话中自动调用。

Reviewer:始终在线的 "同行评审员"

Claude Science 的一个显著特点是后台运行的 "Reviewer"。在 Max、Team 和 Enterprise 计划中,Reviewer 会自动运行。 此 Agent 独立重新读取 Claude 最近的回复、已批准的执行计划、保存的 Artifacts 和实际执行日志,以验证 Claude 的声明是否与实际执行的工作相符。

Reviewer 检测到的典型问题包括:

  • 报告结果时声称已计算,但实际上并未执行任何操作。
  • 回复中的数值与参考文件的内容相矛盾。
  • 引文实际上并不支持所提出的声明。
  • 论文的 DOI 指向不同的文献。
  • 已批准计划中的步骤未实际完成。
  • 撰写的结论无法从所使用的方法中推导出来。
Shun Yamamoto - inline image

在 Max、Team 和 Enterprise 计划中,它会在每次回复时自动运行,并在长时间任务期间定期运行。在 Pro 计划中,用户必须手动使用 "Request Review"。请注意,Reviewer 检查的是日志与声明之间的一致性;它不会重新运行分析本身来验证计算。

安全性和数据处理

由于许多研究数据包含敏感信息,Claude Science 强调 "本地优先" 的设计。

  • 对话历史和 Artifacts 保存在本地机器上(~/.claude-science 文件夹),而不是 Anthropic 的服务器上。
  • ~/.claude-science 文件夹是 Claude Science 应用程序管理的内部数据区域,用户不应触碰。
Shun Yamamoto - inline image
  • 所有代码都在操作系统级别的沙箱中执行,访问权限仅限于明确允许的工作区或文件夹。默认情况下,网络访问被阻止。默认使用 Conda 进行环境构建。
  • 每当 Claude 访问新文件夹、网络目标、执行代码或远程作业时,都会出现一个 "Permission Card",允许用户允许或拒绝。权限可以设置为 "仅一次"、"此项目" 或 "始终",并且可以随时在设置中撤销。
Shun Yamamoto - inline image
  • 只有对 Claude 模型的调用(提示和回复)会发送给 Anthropic,并按照标准数据保留策略处理。对话和 Artifacts 本身不会存储在 Anthropic 端。

使用注意事项

Anthropic 自身就 Claude Science 提出了几点注意事项:

  • Reviewer 可以减少错误,但不能完全消除错误。
  • Reviewer 检查的是日志与声明之间的一致性;它不会重新运行分析来验证计算。
  • 在将结果用于研究、论文发表或决策之前,请务必自行验证结果。
  • 必须注意不要让 Claude 读取个人身份信息,或将其包含在日志、文件名或报告中。

由于是测试版,一些组织管理功能(如审计日志和合规 API)仍在计划未来实施中。

总结

Claude Science 是一项雄心勃勃的尝试,旨在让一个本地应用程序和 Agent 处理整个研究工作流程:阅读文献、编写代码、获取计算资源和验证结果。它将 Claude Code 为软件开发带来的相同理念带入了科学研究领域,特别是生命科学领域,是一款可能革命性地改变研究未来的产品。

由于很难在一篇 X 文章中解释所有内容,我计划在 Note 上再写一篇文章,请关注此账号。

感谢您的阅读。

参考来源

使用 YouMind 创作爆款文章

收集素材、拆解爆点、生成视觉资产、撰写内容,并在一个 AI 工作空间里完成分发。

了解 YouMind
写给创作者

把你的 Markdown 变成干净的 𝕏 文章

图片上传、表格、代码块,往 𝕏 上手动重排太痛苦。YouMind 把整篇 Markdown 一键转成干净、可直接发布的 𝕏 文章草稿。

试试 Markdown 转 𝕏

更多可拆解样本

近期爆款文章

探索更多爆款文章