GitHub - K-Dense-AI/scientific-agent-skills: 一套即用型Agent技能,适用于研究、科学、工程、分析、金融和写作等领域。
科学Agent技能
Claude Scientific Skills 现已更名为 Scientific Agent Skills。 技能内容不变,但兼容性更广——现在可与任何支持开放 Agent Skills 标准的AI Agent配合使用,不再仅限于Claude。
更新:K-Dense BYOK —— 一个免费、开源的AI科研协作者,可在您的桌面运行,由Scientific Agent Skills提供支持。您自带API密钥,从40多种模型中进行选择,即可获得一个完整的研究工作空间,包含网页搜索、文件处理、100多个科学数据库以及本仓库中全部135项技能。您的数据始终保留在您的计算机上,您还可以选择通过 Modal 将繁重任务扩展到云端计算。 点击此处开始使用。
这是一套全面的 135个即用型科学和研究技能(涵盖癌症基因组学、药物靶点结合、分子动力学、RNA速度、地理空间科学、时间序列预测、通过Hugging Science发现的科学机器学习资源、78+科学数据库等),适用于任何支持开放 Agent Skills 标准的AI Agent,由 K-Dense 创建。可与 Cursor、Claude Code、Codex 等 配合使用。将您的AI Agent转变为能够执行生物学、化学、医学等领域复杂多步骤科学研究工作流的研究助手。
这些技能使您的AI Agent能够无缝处理多个科学领域的专业科学库、数据库和工具。虽然Agent本身可以自行使用任何Python包或API,但这些明确定义的技能提供了精心整理的使用文档和示例,使其在执行以下工作流时更加强大和可靠:
- 生物信息学与基因组学 - 序列分析、单细胞RNA测序、基因调控网络、变异注释、系统发育分析
- 化学信息学与药物发现 - 分子特性预测、虚拟筛选、ADMET分析、分子对接、先导化合物优化
- 蛋白质组学与质谱分析 - LC-MS/MS处理、肽段鉴定、谱图匹配、蛋白定量
- 临床研究与精准医学 - 临床试验、药物基因组学、变异解读、药物安全、临床决策支持、治疗规划
- 医疗AI与临床机器学习 - 电子健康记录分析、生理信号处理、医学影像、临床预测模型
- 医学影像与数字病理学 - DICOM处理、全切片图像分析、计算病理学、放射学工作流
- 机器学习与AI - 深度学习、强化学习、时间序列分析、模型可解释性、贝叶斯方法
- 材料科学与化学 - 晶体结构分析、相图、代谢模型构建、计算化学
- 物理学与天文学 - 天文数据分析、坐标转换、宇宙学计算、符号数学、物理计算
- 工程与仿真 - 离散事件仿真、多目标优化、代谢工程、系统建模、工艺优化
- 数据分析与可视化 - 统计分析、网络分析、时间序列、可发表级图表、大规模数据处理、探索性数据分析
- 地理空间科学与遥感 - 卫星图像处理、GIS分析、空间统计、地形分析、地球观测机器学习
- 实验室自动化 - 液体处理方案、实验设备控制、工作流自动化、LIMS集成
- 科学传播 - 文献综述、同行评审、科学写作、文档处理、海报、幻灯片、示意图、文献管理
- 多组学与系统生物学 - 多模态数据整合、通路分析、网络生物学、系统级洞察
- 蛋白质工程与设计 - 蛋白质语言模型、结构预测、序列设计、功能注释
- 研究方法论 - 假设生成、科学头脑风暴、批判性思维、基金申请、学者评估
将您的AI编码Agent转变为桌面上的“AI科学家”!
⭐ 如果您觉得这个仓库有用,请考虑给它一个Star!这有助于其他人发现这些工具,并鼓励我们继续维护和扩展这个集合。
刚接触Scientific Agent Skills? 观看我们的Scientific Agent Skills入门视频,快速了解。
包含内容
本仓库提供 135个科学和研究技能,分为以下几类:
- 100+ 科学与金融数据库 - 一个统一的数据库查询技能提供对78个公共数据库的直接访问(PubChem、ChEMBL、UniProt、COSMIC、ClinicalTrials.gov、FRED、USPTO等),此外还有针对DepMap、Imaging Data Commons、PrimeKG、美国财政部财政数据和Hugging Science(Hugging Face上涵盖17个科学领域的精选科学数据集、模型和演示目录)的专用技能。多数据库软件包如BioServices(约40个生物信息学服务)、BioPython(通过Entrez访问38个NCBI子数据库)和gget(20+基因组数据库)进一步扩大了覆盖范围。
- 70+ 优化的Python包技能 - 为RDKit、Scanpy、PyTorch Lightning、scikit-learn、BioPython、pyzotero、BioServices、PennyLane、Qiskit、OpenMM、MDAnalysis、scVelo、TimesFM等明确定义的技能——附带精选文档、示例和最佳实践。注意:Agent可以使用 任何 Python包编写代码,不仅限于这些;这些技能只是为所列出的包提供了更强大、更可靠的性能。
- 9 个科学集成技能 - 为Benchling、DNAnexus、LatchBio、OMERO、Protocols.io、Open Notebook等明确定义的技能。同样,Agent不仅限于这些——任何可通过Python访问的API或平台都可以使用;这些技能是预先优化了文档的路径。
- 30+ 分析与传播工具 - 文献综述、科学写作、同行评审、文档处理、海报、幻灯片、示意图、信息图、Mermaid图表等。
- 10+ 研究与临床工具 - 假设生成、基金申请、临床决策支持、治疗方案、法规遵从、情景分析。
每个技能包括:
- ✅ 全面的文档(
SKILL.md) - ✅ 实用的代码示例
- ✅ 使用案例和最佳实践
- ✅ 集成指南
- ✅ 参考资料
目录
为何使用?
Scientific Agent Skills 通过提供即用型、精心整理的库和平台接口,将AI Agent转变为强大的研究助手。
- 开箱即用 - 无需为每个新项目重新编写科学库的集成代码。这些技能附带预构建的示例和最佳实践。
- 经过验证的模式 - 每个技能都包含经过测试的代码模式和工作流,避免了常见陷阱。
- 跨领域 - 从药物发现到气候科学,跨越多个科学学科的技能。
- 持续更新 - 随着新库和数据库的出现,技能库会定期扩展。
快速开始
系统要求
- AI Agent:任何支持Agent Skills标准的AI Agent(Cursor、Claude Code、Gemini CLI、Codex等)
- 系统:macOS、Linux或带有WSL2的Windows
- 依赖项:由各个技能自动处理(具体需求请查看
SKILL.md文件)
安装uv
这些技能使用 uv 作为包管理器来安装Python依赖项。请根据您的操作系统使用以下说明进行安装:
macOS和Linux:
curl -LsSf https://astral.sh/uv/install.sh | sh
Windows:
powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"
替代方法(通过pip):
pip install uv
安装后,运行以下命令验证是否成功:
uv --version
更多安装选项和详细信息,请访问官方uv文档。
快速示例
安装好技能后,您可以让您的AI Agent执行复杂的多步骤科研工作流。以下是一些示例提示:
药物发现流程
目标:寻找用于肺癌治疗的新型EGFR抑制剂
提示:尽可能使用你可用的技能。查询ChEMBL数据库中IC50 < 50nM的EGFR抑制剂,使用RDKit分析构效关系,使用datamol生成改进类似物,使用DiffDock对AlphaFold EGFR结构进行虚拟筛选,搜索PubMed查找耐药机制,检查COSMIC数据库中的突变,并创建可视化图表和一份全面的报告。
使用的技能:ChEMBL、RDKit、datamol、DiffDock、AlphaFold DB、PubMed、COSMIC、科学可视化
需要云端GPU和最终的可发表级报告?在K-Dense Web上免费运行。
单细胞RNA测序分析
目标:对10X Genomics数据进行综合分析并整合公共数据
提示:尽可能使用你可用的技能。使用Scanpy加载10X数据集,进行质量控制和双细胞去除,整合Cellxgene Census数据,使用NCBI Gene标记识别细胞类型,使用PyDESeq2进行差异表达分析,使用Arboreto推断基因调控网络,通过Reactome/KEGG进行通路富集分析,并使用Open Targets识别治疗靶点。
使用的技能:Scanpy、Cellxgene Census、NCBI Gene、PyDESeq2、Arboreto、Reactome、KEGG、Open Targets
想要零设置的云端执行和可共享的输出?免费试用K-Dense Web。
多组学生物标志物发现
目标:整合RNA-seq、蛋白质组学和代谢组学数据以预测患者预后
提示:尽可能使用你可用的技能。使用PyDESeq2分析RNA-seq数据,使用pyOpenMS处理质谱数据,从HMDB/Metabolomics Workbench整合代谢物数据,将蛋白质映射到通路(UniProt/KEGG),通过STRING数据库查找相互作用,使用statsmodels关联组学层数据,使用scikit-learn构建预测模型,并在ClinicalTrials.gov中搜索相关试验。
使用的技能:PyDESeq2、pyOpenMS、HMDB、Metabolomics Workbench、UniProt、KEGG、STRING、statsmodels、scikit-learn、ClinicalTrials.gov
此流程计算量很大。在K-Dense Web上使用云端GPU运行,免费试用。
虚拟筛选活动
目标:发现针对蛋白质-蛋白质相互作用的变构调节剂
提示:尽可能使用你可用的技能。获取AlphaFold结构,使用BioPython识别相互作用界面,在ZINC数据库中搜索变构候选物(分子量300-500,logP 2-4),使用RDKit进行筛选,使用DiffDock进行对接,使用DeepChem进行排序,检查PubChem供应商,搜索USPTO专利,并使用MedChem/molfeat优化先导化合物。
使用的技能:AlphaFold DB、BioPython、ZINC、RDKit、DiffDock、DeepChem、PubChem、USPTO、MedChem/molfeat
临床基因组学解释
目标:评估遗传性癌症风险的临床意义
提示:尽可能使用你可用的技能。使用pysam解析VCF文件,使用Ensembl VEP注释变异,查询ClinVar数据库查找致病性信息,检查COSMIC数据库中的癌症突变,从NCBI Gene检索基因信息,使用UniProt分析蛋白质影响,搜索PubMed查找病例报告,检查Open Targets和ClinicalTrials.gov中相关的靶点和试验。
使用的技能:pysam、Ensembl VEP、ClinVar、COSMIC、NCBI Gene、UniProt、PubMed、Open Targets、ClinicalTrials.gov
使用案例
- 药物发现:从靶点识别到先导化合物优化的完整筛选流程
- 癌症研究:突变分析、药物敏感性预测和标志物发现
- 单细胞分析:端到端的scRNA-seq数据处理、分析和解释
- 临床决策支持:基于基因组和临床数据的治疗建议
- 文献综述:跨多个数据库的自动化综合文献检索和总结
- 资助申请撰写:协助撰写和优化研究资助申请
- 实验设计:协助设计实验方案,包括样本量计算、功效分析和设计
- 可发表级图表:使用matplotlib和seaborn创建可发表级的可视化图表
- 网络可视化:使用NetworkX可视化生物网络
- 报告生成:使用文档技能生成全面的PDF报告
- 方案设计:为自动化液体处理创建Opentrons方案
- LIMS集成:与Benchling和LabArchives集成以进行数据管理
- 工作流自动化:自动化多步骤实验室工作流
可用技能
本仓库包含 135个科学和研究技能,按多个领域组织。每个技能都提供全面的文档、代码示例以及使用科学库、数据库和工具的最佳实践。
技能类别
注意: 下面列出的Python包和集成技能是 明确定义 的技能——附带文档、示例和最佳实践,以提供更强、更可靠的性能。它们不是上限:Agent可以安装和使用 任何 Python包或调用 任何 API,即使没有专门的技能。列出的技能只是让常见工作流更快、更可靠。
生物信息学与基因组学(21+技能)
- 序列分析:BioPython、pysam、scikit-bio、BioServices
- 单细胞分析:Scanpy、AnnData、scvi-tools、scVelo(RNA速度)、Arboreto、Cellxgene Census
- 基因组工具:gget、geniml、gtars、deepTools、FlowIO、Polars-Bio、Zarr、TileDB-VCF
- 差异表达:PyDESeq2
- 系统发育学:ETE Toolkit、Phylogenetics(MAFFT、IQ-TREE 2、FastTree)
化学信息学与药物发现(10+技能)
- 分子操作:RDKit、Datamol、Molfeat
- 深度学习:DeepChem、TorchDrug
- 对接与筛选:DiffDock
- 分子动力学:OpenMM + MDAnalysis(MD模拟与轨迹分析)
- 云端量子化学:Rowan(pKa、对接、共折叠)
- 药物相似性:MedChem
- 基准测试:PyTDC
蛋白质组学与质谱分析(2技能)
- 谱图处理:matchms、pyOpenMS
临床研究与精准医学(8+技能)
- 临床数据库:通过Database Lookup(ClinicalTrials.gov、ClinVar、ClinPGx、COSMIC、FDA、cBioPortal、Monarch等)
- 癌症基因组学:DepMap(癌症依赖性评分、药物敏感性)
- 癌症影像:Imaging Data Commons(NCI放射学和病理学数据集,通过idc-index访问)
- 医疗AI:PyHealth、NeuroKit2、临床决策支持
- 临床文档:临床报告、治疗方案
医学影像与数字病理学(3技能)
- DICOM处理:pydicom
- 全切片成像:histolab、PathML
神经科学与电生理学(1技能)
- 神经记录:Neuropixels-Analysis(细胞外尖峰信号、硅探针、尖峰分类)
机器学习与AI(16+技能)
- 深度学习:PyTorch Lightning、Transformers、Stable Baselines3、PufferLib
- 经典机器学习:scikit-learn、scikit-survival、SHAP
- 时间序列:aeon、TimesFM(Google的零样本单变量预测基础模型)
- 贝叶斯方法:PyMC
- 优化:PyMOO
- 图机器学习:Torch Geometric
- 降维:UMAP-learn
- 统计建模:statsmodels
材料科学、化学与物理学(7技能)
- 材料:Pymatgen
- 代谢模型:COBRApy
- 天文学:Astropy
- 量子计算:Cirq、PennyLane、Qiskit、QuTiP
工程与仿真(4技能)
- 数值计算:MATLAB/Octave
- 计算流体力学:FluidSim
- 离散事件仿真:SimPy
- 符号数学:SymPy
数据分析与可视化(16+技能)
- 可视化:Matplotlib、Seaborn、科学可视化
- 地理空间分析:GeoPandas、GeoMaster(遥感、GIS、卫星影像、空间机器学习、500+示例)
- 数据处理:Dask、Polars、Vaex
- 网络分析:NetworkX
- 文档处理:文档技能(PDF、DOCX、PPTX、XLSX)
- 信息图:信息图(AI驱动的专业信息图制作)
- 图表:Markdown与Mermaid写作(基于文本的图表作为默认文档标准)
- 探索性数据分析:EDA工作流
- 统计分析:统计分析工作流
实验室自动化(4技能)
- 液体处理:PyLabRobot
- 云端实验室:Ginkgo Cloud Lab(无细胞蛋白表达、通过自主RAC基础设施实现的荧光像素艺术)
- 方案管理:Protocols.io
- LIMS集成:Benchling、LabArchives
多组学与系统生物学(4+技能)
- 通路分析:通过Database Lookup(KEGG、Reactome、STRING)和PrimeKG
- 多组学:HypoGeniC
- 数据管理:LaminDB
蛋白质工程与设计(3技能)
- 蛋白质语言模型:ESM
- 糖工程:糖工程(N/O-糖基化预测、治疗性抗体优化)
- 云端实验室平台:Adaptyv(自动化蛋白质测试和验证)
科学传播(20+技能)
- 文献:Paper Lookup(PubMed、PMC、bioRxiv、medRxiv、arXiv、OpenAlex、Crossref、Semantic Scholar、CORE、Unpaywall)、文献综述
- 高级论文搜索:BGPT Paper Search(每篇论文超过25个结构化字段——方法、结果、样本量、质量评分——来自全文,而不仅仅是摘要)
- 网页搜索:Parallel Web(带有引用的综合摘要)
- 研究笔记本:Open Notebook(自托管的NotebookLM替代方案——PDF、视频、音频、网页;16+ AI提供商;多发言人播客生成)
- 写作:科学写作、同行评审
- 文档处理:XLSX、MarkItDown、文档技能
- 出版:Venue Templates
- 演示文稿:科学幻灯片、LaTeX海报、PPTX海报
- 图表:科学示意图、Markdown与Mermaid写作
- 信息图:信息图(10种类型、8种风格、色盲安全调色板)
- 引文:引文管理
- 插图:生成图像(使用FLUX.2 Pro和Gemini 3 Pro(Nano Banana Pro)进行AI图像生成)
科学数据库与数据访问(6技能 → 总计100+数据库)
一个统一的数据库查询技能提供对所有领域78个公共数据库的直接REST API访问。专用技能涵盖专门的数据平台。多数据库软件包如BioServices(约40个生物信息学服务)、BioPython(通过Entrez访问38个NCBI子数据库)和gget(20+基因组数据库)进一步扩大了覆盖范围。
- 统一访问:Database Lookup(78个数据库,涵盖化学、基因组学、临床、通路、专利、经济学等领域——PubChem、ChEMBL、UniProt、PDB、AlphaFold、KEGG、Reactome、STRING、ClinVar、COSMIC、ClinicalTrials.gov、FDA、FRED、USPTO、SEC EDGAR等)
- 癌症基因组学:DepMap(癌细胞系依赖性、药物敏感性、基因效应谱)
- 癌症影像:Imaging Data Commons(NCI放射学和病理学数据集,通过idc-index访问)
- 知识图谱:PrimeKG(精准医学知识图谱——基因、药物、疾病、表型)
- 财政数据:美国财政部财政数据(国家债务、财政报表、拍卖、汇率)
- 科学机器学习资源目录:Hugging Science(涵盖17个科学领域——天文学、生物学、化学、气候、基因组学、材料科学、医学、物理学、科学推理等——的数据集、模型、博文和交互式Spaces的精选索引,包含
datasets、transformers和gradio_client的使用模式)
基础设施与平台(7+技能)
- 云端计算:Modal
- GPU加速:Optimize for GPU(CuPy、Numba CUDA、Warp、cuDF、cuML、cuGraph、KvikIO、cuCIM、cuxfilter、cuVS、cuSpatial、RAFT)
- 基因组学平台:DNAnexus、LatchBio
- 显微镜:OMERO
- 自动化:Opentrons
- 资源检测:获取可用资源
研究方法论与规划(12+技能)
- 构思:科学头脑风暴、假设生成
- 批判性分析:科学批判性思维、学者评估
- 情景分析:What-If Oracle(多分支可能性探索、风险分析、战略选项)
- 多视角审议:Consciousness Council(多元化专家观点、魔鬼代言人分析)
- 认知画像:DHDNA Profiler(从任何文本中提取思维模式和认知特征)
- 资金:研究基金
- 发现:Research Lookup、Paper Lookup(10个学术数据库)
- 市场分析:市场研究报告
法规与标准(1技能)
- 医疗器械标准:ISO 13485认证
有关所有技能的完整详情,请访问 K-Dense 文档。
独特价值主张
- 开源且免费:100%免费使用,无隐藏费用或付费墙。
- 本地优先:敏感数据保留在您的机器上。
- 模型无关:支持所有主要AI模型,无供应商锁定。
- 基于标准:基于开放的Agent Skills标准构建,确保长期兼容性。
- 生产就绪:包含实际科研中经过测试和验证的工作流。
从何处开始
- 浏览技能:查看上面的可用技能部分
- 选择您的AI Agent:选择任何支持Agent Skills的AI Agent
- 安装技能:将技能目录添加到您的Agent的技能路径中
- 尝试示例:从上面的快速示例提示开始
- 根据您的需求调整:修改技能或创建您自己的技能
支持开源社区
⭐ 如果这个仓库对您有帮助,请为它点一个Star!
您的Star:
- 帮助其他研究人员发现这些工具
- 激励我们继续维护和扩展这个集合
- 支持开源科研软件的生态系统
安全免责声明
重要:在使用本仓库中的技能之前,请阅读此安全声明。
- API密钥和凭证:永远不要将API密钥、密码或任何敏感凭证硬编码到技能文件或提示中。使用环境变量或安全的密钥管理服务。
- 数据隐私:当您通过AI Agent使用技能时,您的数据可能会根据您所使用的AI服务提供商的隐私政策进行处理。对于敏感或专有数据,请考虑使用本地模型或具有强有力数据保护保证的服务。
- 代码执行:技能使AI Agent能够生成并执行代码。在执行之前,请始终审查AI生成的代码,尤其是在生产环境或敏感数据集上运行时。
- 外部API:许多技能依赖于访问外部API(例如,PubMed、ChEMBL、UniProt)。请确保您已获得适当的权限,并遵守这些服务的服务条款和速率限制。
- 输出验证:AI Agent可能产生幻觉或不正确的输出。对于任何研究或临床决策,请由领域专家验证所有结果。
- 医疗免责声明:本仓库中的技能旨在用于研究目的,不应用于做出临床决策,除非在适当的监督下并经过临床验证。
- 测试:在将技能部署到关键工作流之前,请使用非生产数据对其进行测试。
通过使用本仓库,您承认您理解这些风险,并对使用这些技能的结果负全部责任。
参与贡献
我们欢迎贡献!如果您想添加新的技能、改进现有技能或修复错误,请:
- Fork本仓库
- 创建一个功能分支
- 进行您的更改
- 提交一个拉取请求
有关贡献的更多信息,请查看我们的贡献指南。
故障排除
常见问题
- 技能未被识别:确保技能目录位于正确的位置(例如,
~/.claude/skills或./.claude/skills) - Python包未找到:技能会自动安装依赖项,但您可能需要先安装
uv - API速率限制:许多数据库都有速率限制。对于大规模查询,请考虑实现重试逻辑或使用缓存
- 内存不足:某些技能处理大型数据集(例如,单细胞分析)。考虑使用高性能计算资源或子采样您的数据
常见问题解答
问:这些技能是免费的吗? 答:是的!Scientific Agent Skills完全免费且开源。
问:我需要一个特定的AI Agent吗? 答:不需要——这些技能可在任何支持Agent Skills标准的AI Agent上运行。
问:这些技能可以在我的本地机器上运行吗? 答:可以。它们被设计为在您的机器上本地运行,可选择通过Modal扩展到云端计算。
问:技能只适用于科学吗? 答:虽然重点是科学,但我们也包括金融和工程技能,并欢迎在这些领域做出贡献。
问:我如何创建我自己的技能? 答:请参考 Agent Skills规范 以获取创建自定义技能的说明。
支持
- 文档:docs.k-dense.ai
- 问题反馈:GitHub Issues
- 社区:加入我们的Discord
- X(原Twitter):@KDenseAI
