技能简介
临床变异解读是精准医学的核心环节。面对VCF文件中的数十到数百个变异,
传统手动查询方式需要数天甚至数周时间。
本教程教你使用三大临床数据库——
ClinVar(临床致病性)、COSMIC(癌症突变)、Ensembl(基因组注释),
通过Scientific Skills MCP自动化完成变异注释、致病性评估和临床报告生成。
100个变异的解读时间从1周缩短至10分钟!
💡 使用场景
基因检测报告解读
快速解读临床外显子测序或基因panel检测中的变异,评估致病性
肿瘤精准医疗
识别癌症驱动突变,匹配靶向治疗方案,评估预后
遗传病诊断
辅助诊断罕见遗传病,筛选疑似致病变异
科研项目数据挖掘
批量注释队列研究中的变异,发现潜在疾病关联
🛠️ 核心技能调用
通过Scientific Skills MCP,可以一键调用三大数据库:
📊 Ensembl VEP - 变异注释
使用Ensembl Variant Effect Predictor (VEP)对VCF文件进行自动化注释,获取基因定位、转录本影响、氨基酸改变等信息。
# 调用 Ensembl Database 技能 # scientific-skills:ensembl-database # 示例:注释VCF文件中的变异 vep_annotate( vcf_file = "variants.vcf", output_format = "json", include = ["gene", "transcript", "consequence", "sift", "polyphen"] ) # 返回结果包含: # - 基因名称和定位 # - 受影响的转录本 # - 氨基酸改变(如p.Arg123Cys) # - 功能预测得分(SIFT, PolyPhen)
🏥 ClinVar - 致病性评估
查询ClinVar数据库获取变异的临床致病性分类,包括Pathogenic、Likely pathogenic、VUS等。
# 调用 ClinVar Database 技能 # scientific-skills:clinvar-database # 批量查询变异致病性 clinvar_query( variants = [ "NC_000017.11:g.43044295T>C", # BRCA1 示例 "NC_000012.12:g.25398284C>T" # KRAS 示例 ], include = ["clinical_significance", "condition", "review_status"] ) # 返回结果包含: # - 致病性分类(Pathogenic/Likely pathogenic/VUS等) # - 相关疾病/表型 # - 证据等级(星级标准) # - 提交实验室和评审状态
💡 致病性分类说明:
- • Pathogenic - 致病:有充分证据证明导致疾病
- • Likely pathogenic - 可能致病:证据较强但不完全
- • VUS - 意义不明:证据不足,无法判断
- • Likely benign / Benign - 可能良性/良性
🧬 COSMIC - 癌症突变检查
查询COSMIC癌症体细胞突变数据库,识别已知癌症驱动突变和肿瘤特异性变异。
# 调用 COSMIC Database 技能 # scientific-skills:cosmic-database # 检查变异是否为已知癌症突变 cosmic_query( variants = [ "17-7579472-G-A", # TP53 示例 "7-140453136-A-T" # BRAF V600E ], include = ["mutation_frequency", "cancer_types", "primary_site"] ) # 返回结果包含: # - 突变在癌症样本中的频率 # - 相关癌症类型和组织来源 # - 是否为已知驱动突变 # - 文献支持的功能影响
📖 实战示例:完整解读流程
假设你有一个包含100个变异的VCF文件,以下是完整的自动化解读流程:
1 变异注释 (Ensembl VEP)
首先使用Ensembl VEP对所有变异进行基因组注释:
# Step 1: Ensembl VEP 注释 vep_annotate( vcf_file = "clinical_sample.vcf", species = "homo_sapiens", assembly = "GRCh38", everything = True # 获取所有可用注释 ) # 输出示例: # # CHROM POS ID REF ALT GENE FEATURE CONSEQUENCE IMPACT # 17 43044295 rs80357713 T C BRCA1 missense_variant MODERATE # 12 25398284 rs121913227 C T KRAS missense_variant HIGH
2 致病性查询 (ClinVar)
查询ClinVar获取每个变异的临床致病性评估:
# Step 2: ClinVar 致病性查询 annotated_variants = vep_annotate("clinical_sample.vcf") clinvar_batch_query( variants = annotated_variants, return_all = True ) # 输出示例: # Variant Clinical_Significance Review_Status Condition # BRCA1:c.5466T>C Pathogenic practice_guideline Hereditary cancer # KRAS:c.35G>A Pathogenic practice_guideline Lung adenocarcinoma # GENE_X:c.123A>T VUS no_assertion -
3 癌症突变检查 (COSMIC)
对于肿瘤样本,检查COSMIC数据库中的癌症突变记录:
# Step 3: COSMIC 癌症突变检查 cosmic_check( variants = annotated_variants, include_frequencies = True ) # 输出示例: # Variant Cosmic_ID Freq Cancer_Types Primary_Site # KRAS:p.G12D COSM522 12.3% Lung,Colon,Pancreas Lung,Large Intestine # TP53:p.R175H COSM10772 8.7% Multiple Breast,Lung,Ovary # BRAF:p.V600E COSM476 15.2% Melanoma,Colon Skin,Large Intestine
4 生成临床报告
整合所有信息,生成按致病性排序的临床报告:
# Step 4: 生成临床报告 generate_clinical_report( variants = annotated_variants, clinvar_data = clinvar_results, cosmic_data = cosmic_results, sort_by = "pathogenicity", highlight_pathogenic = True ) # 报告结构: # ===== 高危变异 (Pathogenic/Likely pathogenic) ===== # 1. BRCA1:c.5466T>C (p.Arg1822Cys) # - 致病性: Pathogenic (星级标准) # - 相关疾病: 遗传性乳腺癌-卵巢癌综合征 # - 建议: 遗传咨询,家族筛查 # # 2. KRAS:c.35G>A (p.Gly12Asp) # - 致病性: Pathogenic # - COSMIC记录: 肺腺癌常见驱动突变 # - 靶向药物: EGFR-TKI敏感性预测 # # ===== 意义不明变异 (VUS) ===== # [列出VUS变异,建议家族共分离分析]
⚠️ 注意事项
临床应用限制
AI辅助解读结果不能直接用于临床决策。所有结果需由资质齐全的临床遗传学家或分子病理学家审核确认。
VUS变异处理
VUS (Variant of Uncertain Significance) 变异需要结合家系共分离分析、功能实验验证或人群频率数据综合判断。
数据库更新
ClinVar和COSMIC数据库定期更新,历史解读结果可能需要根据新证据重新评估。建议注明解读日期和数据库版本。
🔗 相关技能链接
💡 代码包内含 README.md 文档,包含环境配置和运行说明。解压后即可使用。