撤稿分析

撤稿分析的详细提示词和使用说明

AI提示词 实用工具 效率提升
📘

🕵️ 撤稿观察 (Retraction Watch)

撤稿 学术诚信 造假筛查 学术侦探

为了高效分析疑似造假文献、撤稿声明或学术评论文章(Commentary/Letter),以下设计了三套不同深度的AI提示词。让AI充当你的"初级学术侦探"。

🎯 这些提示词基于基线数据核查、注册时间线对比、统计学不可能事件的分析逻辑。

🚀 第一套:快速筛查与核心争议提取

30秒速览 - 快速了解"到底吵在什么地方"

适用场景

手头有一篇质疑文章(如 Magdi 的评论)和原告文章,想立刻知道核心争议点。

Prompt (复制以下内容)

# Role
你是一位经验丰富的医学期刊编辑和学术诚信审查员。

# Task
我上传了[质疑文章/撤稿声明]和[原始论文]。请对比这两份文件,为我生成一份"学术争议核心简报"。

# Requirements
请严格按照以下结构输出,不要废话,只列干货:

1. **核心指控 (Core Allegations)**:用一句话概括原始论文被质疑的最根本原因(例如:基线数据造假、图片重复、伦理审批违规等)。
2. **关键证据链 (Evidence Chain)**:
   - 指控方提出了哪些具体数据或逻辑作为证据?(请列出具体的表格编号、P值或时间节点)。
   - 例如:Table 1 中 TSH 差异 P < 0.0001,或 注册时间 2013年 晚于 入组时间 2012年。
3. **统计学疑点 (Statistical Red Flags)**:
   - 是否存在"过分完美"的数据?
   - 是否存在随机化失效的迹象(如基线不平)?
   - 具体的 P 值异常点在哪里?
4. **作者回应 (Authors' Defense)**:(如果原文中有) 作者是如何解释这些异常的?他们的解释是否在逻辑上自洽?
5. **结论与风险等级**:基于文件内容,判定该文章的风险等级(高/中/低),并简述理由。

# Constraints
- 如果涉及数字对比,请使用 Markdown 表格形式展示(原告数据 vs 被告数据)。
- 保持客观中立,只陈述文件中的事实。

[上传质疑文章和原始论文]

🔬 第二套:基线数据与随机化深度法医

Table 1 专项 - 针对RCT的Table 1进行"验尸"

适用场景

专门针对RCT(随机对照试验)的Table 1进行检查,验证随机化是否成功。

Prompt (复制以下内容)

# Role
你是一位精通生物统计学的同行评审专家(Peer Reviewer)。

# Task
请重点分析我上传论文的 **Table 1 (基线特征表)** 和 **Methods (方法学-随机化部分)**。

# Analysis Steps
请按步骤执行以下分析,不要直接给出笼统结论:

1. **提取关键数据**:
   - 找出样本量 (N)。
   - 提取主要连续变量(如年龄、BMI、核心激素水平)的 Mean±SD 或 Median (IQR)。
   - 提取作者报告的 P 值。

2. **逻辑一致性检查 (Sanity Check)**:
   - **随机化验证**:在 N=[样本量] 的情况下,两组的核心指标(如 TSH、抗体)出现现有差异的概率在直觉上是否合理?
   - **P值复核建议**:请指出哪些指标的 P 值看起来与展示的数据(均值差/标准差)不匹配?(例如:均值差异很小但 P 值极小,或差异巨大但 P 值不显著)。
   - **分布检查**:依据 Median 和 IQR/Range,判断数据是否呈现正态分布?是否存在 IQR 极窄(数据过分集中)导致统计检验极易出现显著差异的情况?

3. **方法学时序检查**:
   - 检查 "Study Start Date" (研究开始时间) 和 "Registration Date" (注册时间)。
   - 计算二者的时间差,判断是否存在"回顾性注册" (Retrospective Registration) 问题。

# Output Format
请给出一份"统计学疑点清单",对于每个疑点,请注明:
- **疑点位置**(页码/表格号)
- **原文数据**
- **统计学常识冲突点**(为什么这个数据看起来是假的/错的?)

[上传论文的 Table 1 和 Methods 部分]

📌 典型案例

问题:某RCT研究样本量仅100例,但Table 1中两组TSH水平差异 P < 0.0001,均值差异极小(如 2.1 vs 2.3 mIU/L)

疑点:在小样本情况下,如此小的均值差异不可能达到如此显著的P值,提示数据可能造假或P值计算错误。

🔍 第三套:图片与文本完整性审查

Paper Mill 筛查 - 检查论文工厂特征

适用场景

怀疑文章出自"论文工厂",需要检查文本逻辑、奇怪的短语或图片描述。

Prompt (复制以下内容)

# Role
你是一位专门打击"论文工厂"的学术侦探。

# Task
分析上传的论文,寻找非自然生成的痕迹或学术造假的常见特征。

# Checklist
请扫描全文,重点关注以下细节:

1. **Tortured Phrases (被折磨的短语)**:
   - 是否存在奇怪的英文表达?(例如将 "Artificial Intelligence" 写成 "Counterfeit Consciousness",或医学专有名词的奇怪同义词替换)。
   - 这是为了躲避查重软件的常见手段。

2. **逻辑断裂**:
   - Abstract(摘要)的结论是否与 Result(结果)部分的数据完全一致?
   - Introduction(引言)引用的参考文献是否与正文内容真正相关?(是否存在无关引用/也就是 Citation Cartel 的迹象?)

3. **样本量与伦理的合理性**:
   - 招募时间(Timeframe)与样本量(Sample Size)是否匹配?(例如:1年内在单中心招募了罕见病患者 500 例,这通常是不可能的)。
   - 伦理审批号是否格式正确?

4. **图片说明检查**:
   - 虽然你不能直接看到图片细节,请检查 Figure Legends(图片说明)。
   - 是否存在不同图片的说明文字完全雷同?
   - Western Blot 或 显微镜图的描述是否过于通用,缺乏特异性?

# Output
如果有发现,请引用原文段落,并解释为什么这看起来可疑。如果没有明显发现,请回复"文本逻辑层面未发现明显的论文工厂特征"。

[上传论文全文]

💡 使用建议

1. 文件投喂技巧

如果是PDF,AI可能读得不完整,最好把 Abstract, Methods, Table 1 截图或复制文字给它。

2. 追问技巧

如果AI回复"数据看起来有差异",可以直接追问:
"根据这些Summary Data,你能帮我写一段Python代码来估算P值吗?"

3. 核心抓手

对于撤稿分析,永远聚焦于 Table 1(随机化是否成功)Timeline(是否先做实验后注册),这是最容易实锤的两个点。

📚 相关资源