什么是合成受访者?定义、用例与准确性
合成受访者是能够像目标受众真实成员那样回答研究问题的AI人物。本篇文章将介绍其工作原理及适用场景。
什么是合成受访者?
合成受访者是由大型语言模型生成并基于人口统计、心理特征和行为参数调教的AI人物,能够像定义的目标受众的真实成员那样回答研究问题。
在传统研究中,你需要招募500名真人,筛选、安排、进行调查、等待结果、加权数据并撰写报告。而使用合成受访者,你只需描述你想要的500个人,平台便会生成这些人物,并在几分钟内实现查询。
这种方法有时被称为硅取样、AI人物研究、合成问卷调查研究,或者干脆称为AI市场研究。实际上回答你问题的基本单位即是合成受访者。
合成受访者如何构建
合成受访者由三层组成:
1. 前沿LLM。 GPT类、Claude类、Gemini类模型。模型提供了一般的推理和语言能力。
2. 人物调教。 人口统计和心理特征输入(年龄、地域、家庭收入、职业、态度、行为、先前品牌接触)将模型绑定到特定身份。更强的平台还会根据同一受众的真实数据进行调教,使人物行为更像受众而不是普通助理。
3. 响应协议。 规定人物如何回答的约束:问题格式、规模、对话风格、后续处理。这是平台差异最大的地方。有些平台强制受访者使用严格的数量级比例,其他则允许自由回答,您可以将其主题化,如同真实采访。
最终的结果是一个可以回答问卷、对广告创意做出反应、参与焦点小组讨论、经历购买场景,或作为研究小组的成员参加多周纵向研究的受访者。
合成受访者的用途为何(而不仅仅是LLM的包装)
许多尝试合成受访者而不成功的团队,通常只试验过简单包装的LLM,通过提示"你是一位34岁的市场经理"来提问。这对随意探索可能有效,但在面对研究级别的审核时会失败。
一个有用的合成受访者有四个特性:
对真实受众的忠实度。 人物应根据真实的前期数据(如客户小组、客户关系管理分段、研究)进行校准,不仅仅是一个职位和年龄。
不同意与反驳。 真实受访者会说"我不会买",他们可能误解问题,并且在后续中可能会改变主意。一个总是同意的受访者是聊天机器人,而不是研究工具。
可靠性评分。 每个回答都应附有内部可靠性或一致性估算,以便标记低可信度答案。如果对每个输出都盲信,最终会信错东西。
重现性。 若明天用同一人物对同一刺激进行测验,结果应具有统计上的相似性,而不是截然不同的数据。这也是合成受访者可审核的原因。
合成受访者可以被问什么
你可以问他们任何你会问具有同样限制条件的真实受访者的问题:问题必须更注重一般推理而非独特的生活经验。
有用的问题:
- "你会考虑购买这三个产品概念中的哪一个?"
- "是什么让你对这种宣传信息感到担忧?"
- "请告诉我你如何评估这个供应商。"
- "是什么会促使你从当前供应商转向其他供应商?"
- "这个广告创意是否有任何让人困惑的地方?"
不那么有用的问题:
- "请告诉我你去年夏天换保险公司的具体时刻。"
第一个问题集合要求受访者对偏好、反应和评价标准进行推理,这是LLMs可靠的领域。第二个问题集合则要求他们提供虚构的自传式细节,而这会被LLMs幻想出来。
合成受访者与真实受访者
在2026年,诚实的框架是互补而非竞争。
| 维度 | 合成受访者 | 真实受访者 |
|---|---|---|
| 每项研究时间 | 几分钟到几小时 | 3到6周 |
| 每项研究成本 | 订阅成本摊销 | 数千到数万美元 |
| 迭代 | 免费且即时 | 每一轮都是新的出场 |
| 难以到达的受众 | 微不足道 | 通常不切实际 |
| 统计验证 | 仅方向性 | 有力的人口估算 |
| 新行为预测 | 不可靠 | 真实信号 |
| 生活经验细微差别 | 有限 | 完整 |
有效的模式是:前80%的环节使用合成(概念筛选、信息迭代、细分探索、多市场比较),最后20%使用真实受访者(验证、核心声明、相关法规或公关方面的数字)。
有关更深入的准确性差异,请参阅合成与真实受访者:准确性差距如何分解。
合成受访者小组的样子
大多数团队在群组中而非单独使用合成受访者。一个典型的小组:
- 50到500名人物
- 根据重要程度分层的人口和行为参数
- 在有可能的情况下,基于真实前期数据校准
- 针对研究工具(问卷、概念测试、广告预测试、焦点小组讨论)进行运作
- 输出:构造的定量数据加上开放式定性回应
在Minds上,这不过在一个屏幕上的设置。你定义受众,平台生成小组,并像使用研究工具那样进行查询。
何时合成受访者并非最佳工具
以下三种情况不适合使用合成受访者:
统计验证的定量。 任何需要捍卫为"X百分比的美国成年人口认为Y" 的内容都需要真实操作。
真正的新类别。 产品、服务或事件在LLM的训练分布中没有类比。合成受访者会做出没有信号的似乎合理的猜测。
感觉或情感反应。 对电视广告、包装设计或实体产品的反应需要真人感知。合成受访者可以推理,但无法感受。
开始使用
理解合成受访者的最快方法是启动一个并进行一小时询问。
开始免费 Minds 账户,为你的目标受众配置一个受访者,并提出你已经等了三周要发送的问题。答案可能不是最终答案,但将是一个比你目前拥有的任何答案都更好的起点。