--- title: "什么是合成受访者?定义、用例与准确性" description: "合成受访者是能够像目标受众真实成员那样回答研究问题的AI人物。本篇文章将介绍其工作原理及适用场景。" canonical_url: "https://getminds.ai/blog/zh/what-are-synthetic-respondents" last_updated: "2026-05-20T17:16:34.021Z" --- # 什么是合成受访者? 合成受访者是由大型语言模型生成并基于人口统计、心理特征和行为参数调教的AI人物,能够像定义的目标受众的真实成员那样回答研究问题。 在传统研究中,你需要招募500名真人,筛选、安排、进行调查、等待结果、加权数据并撰写报告。而使用合成受访者,你只需描述你想要的500个人,平台便会生成这些人物,并在几分钟内实现查询。 这种方法有时被称为硅取样、AI人物研究、合成问卷调查研究,或者干脆称为AI市场研究。实际上回答你问题的基本单位即是合成受访者。 ## 合成受访者如何构建 合成受访者由三层组成: **1. 前沿LLM。** GPT类、Claude类、Gemini类模型。模型提供了一般的推理和语言能力。 **2. 人物调教。** 人口统计和心理特征输入(年龄、地域、家庭收入、职业、态度、行为、先前品牌接触)将模型绑定到特定身份。更强的平台还会根据同一受众的真实数据进行调教,使人物行为更像受众而不是普通助理。 **3. 响应协议。** 规定人物如何回答的约束:问题格式、规模、对话风格、后续处理。这是平台差异最大的地方。有些平台强制受访者使用严格的数量级比例,其他则允许自由回答,您可以将其主题化,如同真实采访。 最终的结果是一个可以回答问卷、对广告创意做出反应、参与焦点小组讨论、经历购买场景,或作为研究小组的成员参加多周纵向研究的受访者。 ## 合成受访者的用途为何(而不仅仅是LLM的包装) 许多尝试合成受访者而不成功的团队,通常只试验过简单包装的LLM,通过提示"你是一位34岁的市场经理"来提问。这对随意探索可能有效,但在面对研究级别的审核时会失败。 一个有用的合成受访者有四个特性: **对真实受众的忠实度。** 人物应根据真实的前期数据(如客户小组、客户关系管理分段、研究)进行校准,不仅仅是一个职位和年龄。 **不同意与反驳。** 真实受访者会说"我不会买",他们可能误解问题,并且在后续中可能会改变主意。一个总是同意的受访者是聊天机器人,而不是研究工具。 **可靠性评分。** 每个回答都应附有内部可靠性或一致性估算,以便标记低可信度答案。如果对每个输出都盲信,最终会信错东西。 **重现性。** 若明天用同一人物对同一刺激进行测验,结果应具有统计上的相似性,而不是截然不同的数据。这也是合成受访者可审核的原因。 ## 合成受访者可以被问什么 你可以问他们任何你会问具有同样限制条件的真实受访者的问题:问题必须更注重一般推理而非独特的生活经验。 有用的问题: - *"你会考虑购买这三个产品概念中的哪一个?"* - *"是什么让你对这种宣传信息感到担忧?"* - *"请告诉我你如何评估这个供应商。"* - *"是什么会促使你从当前供应商转向其他供应商?"* - *"这个广告创意是否有任何让人困惑的地方?"* 不那么有用的问题: - *"请告诉我你去年夏天换保险公司的具体时刻。"* 第一个问题集合要求受访者对偏好、反应和评价标准进行推理,这是LLMs可靠的领域。第二个问题集合则要求他们提供虚构的自传式细节,而这会被LLMs幻想出来。 ## 合成受访者与真实受访者 在2026年,诚实的框架是**互补而非竞争**。
| 维度 | 合成受访者 | 真实受访者 |
|---|---|---|
| 每项研究时间 | 几分钟到几小时 | 3到6周 |
| 每项研究成本 | 订阅成本摊销 | 数千到数万美元 |
| 迭代 | 免费且即时 | 每一轮都是新的出场 |
| 难以到达的受众 | 微不足道 | 通常不切实际 |
| 统计验证 | 仅方向性 | 有力的人口估算 |
| 新行为预测 | 不可靠 | 真实信号 |
| 生活经验细微差别 | 有限 | 完整 |