--- title: "什么是合成受访者?定义、用例与准确性" description: "合成受访者是能够像目标受众真实成员那样回答研究问题的AI人物。本篇文章将介绍其工作原理及适用场景。" canonical_url: "https://getminds.ai/blog/zh/what-are-synthetic-respondents" last_updated: "2026-05-20T17:16:34.021Z" --- # 什么是合成受访者? 合成受访者是由大型语言模型生成并基于人口统计、心理特征和行为参数调教的AI人物,能够像定义的目标受众的真实成员那样回答研究问题。 在传统研究中,你需要招募500名真人,筛选、安排、进行调查、等待结果、加权数据并撰写报告。而使用合成受访者,你只需描述你想要的500个人,平台便会生成这些人物,并在几分钟内实现查询。 这种方法有时被称为硅取样、AI人物研究、合成问卷调查研究,或者干脆称为AI市场研究。实际上回答你问题的基本单位即是合成受访者。 ## 合成受访者如何构建 合成受访者由三层组成: **1. 前沿LLM。** GPT类、Claude类、Gemini类模型。模型提供了一般的推理和语言能力。 **2. 人物调教。** 人口统计和心理特征输入(年龄、地域、家庭收入、职业、态度、行为、先前品牌接触)将模型绑定到特定身份。更强的平台还会根据同一受众的真实数据进行调教,使人物行为更像受众而不是普通助理。 **3. 响应协议。** 规定人物如何回答的约束:问题格式、规模、对话风格、后续处理。这是平台差异最大的地方。有些平台强制受访者使用严格的数量级比例,其他则允许自由回答,您可以将其主题化,如同真实采访。 最终的结果是一个可以回答问卷、对广告创意做出反应、参与焦点小组讨论、经历购买场景,或作为研究小组的成员参加多周纵向研究的受访者。 ## 合成受访者的用途为何(而不仅仅是LLM的包装) 许多尝试合成受访者而不成功的团队,通常只试验过简单包装的LLM,通过提示"你是一位34岁的市场经理"来提问。这对随意探索可能有效,但在面对研究级别的审核时会失败。 一个有用的合成受访者有四个特性: **对真实受众的忠实度。** 人物应根据真实的前期数据(如客户小组、客户关系管理分段、研究)进行校准,不仅仅是一个职位和年龄。 **不同意与反驳。** 真实受访者会说"我不会买",他们可能误解问题,并且在后续中可能会改变主意。一个总是同意的受访者是聊天机器人,而不是研究工具。 **可靠性评分。** 每个回答都应附有内部可靠性或一致性估算,以便标记低可信度答案。如果对每个输出都盲信,最终会信错东西。 **重现性。** 若明天用同一人物对同一刺激进行测验,结果应具有统计上的相似性,而不是截然不同的数据。这也是合成受访者可审核的原因。 ## 合成受访者可以被问什么 你可以问他们任何你会问具有同样限制条件的真实受访者的问题:问题必须更注重一般推理而非独特的生活经验。 有用的问题: - *"你会考虑购买这三个产品概念中的哪一个?"* - *"是什么让你对这种宣传信息感到担忧?"* - *"请告诉我你如何评估这个供应商。"* - *"是什么会促使你从当前供应商转向其他供应商?"* - *"这个广告创意是否有任何让人困惑的地方?"* 不那么有用的问题: - *"请告诉我你去年夏天换保险公司的具体时刻。"* 第一个问题集合要求受访者对偏好、反应和评价标准进行推理,这是LLMs可靠的领域。第二个问题集合则要求他们提供虚构的自传式细节,而这会被LLMs幻想出来。 ## 合成受访者与真实受访者 在2026年,诚实的框架是**互补而非竞争**。
维度 合成受访者 真实受访者
每项研究时间 几分钟到几小时 3到6周
每项研究成本 订阅成本摊销 数千到数万美元
迭代 免费且即时 每一轮都是新的出场
难以到达的受众 微不足道 通常不切实际
统计验证 仅方向性 有力的人口估算
新行为预测 不可靠 真实信号
生活经验细微差别 有限 完整
有效的模式是:前80%的环节使用合成(概念筛选、信息迭代、细分探索、多市场比较),最后20%使用真实受访者(验证、核心声明、相关法规或公关方面的数字)。 有关更深入的准确性差异,请参阅[合成与真实受访者:准确性差距如何分解](/blog/synthetic-vs-real-respondents-accuracy)。 ## 合成受访者小组的样子 大多数团队在群组中而非单独使用合成受访者。一个典型的小组: - 50到500名人物 - 根据重要程度分层的人口和行为参数 - 在有可能的情况下,基于真实前期数据校准 - 针对研究工具(问卷、概念测试、广告预测试、焦点小组讨论)进行运作 - 输出:构造的定量数据加上开放式定性回应 在[Minds](/)上,这不过在一个屏幕上的设置。你定义受众,平台生成小组,并像使用研究工具那样进行查询。 ## 何时合成受访者并非最佳工具 以下三种情况不适合使用合成受访者: **统计验证的定量。** 任何需要捍卫为"*X百分比的美国成年人口认为Y*" 的内容都需要真实操作。 **真正的新类别。** 产品、服务或事件在LLM的训练分布中没有类比。合成受访者会做出没有信号的似乎合理的猜测。 **感觉或情感反应。** 对电视广告、包装设计或实体产品的反应需要真人感知。合成受访者可以推理,但无法感受。 ## 开始使用 理解合成受访者的最快方法是启动一个并进行一小时询问。 [开始免费 Minds 账户](/),为你的目标受众配置一个受访者,并提出你已经等了三周要发送的问题。答案可能不是最终答案,但将是一个比你目前拥有的任何答案都更好的起点。 有关更广泛的类别,请参阅[什么是合成市场研究](/blog/what-is-synthetic-market-research)。有关学术基础,请参阅[硅取样](/blog/silicon-sampling)。