---
title: "什么是合成受访者？定义、用例与准确性"
description: "合成受访者是能够像目标受众真实成员那样回答研究问题的AI人物。本篇文章将介绍其工作原理及适用场景。"
canonical_url: "https://getminds.ai/blog/zh/what-are-synthetic-respondents"
last_updated: "2026-05-20T17:16:34.021Z"
---

# 什么是合成受访者？

合成受访者是由大型语言模型生成并基于人口统计、心理特征和行为参数调教的AI人物，能够像定义的目标受众的真实成员那样回答研究问题。

在传统研究中，你需要招募500名真人，筛选、安排、进行调查、等待结果、加权数据并撰写报告。而使用合成受访者，你只需描述你想要的500个人，平台便会生成这些人物，并在几分钟内实现查询。

这种方法有时被称为硅取样、AI人物研究、合成问卷调查研究，或者干脆称为AI市场研究。实际上回答你问题的基本单位即是合成受访者。

## 合成受访者如何构建

合成受访者由三层组成：

**1. 前沿LLM。** GPT类、Claude类、Gemini类模型。模型提供了一般的推理和语言能力。

**2. 人物调教。** 人口统计和心理特征输入（年龄、地域、家庭收入、职业、态度、行为、先前品牌接触）将模型绑定到特定身份。更强的平台还会根据同一受众的真实数据进行调教，使人物行为更像受众而不是普通助理。

**3. 响应协议。** 规定人物如何回答的约束：问题格式、规模、对话风格、后续处理。这是平台差异最大的地方。有些平台强制受访者使用严格的数量级比例，其他则允许自由回答，您可以将其主题化，如同真实采访。

最终的结果是一个可以回答问卷、对广告创意做出反应、参与焦点小组讨论、经历购买场景，或作为研究小组的成员参加多周纵向研究的受访者。

## 合成受访者的用途为何（而不仅仅是LLM的包装）

许多尝试合成受访者而不成功的团队，通常只试验过简单包装的LLM，通过提示"你是一位34岁的市场经理"来提问。这对随意探索可能有效，但在面对研究级别的审核时会失败。

一个有用的合成受访者有四个特性：

**对真实受众的忠实度。** 人物应根据真实的前期数据（如客户小组、客户关系管理分段、研究）进行校准，不仅仅是一个职位和年龄。

**不同意与反驳。** 真实受访者会说"我不会买"，他们可能误解问题，并且在后续中可能会改变主意。一个总是同意的受访者是聊天机器人，而不是研究工具。

**可靠性评分。** 每个回答都应附有内部可靠性或一致性估算，以便标记低可信度答案。如果对每个输出都盲信，最终会信错东西。

**重现性。** 若明天用同一人物对同一刺激进行测验，结果应具有统计上的相似性，而不是截然不同的数据。这也是合成受访者可审核的原因。

## 合成受访者可以被问什么

你可以问他们任何你会问具有同样限制条件的真实受访者的问题：问题必须更注重一般推理而非独特的生活经验。

有用的问题：

- *"你会考虑购买这三个产品概念中的哪一个？"*
- *"是什么让你对这种宣传信息感到担忧？"*
- *"请告诉我你如何评估这个供应商。"*
- *"是什么会促使你从当前供应商转向其他供应商？"*
- *"这个广告创意是否有任何让人困惑的地方？"*

不那么有用的问题：

- *"请告诉我你去年夏天换保险公司的具体时刻。"*

第一个问题集合要求受访者对偏好、反应和评价标准进行推理，这是LLMs可靠的领域。第二个问题集合则要求他们提供虚构的自传式细节，而这会被LLMs幻想出来。

## 合成受访者与真实受访者

在2026年，诚实的框架是**互补而非竞争**。

<table>
<thead>
  <tr>
    <th>
      维度
    </th>
    
    <th>
      合成受访者
    </th>
    
    <th>
      真实受访者
    </th>
  </tr>
</thead>

<tbody>
  <tr>
    <td>
      每项研究时间
    </td>
    
    <td>
      几分钟到几小时
    </td>
    
    <td>
      3到6周
    </td>
  </tr>
  
  <tr>
    <td>
      每项研究成本
    </td>
    
    <td>
      订阅成本摊销
    </td>
    
    <td>
      数千到数万美元
    </td>
  </tr>
  
  <tr>
    <td>
      迭代
    </td>
    
    <td>
      免费且即时
    </td>
    
    <td>
      每一轮都是新的出场
    </td>
  </tr>
  
  <tr>
    <td>
      难以到达的受众
    </td>
    
    <td>
      微不足道
    </td>
    
    <td>
      通常不切实际
    </td>
  </tr>
  
  <tr>
    <td>
      统计验证
    </td>
    
    <td>
      仅方向性
    </td>
    
    <td>
      有力的人口估算
    </td>
  </tr>
  
  <tr>
    <td>
      新行为预测
    </td>
    
    <td>
      不可靠
    </td>
    
    <td>
      真实信号
    </td>
  </tr>
  
  <tr>
    <td>
      生活经验细微差别
    </td>
    
    <td>
      有限
    </td>
    
    <td>
      完整
    </td>
  </tr>
</tbody>
</table>

有效的模式是：前80%的环节使用合成（概念筛选、信息迭代、细分探索、多市场比较），最后20%使用真实受访者（验证、核心声明、相关法规或公关方面的数字）。

有关更深入的准确性差异，请参阅[合成与真实受访者：准确性差距如何分解](/blog/synthetic-vs-real-respondents-accuracy)。

## 合成受访者小组的样子

大多数团队在群组中而非单独使用合成受访者。一个典型的小组：

- 50到500名人物
- 根据重要程度分层的人口和行为参数
- 在有可能的情况下，基于真实前期数据校准
- 针对研究工具（问卷、概念测试、广告预测试、焦点小组讨论）进行运作
- 输出：构造的定量数据加上开放式定性回应

在[Minds](/)上，这不过在一个屏幕上的设置。你定义受众，平台生成小组，并像使用研究工具那样进行查询。

## 何时合成受访者并非最佳工具

以下三种情况不适合使用合成受访者：

**统计验证的定量。** 任何需要捍卫为"*X百分比的美国成年人口认为Y*" 的内容都需要真实操作。

**真正的新类别。** 产品、服务或事件在LLM的训练分布中没有类比。合成受访者会做出没有信号的似乎合理的猜测。

**感觉或情感反应。** 对电视广告、包装设计或实体产品的反应需要真人感知。合成受访者可以推理，但无法感受。

## 开始使用

理解合成受访者的最快方法是启动一个并进行一小时询问。

[开始免费 Minds 账户](/)，为你的目标受众配置一个受访者，并提出你已经等了三周要发送的问题。答案可能不是最终答案，但将是一个比你目前拥有的任何答案都更好的起点。

有关更广泛的类别，请参阅[什么是合成市场研究](/blog/what-is-synthetic-market-research)。有关学术基础，请参阅[硅取样](/blog/silicon-sampling)。
维度	合成受访者	真实受访者
每项研究时间	几分钟到几小时	3到6周
每项研究成本	订阅成本摊销	数千到数万美元
迭代	免费且即时	每一轮都是新的出场
难以到达的受众	微不足道	通常不切实际
统计验证	仅方向性	有力的人口估算
新行为预测	不可靠	真实信号
生活经验细微差别	有限	完整