---
title: "AI 에이전트는 어떻게 도구를 선택할까: 에이전트 디스커버리의 작동 방식"
description: "Claude, ChatGPT, Cursor는 어떤 MCP 서버를 호출할지 어떻게 결정할까요? 어떤 신호가 중요하며, 어떻게 해야 선택받는 도구가 될 수 있는지 그 내부 메커니즘을 살펴봅니다."
canonical_url: "https://getminds.ai/blog/ko/how-ai-agents-choose-tools-mcp-discovery-mechanics"
last_updated: "2026-06-02T02:50:48.444Z"
---

# AI 에이전트는 어떻게 도구를 선택할까

마케터가 Claude에게 "독일 B2B SaaS를 위한 합성 고객 패널을 찾아줘"라고 요청하면, 모델은 검색 엔진을 열지 않습니다. 대신 현재 세션에 연결된 모든 MCP 도구의 설명을 읽고 순위를 매긴 다음 하나를 선택합니다. 이 순위는 도구 발견을 위한 인터넷의 새로운 첫 페이지와 같지만, 이에 최적화하는 사람은 거의 없습니다.

이 글에서는 2026년 현재 이 순위가 실제로 어떻게 작동하는지, 어떤 신호가 순위에 영향을 미치는지, 그리고 MCP 서버를 제공하는 모든 팀에게 이것이 어떤 실질적인 의미를 갖는지 자세히 설명합니다.

## 에이전트 맥락에서 '발견'의 의미

서로 구분해야 할 두 가지 발견의 단계가 있습니다.

*1단계, 레지스트리 수준.* 사용자(또는 에이전트 자체)가 디렉터리에서 MCP 서버를 찾아 클라이언트에 연결합니다. 이는 브라우저 스타일의 발견 방식입니다. 에이전트 친화적인 레지스트리, OAuth 플로우, "이 커넥터 추가" 버튼 등이 여기에 해당합니다. MCP 레지스트리, Anthropic의 디렉터리, OpenAI의 Apps SDK 디렉터리, 그리고 `mcpmarket.com` 모두 이 역할을 수행합니다. 사용자가 연결을 클릭하면 서버는 에이전트의 도구 목록에 추가됩니다.

*2단계, 세션 내 발견.* 사용자가 메시지를 보낼 때마다 에이전트는 어떤 도구를 호출할지, 또는 호출하지 않을지를 결정해야 합니다. 이것이 바로 실제 사용량을 좌우하는 단계입니다. 서버가 연결되어 있어도 에이전트가 항상 다른 것을 선택한다면 몇 달 동안 한 번도 호출되지 않을 수 있습니다. 이것이 진정한 순위가 결정되는 곳이지만, 이에 대해 이야기하는 사람은 거의 없습니다.

이 글의 나머지 부분은 2단계에 관한 것입니다.

## 에이전트가 실제로 보는 것

MCP 서버가 연결되면, 서버는 자신이 노출하는 모든 도구를 설명하는 핸드셰이크를 보냅니다. 각 도구에 대해 에이전트는 다음 정보를 받습니다.

- 이름 (예: `create_panel`)
- 짧은 설명 (1~3 문장, 서버 제작자가 작성)
- 입력 매개변수에 대한 JSON 스키마
- 선택적 구조화 메타데이터 (주석, 예시, 반환 유형)

이것이 전부입니다. 에이전트는 여러분의 웹사이트, 가격, 문서, 블로그를 보지 않습니다. 여러분의 전체 제품에서 가장 영향력 있는 글은 도구 등록 시의 설명 문자열입니다.

이는 불편한 사실을 시사합니다. 훌륭한 도구라도 설명이 모호하면, 평범하지만 설명이 명확한 도구에 매번 밀린다는 것입니다.

## 순위 결정 과정 단계별 분석

사용자가 메시지를 보내면 에이전트는 대략 다음과 같은 과정을 거칩니다.

1. *관련성 있는 도구 필터링.* 모델은 자신의 컨텍스트(지금까지의 대화, 사용자의 최신 메시지)를 읽고 후보군을 식별합니다. 도구 세트가 작을 경우(20개 미만) 보통 모든 도구를 고려합니다. 도구 세트가 클 경우 먼저 필터링을 거칩니다.
2. *설명 일치도에 따른 점수 산정.* 각 후보 도구에 대해 모델은 설명이 사용자의 의도와 얼마나 잘 일치하는지 평가합니다. 이는 키워드 일치가 아닌 부드러운 의미론적 일치입니다. 동의어도 작동합니다. 도메인 언어도 작동합니다. 모호한 설명은 실패합니다.
3. *호출 구성.* 도구가 선택되면 모델은 대화 컨텍스트에서 매개변수를 채웁니다. 모호한 필드(예: 매개변수가 없는 "options" 객체)를 요구하는 스키마를 가진 도구는 모델이 올바르게 호출할 수 있다는 확신이 적기 때문에 불이익을 받습니다.
4. *선택적 연쇄 호출.* 다단계 작업의 경우 모델은 첫 번째 도구를 선택하고 실행한 다음 결과를 읽고 반복합니다. 구조화되고 에이전트가 읽을 수 있는 출력을 반환하는 도구는 후속 호출을 받을 가능성이 높습니다. 장문의 텍스트를 반환하는 도구는 연쇄 작업을 중단시킵니다.

이 모든 과정은 단 한 번의 추론 과정에서 일어납니다. 별도의 순위 모델은 없습니다. 원격 측정 피드백 루프도 (아직) 없습니다. 결정은 오직 설명과 스키마에 근거해서만 내려집니다.

## 실제로 순위에 영향을 미치는 요소

관찰된 에이전트 행동을 역으로 분석해 보면, 다음 네 가지가 도구 선택에 명백한 영향을 미칩니다.

*설명의 구체성.* "시장 조사 실행"은 "합성 고객 패널을 특정 잠재고객 페르소나에 대해 실행하고 요약된 결과 반환"에 밀립니다. 더 긴 설명은 모델이 파악할 수 있는 더 많은 단서를 제공하므로 더 많은 쿼리와 일치합니다. 예산(대부분의 에이전트는 약 500자 이후의 설명을 잘라냄)이 있지만 대부분의 서버는 이에 훨씬 못 미칩니다.

*동사-주어-목적어 구조.* 에이전트는 사용자가 사용한 동사와 일치하는 설명의 도구를 선택합니다. "내 고객에게 물어보기"는 `query_panel_responses`보다 `ask_panel`와 더 잘 일치합니다. 이름과 설명 모두 행동으로 시작해야 합니다.

*구체적인 출력 형태.* "패널 결과 반환"보다는 "`panel_id`, `responses`, `summary` 필드를 포함하는 JSON 객체 반환"이 더 좋습니다. 에이전트는 출력으로 무엇을 할지 예측할 수 있을 때 도구를 호출할 가능성이 더 높습니다.

*스키마 분석 용이성.* 모델이 컨텍스트(텍스트 설명, 숫자)에서 채울 수 있는 필수 필드가 있는 스키마가 호출됩니다. 호출 중간에 사용자 입력(인증 토큰, 내부 ID)이 필요한 필수 필드가 있는 스키마는 처음부터 끝까지 실행할 수 있는 도구에 밀려 건너뛰게 됩니다.

## 아직 순위에 영향을 미치지 않는 요소

중요한 것처럼 이야기되지만 2026년 현재 그렇지 않은 것들의 목록입니다.

- *레지스트리의 별점 수.* 1단계에서의 발견 가능성에는 영향을 주지만, 2단계에서는 무관합니다.
- *SEO 방식의 키워드 채워넣기.* 모델은 의미론적으로 일치시키지, 키워드로 일치시키지 않습니다. 설명에 "에이전트 연구 AI 패널 MCP"를 채워 넣는 것은 도움이 되지 않습니다.
- *브랜드 인지도.* 모델은 세션 내 단계에서 기존 브랜드보다 알려지지 않은 브랜드를 선호하지 않습니다. 설명의 품질이 승리합니다.
- *500ms 미만의 지연 시간.* 모델은 순위를 매길 때 도구 호출 시간을 측정하지 않습니다. 느리지만 유용한 도구는 여전히 호출됩니다.

이것은 변할 것입니다. 평가 점수, 호출 후 만족도 신호, 스팸 방지 순위는 모두 주요 호스트의 로드맵에 있습니다. 하지만 오늘날에는 설명이 핵심입니다.

## 스팸 방지 문제

이 모든 것의 자연스러운 결과는 누구나 매우 길고 키워드가 밀집된 설명을 작성하여 순위를 조작할 수 있다는 것입니다. 호스트들도 이를 알고 있습니다. Anthropic, OpenAI 및 MCP 레지스트리 관리자들은 모두 2026년 후반부터 설명 채워넣기를 막기 시작했습니다.

두 가지 스팸 방지 메커니즘이 등장하고 있습니다.

*스키마 유효성 검사.* 선언된 스키마가 실제 응답 형태와 일치하지 않는 도구는 순위가 낮아지거나 제거됩니다.

*교차 호스트 평가 점수.* MCP 레지스트리는 등록된 서버에 대해 프롬프트를 실행하고 정확도 점수를 보고하는 공개 평가 스위트를 시범 운영하고 있습니다. 평가에 실패한 서버는 경고를 받고, 그 다음에는 제거됩니다.

2026년 중반 현재 둘 다 완전히 시행되지는 않았지만, 곧 도입될 것입니다. 취해야 할 자세는 단순히 키워드 일치 세계에서 이기는 설명이 아니라, 품질 점수 기반 세계에서 이길 수 있는 설명을 작성하는 것입니다.

## 서버 제작자를 위한 실용적인 권장 사항

MCP 서버를 제공한다면, 다음 변경 사항을 통해 세션 내 선택률을 눈에 띄게 향상시킬 수 있습니다.

1. *모든 도구 설명을 사용자가 사용할 만한 동사로 시작하도록 다시 작성하세요.* "패널 실행기"가 아니라 "대상 고객에 대해 고객 조사 패널을 실행하고 요약된 응답을 반환합니다."
2. *설명에 출력 형태를 명시하세요.* "`responses` 배열, `themes` 필드, `summary` 필드를 포함하는 JSON 객체를 반환합니다." 이는 에이전트가 후속 호출을 연쇄적으로 수행할 수 있다는 확신을 줍니다.
3. *필수 필드는 컨텍스트에서 채울 수 있도록 만드세요.* 필드에 내부 ID가 필요한 경우, 이름을 받아 서버 측에서 확인하도록 하세요. 에이전트는 예측할 수 없는 필수 필드가 있는 도구를 건너뜁니다.
4. *도구 설명당 200~400자를 사용하세요.* 100자 미만은 너무 부족합니다. 500자를 초과하면 대부분의 클라이언트에서 잘립니다.
5. *도구 수를 점검하세요.* 30개 이상의 도구를 가진 서버는 에이전트가 순위를 매기기도 전에 필터링됩니다. 가능한 경우 관련 도구를 결합하세요. 60개 도구를 가진 서버가 12개 도구를 가진 서버보다 선택률이 낮은 경우를 보았습니다. 모델이 롱테일 도구를 보지 못하기 때문입니다.

이러한 설명을 가장 중요한 카피로 취급하는 팀은 호출을 받고 있습니다. 이를 레지스트리 부속품으로 취급하는 팀은 그렇지 않습니다.

## 향후 전망

이러한 메커니즘은 향후 12개월 동안 더욱 확고해질 것입니다. 세 가지 변화를 예상할 수 있습니다.

*평가 기반 순위 시스템의 본격화.* 자동화된 평가에서 얻은 품질 점수가 레지스트리 목록에 나타나기 시작하고, 적어도 하나의 주요 호스트에서 세션 내 선택에 영향을 미칠 것입니다.

*에이전트 원격 측정 피드백 루프.* "과거 세션에서 만족스러운 결과를 낳은 도구가 더 높은 순위를 차지한다"는 기능을 처음으로 제공하는 주요 호스트가 다른 호스트들을 앞지를 것입니다. 이는 클릭률의 에이전트 버전이며, 최적화 목표를 바꿀 것입니다.

*수직적 에이전트 생태계.* 마케팅 에이전트, 영업 에이전트, 연구 에이전트는 각각 자체적인 표준 도구 스택을 개발할 것입니다. 모든 디렉터리에 있는 것보다 해당 분야에서 기본 도구가 되는 것이 더 중요해질 것입니다.

이 전환기에서 승리하는 도구는 MCP 설명을 제품의 첫 페이지로 취급하는 도구입니다. 그렇지 않은 도구는 기본 서비스가 아무리 훌륭하더라도 호출되지 않을 것입니다.

---

에이전트가 왜 새로운 구매자인지에 대한 더 큰 그림을 보려면 [AI 에이전트, 새로운 마케팅 구매자로 부상하다](/blog/ai-agents-new-marketing-buyer-agentic-discovery)를 참조하세요. 실제 설정에 대해서는 [Claude, ChatGPT, Cursor에서 고객 패널을 실행하는 방법](/blog/run-customer-panels-from-claude-chatgpt-cursor-mcp-guide)을 참조하세요. 잘 설명된 MCP 서버가 실제 운영 환경에서 어떻게 보이는지 확인하려면 [Minds MCP](/mcp/overview)를 참조하세요.