C6. 専門特化AI Agent の設計に必要なもの

前章 C5 で、AI プロダクトの差別化はモデルの外側 ── ハーネスモデルを乗りこなす外側の装具とドメイン知識に移ると論じました。ここで読者が当然抱く問いを、先に置いておきます。

LLM大規模言語モデルがこれだけ汎用的に賢くなった時代に、わざわざ「特定領域の AI Agent」を作る意味はどこにあるのか。汎用 LLM にプロンプトを渡せば、たいていのことは答えてくれるのではないか。

この章は、その問いを正面から扱います。結論を先に出しません。事実を順番に積み上げます。

ハーネスを設計するとは「判断ポイントを言語化する」こと

前章で引いた Anthropic の Rajasekaran 氏の一文を、もう一度読み直します。

every component in a harness encodes an assumption about what the model can't do on its own.

ハーネスのあらゆるコンポーネントは、モデル単体ではできないことについての仮定を符号化している。

— Prithvi Rajasekaran（Anthropic Labs）出典：Anthropic Engineering Blog "Harness design for long-running application development"（2026年3月24日）

この一文を、設計者の視点で言い直すと、こうです。ハーネスを書くには、まず「どこで・何を・なぜ判断しなければならないか」が言語化されている必要がある。判断ポイントが特定されていない領域で、モデルに何かを丸投げしても、出てくるのは雰囲気だけ整った文章です。意思決定には使えません。

したがって、専門特化 AI Agent を作るために本当に必要なのは、3つの言語化です。

ハーネス設計に必要な言語化

判断ポイント 業務のどの瞬間に、何を決めなければならないのか。判断が発生する具体的な場面を切り出す
判断軸 その判断は、何を基準に下されるのか。必須条件・加点条件・トレードオフを構造化する
観測可能シグナル 判断軸に値を入れるための観測対象は何か。どこを見れば判断材料が手に入るのか

この3つが揃って初めて、LLM はその領域で「使える知能」になります。逆に言えば、この3つを書ける人がいない領域では、どんなにモデルが賢くなっても、専門特化 AI Agent は組み上がりません。

具体例：A4 で扱った「マージンが個人成績に反映されるか」という事実

抽象論を続けても説得力は出ません。1つだけ、具体例を深く掘らせてください。A4「重点パートナーの絞り込み」で扱った、必須条件のひとつです。

パートナーさんの営業の方々の評価制度を必ず確認するというお話です。営業マンの方ってどうしても自分の評価にならない商材ってなかなか売りたがらないんです。

— 樫山知拓氏（株式会社インフォマートパートナー事業部副部長）出典：パートナー様からの商談数（紹介数）を伸ばすためにやるべきこと（partnersales.biz セミナーレポート）

パートナー企業がいくら自社プロダクトに前向きでも、目の前の営業担当の 個人評価 にマージンが反映されない限り、その担当者は動きません。理由は単純で、営業は誰しも自分の予算を背負っているからです。説得や勉強会では覆りません。

この事実は、樫山氏が公開セミナーで語ったので、いまこうして文字としても残っています。けれど、ここから先がポイントです。この発言を「Tier階層・重要度ランク判定の必須条件」として位置づけられるかどうかは、別の作業 です。

同じ事実から、3通りの読み方ができる

読み方A：印象に残る話 「営業マンの心理についての面白い話」として記憶に残る。自分の現場で意識する材料にする
読み方B：マージン設計の論点 「自社のレベニューシェア設計を見直すべきだ」という社内議論の入口にする
読み方C：判定軸への翻訳 「マージンが個人成績に反映されるか YES/NO」という観測可能な必須条件として、Tier 判定ロジックに組み込む

Aは消費、Bは内省、Cは設計です。汎用 LLM に「樫山氏のこの発言をどう読むか」と聞けば、AかB相当の答えは返ってきます。けれど、Cの読み方 ── これを必須条件として、足切りロジックの一段目に置く ── という発想は、現場で同じ失敗を何度も見てきた人間にしか書けません。

実際に A4 では、必須条件はこの「マージンが個人成績に反映されるか」を含む4つで構成されています。1つでも欠けたら重点支援から外す、という運用です。なぜそこまで強い扱いにできるか ── マージンが個人成績に反映されないパートナーに、いくら共同マーケや勉強会のリソースを投下しても 構造的に動かない という観察が、複数の事業会社に共通して存在しているからです。

SmartHR の清水氏も、同じ判定の入口で「予算（本気度）」を必ず聞くと述べています。

まず予算ですね。どれくらいの予算を本気で持たれているのかは間違いなく聞きます。4月〜5月くらいまでに部長はある程度方針を固めて支店に展開していくので、そのタイミングで必ず「どういう戦略を持っていらっしゃるんですか」と聞いて、その背景・目的と予算をセットで確認します。

— 清水健太氏（株式会社SmartHR パートナービジネス事業本部第2アライアンス営業部部長）出典：パートナービジネスのTier戦略と組織攻略のリアル ― スマートドライブ×SmartHR（partnersales.biz セミナーレポート）

マージン×個人成績反映、予算×本気度。異なる事業会社の登壇者が、独立に、同じ性質のチェック項目を語っている。これが「観察可能な必須条件として一段目に置く」という設計判断の根拠になります。一発言だけなら個人の流儀ですが、複数の事業会社に共通して観察される現象は、ハーネスに組み込んでよい構造です。

同じ性質の事実が、A1〜A6 に大量に詰まっている

いま掘り下げた「マージン×個人成績反映」は、たった1つの判定軸です。同じ性質の事実 ── 現場で繰り返し観察され、複数の登壇者が独立に語り、観測可能シグナルとして翻訳できるもの ── が、Section A の各章に積み上がっています。

例として、A5「キーマンの探し方」で示された5階層のキーマン語彙を見てください。決裁者・メインカウンターパート・トップセールス・チャンピオン・案件創出者。これは「キーマン」という単数語を、機能の違いで5つに分解したものです。

組織内での各部署（企画、現場）のキードライバーを見極めた上で正しいアプローチを行うことが重要。ある会社は企画部門を抑えると全国の営業に波及していくっていうパートナー企業もあれば、一方で企画部門の人たちを抑えても、なかなか営業現場に落ちなくて結果として営業現場を抑えることが重要というパートナー企業もあります。

— 三宅氏（HENNGE株式会社）出典：パートナー売上比率9割以上！HENNGE・LINE WORKSの2社の秘密に迫るパートナーセールスセミナー（partnersales.biz セミナーレポート）

三宅氏のこの発言は、「キーマンを人として探すと失敗する。機能として配置を読まないと当たらない」という現場感を、別の言葉で言い直したものです。企画が効く会社、現場が効く会社、それぞれで 機能の重力 が違う ── ここを5階層で記述できるからこそ、SoR事実の唯一の記録元のコンタクトレコードに「役割バッジ」というスキーマが置けます。1人が複数階層を兼ねるケースも、別人が同じ階層に2人いるケースも、構造的に表現できます。

さらに A6「営業人材の発掘」では、同じ「観察 → 言語化 → 仕組み化」の作業が、もっと細かい粒度で行われています。

真剣にメモを取る人の席の場所と特徴を覚えておく。「類友」の発想で「成績の良い営業担当の周囲に注目」。パートナービジネスって、「誰から聞いたか」が本当に大きい。

— 佐々木千穂氏（株式会社Grow up）出典：第二回PSラジオ（partnersales.biz セミナーレポート）

佐々木氏のこの発言には、3つの観測軸が同居しています ── 席の位置、メモの取り方、周囲の人脈。「拡販人材を発掘するときに、勉強会の現場で何を見ればいいか」という問いに、ここまで具体的な観察対象を挙げられる発話は稀です。これを「観測可能シグナル」として SoA次の一手を提案する層の入力に登録できれば、勘ではなく仕組みで拡販人材を浮かび上がらせられます。

Section A 全体を、判断ポイント・判断軸・シグナルというフレームで一覧にすると、こうなります。

Section A の判断ポイント / 判断軸 / シグナル

A1：直販との根本的な違い ── 4層構造 判断ポイント＝関係者をどの単位で捉えるか／判断軸＝ベンダー・パートナー企業・担当者・エンドユーザーの4層／シグナル＝5軸データの分離記録
A2：レバレッジ理論 判断ポイント＝有限のリソースをどこに配分するか／判断軸＝パートナー数 × 担当者数 × 案件創出率／シグナル＝3要素それぞれの観測値
A3：インセンティブの二重性 判断ポイント＝企業の意思か個人の意思か／判断軸＝企業評価 vs 個人評価の分離／シグナル＝マージン反映度・KPI業績を測る主要指標設定有無
A4：重点パートナーの絞り込み 判断ポイント＝Tier をどう振り分けるか／判断軸＝必須4条件 + 加点5条件／シグナル＝営業人員数・マージン×個人成績・決裁者接点・共同マーケ実績
A5：キーマンの5階層 判断ポイント＝誰に当てるか／判断軸＝決裁者・メインカウンターパート・トップセールス・チャンピオン・案件創出者／シグナル＝役割バッジ・接触頻度・発言内容
A6：行動シグナルからの拡販人材発掘 判断ポイント＝拠点の最初の1人をどう見抜くか／判断軸＝個人完結タイプ vs 組織を動かせるタイプ／シグナル＝質問頻度・勉強会での関与・KPI 保有・席の場所・類友・社内推薦

A1〜A6 は、表面的には「パートナーセールスの解説記事」に見えます。けれど中身は、判断ポイント・判断軸・観測可能シグナルが3層で揃った仕様書 です。これがハーネス設計の前提物なのです。

このフォーマット化は、現場に浸かっていないと発想できない

ここまで読まれた方には、もう自然に見えていると思います。「マージンが個人成績に反映されるか YES/NO」を Tier 判定の一段目に置く という設計判断は、樫山氏のセミナーを聞いただけでは出てきません。出てくるのは「面白い話だった」「次の打ち合わせで共有しよう」というレベルです。

判定軸として置けるようになるには、最低でも次の経験が要ります。

「発言」を「判定軸」に翻訳するために必要な経験

同じ失敗を、複数のパートナーで観察したことがある マージン×個人成績の構造が欠けたパートナーで、いくら関係を深めても拡販に繋がらなかった現場をいくつも見ている
別の登壇者が独立に同じ性質を語ったことを、繋げて聞ける 樫山氏のマージン論と、清水氏の予算×本気度論を「同じ層の必須条件」として位置づけられる
逆例を知っている マージンが反映されているのに動かないケース・反映されていないのに動くケースを把握し、ノイズを除外した本筋の構造を取り出せる
判定軸に翻訳したあと、現場で実際に試したことがある 足切りに使えるか、加点に回すべきか、判定不能になる境界はどこか ── 紙の上ではなく現場の運用で擦った経験がある

この4つを満たさないと、ある発言を「判定軸」に翻訳する作業は、構造的にできません。汎用 LLM エンジニアにも、外部の AI コンサルにも、業界経験のないコンサルにも、難しい作業です。理由は能力ではなく、観察対象に触れている時間 の問題です。

ここで先ほど引用した佐々木氏の発言に戻ります。「席の場所」「真剣さ」「周囲の人脈」── このレベルの細かさで観測対象を切り出せるのは、佐々木氏自身が現場で何百回と勉強会に同席して、拡販に繋がった営業と繋がらなかった営業を分ける何かを観察し続けてきたからです。LLM の学習データの中に、この粒度の観察ノートはほぼ存在しません。

では「集める場」と「翻訳する設計」は、同じ場所に必要

ここまでの議論を整理すると、専門特化 AI Agent を作るには、ふたつのものが 同じ場所に 必要だということが見えてきます。

専門特化 AI Agent 設計に必要な2つの条件

現場の事実が継続的に集まり続ける場 業界の登壇者・実務担当者の発言、失敗例、成功例、肌感覚 ── これらが断片ではなく流れとして入ってくる場所が必要
事実を「判断ポイント・判断軸・シグナル」に翻訳する設計眼 集まった事実から、観測可能な構造を取り出し、ハーネスのコンポーネントとして配線できる設計者が必要

どちらか一方だけでは足りません。事実を集めても翻訳できなければ、ナレッジベースが膨らむだけで現場の判断は変わらない。設計眼があっても流れ込む事実がなければ、ハーネスは想像で書かれるしかなく、現場で試した瞬間に裏切られます。

この2つの条件は、組織として揃えるのに時間がかかります。事実が集まる場は、コミュニティであれメディアであれ、関係構築に数年単位を要します。翻訳する設計眼は、その場に浸かりながら、判定軸を実際に試して擦ってきた人間の中にしか育ちません。「やろう」と決めた当日に揃えられる条件ではないのです。

synergeee は、Japan Partner Sales というコミュニティと partnersales.biz というメディアを3年以上運営してきました。本記事内で引いた樫山氏・清水氏・三宅氏・佐々木氏・荒井氏・冨樫嘉一氏・高田氏らの発言は、いずれもそこで生まれた一次情報です。そして、その一次情報を A1〜A6 という形に 判断ポイント・判断軸・シグナル として翻訳し、SoR のスキーマと SoA のロジックに転写してきました。これは自慢ではなく、上の2条件をどう満たしているかの構造的な説明です。

翻訳された構造が、ハーネスの実体になる

ここまでの議論を、ハーネス設計の実装図に落とすと、こうなります。

A1〜A6 の翻訳結果が、ハーネスのどこに入っているか

SoR の関係者スキーマ A1 の4層構造とA5の5階層キーマン語彙が、パートナー / コンタクト / エンドユーザーのレコード型と「役割バッジ」フィールドとして実装されている
SoA の Tier 判定ロジック A4 の必須4条件（YES/NO の足切り）と加点5条件（弱・中・強のスコアリング）が、提案カードの優先度算出に直接組み込まれている
SoA の関わり方の振り分け A3 のインセンティブ二重性 ── 「マージンが個人成績に反映されない」と判定されたパートナーには、深掘り施策ではなく紹介依頼に絞った関わり方を提案する分岐が入っている
SoA の観測対象リスト A6 の10の行動シグナル（質問頻度・勉強会関与・KPI 保有・席の場所・類友・社内推薦など）が、Slack・メール・Chatwork ログから抽出する観測対象として登録されている
カテゴリ宣言（PRIsynergeee が提唱する新カテゴリ） 「パートナーセールスとは何か」を A1〜A6 の構造で宣言したものが、エージェントが自分の役割を理解する前提知識として読み込まれている

これらは「やったことアピール」ではなく、「ハーネスを書こうとしたら、必然的にこの形にしかならない」という設計の説明です。判断ポイントが言語化されていなければエージェントは沈黙する。判断軸が曖昧なら、的外れな提案が量産される。シグナルが定義されていなければ、観測対象は混沌としたまま動かない。だから、A1〜A6 で言語化された3層の構造が、そのままハーネスの骨格として現れます。

言い換えると、ハーネスは ドメイン知識の影絵 です。影絵だけを綺麗に作ろうとしても、本体がなければ何も動きません。本体（A1〜A6 として翻訳された構造）があるから、影絵（SoR / SoA というハーネス）に意味が宿ります。

この章の含意

LLM 時代に専門特化 AI Agent を作る価値は、モデルの賢さの外側にあります。判断ポイントを見抜き、判断軸を構造化し、観測可能なシグナルに翻訳する ── この作業を回せる組織だけが、ハーネスを設計できます。

そしてこの翻訳作業は、現場の事実が継続的に流れ込む場と、それを観測可能な構造に翻訳する設計眼が、同じ場所に揃って 初めて成立します。どちらも、組織として揃えるのに数年単位の時間がかかります。

── ただし、ここで終わりではありません。翻訳された構造を一度ハーネスに転写して終わり、では現場で陳腐化します。使われ続けるハーネスは、判断軸とシグナルの精度を飽くなく追究し続けたハーネス です。次章 C7 では、間違ったアクションが信頼を一発で壊すという厳しい前提のもと、synergeee がハーネスの精度をどう上げ続けているのか、その運用思想に踏み込みます。

語句

SoRエス・オー・アール: System of Record。業務における "事実の唯一の記録元" を担うシステム。顧客情報なら CRM、商談なら SFA。パートナーセールス領域ではこれまで SoR 自体が存在していなかった、というのが synergeee の出発点。
SoAエス・オー・エー: System of Action。SoR を素材として "次の一手" を提案・実行する層。AI エージェントが提案カードを出すレイヤー。
PRIピー・アール・アイ: Partner Relationship Intelligence。PRM の延長として synergeee が提唱する新カテゴリ。関係性データを意思決定に駆動する層を指す。
KPIケー・ピー・アイ: Key Performance Indicator。組織や事業の業績を測る主要な指標。
LLMエル・エル・エム: Large Language Model。膨大なテキストで事前学習された生成 AI モデルの総称。GPT・Claude・Gemini など。
ハーネス: LLM 単体ではできないことを外側で支える構造（タスク分解、ツール連携、メモリ、評価、エラー復帰など）。Anthropic の用語。
Tierティア: パートナーを重要度別に分類する区分（Tier 1 / 2 / 3 など）。重点パートナー設計の基本概念。