月100時間かかっていた顧客マッチング業務を、AIエージェントの導入で10分に圧縮した。削減率99.8%、処理速度は約600倍。対象は41社の顧客企業に対するマッチング候補の選定業務だ。5段階のパイプラインを設計し、「絶対に守るべき制約」はルールベースで機械的に担保、「判断が必要な部分」のみAIに委ねるハイブリッド構成を取った。本記事では、このプロジェクトのアーキテクチャと品質保証プロセスの全容を解説する。
💡 この記事の要点(30秒で)
① 状況 = BtoBマッチング企業、41社の制約条件(1社5-15項目)を毎月手作業で照合、担当2名で月100時間
② 設計 = 5段階パイプのハイブリッド構成(「絶対に守る制約」はルールベース、「判断が必要な部分」のみAI)+ HITL承認
③ 成果 = 削減率99.8%(月100時間→10分)、処理速度約600倍、初回テストの25件の制約違反→ゼロへ
④ 設計の核 = 「制約の構造化」(暗黙知の形式知化)── これが中小企業AI化にも汎用的に効く
この案件の背景
BtoBマッチングサービスを運営する企業から、マッチング業務の効率化について相談を受けた。2025年3月から4月にかけて、CRIENの技術顧問として私がアーキテクチャ設計から開発までを担当した案件だ。
結論から言うと、この案件は私が20社以上の技術顧問を務めてきた中で、もっとも劇的な数値改善が出たプロジェクトの一つだ。ただし、その裏には初回テスト時の25件の制約違反という「想定通りの失敗」と、そこからの地道な改善があった。
自動化前の状況:月100時間、担当者2名がフル稼働
自動化前の業務フローはこうだった。
41社の顧客企業に対して、毎月マッチング候補を選定する。各社ごとに異なる制約条件がある。「この業種はNG」「この地域のみ」「過去に取引した相手は除外」「競合関係にある企業は同時に紹介しない」。こういった条件が1社あたり5〜15項目。41社分を全部把握して、矛盾なくマッチングを組む。
担当者2名体制。月100時間。1回のマッチングサイクルに約2.5時間/社。
しかもミスが出る。制約条件を見落として、NGな組み合わせを提案してしまうケースが月に数件発生していた。顧客からのクレームにつながるリスクを常に抱えていた。
この業務には3つの本質的な課題があった。
第一に、制約条件の管理が属人化していた。 各社の制約条件は担当者の頭の中とExcelの備考欄に散在。引き継ぎが発生すると情報が欠落する。
第二に、スケールしない。 41社でも月100時間。顧客が60社、80社に増えた場合、人員を比例的に増やすしかない。単純計算で80社なら月200時間。人件費だけで月50万円以上になる。
第三に、品質の上限が人間の注意力に依存する。 41社×10項目以上の制約を毎月すべてチェックする。見落としが出るのは人間としてむしろ自然なことだ。仕組みの問題であって、担当者の能力の問題ではない。
解決策:5段階パイプラインのAIマッチングシステム
アーキテクチャの核心は「AIに全部任せない」という設計思想にある。
マッチング業務には、2種類の判断がある。「絶対にダメなものを弾く」判断と、「良い組み合わせを見つける」判断だ。前者はルールベースで100%確実に処理すべきもの。後者こそAIの出番。この切り分けが、このプロジェクトの設計上もっとも重要なポイントだった。
Stage 1:データ取得
Google Sheets APIで顧客データと候補リストを自動取得する。クライアント企業はもともとGoogle Sheetsで顧客情報を管理していた。ここにAPIで接続し、41社分のデータを一括で取得する。
なぜ既存のGoogle Sheetsを使い続けたか。理由は明快だ。担当者の作業環境を変えないため。新しい管理画面を作って「ここにデータを入力してください」とやると、移行コストと心理的抵抗が発生する。既存の運用を壊さない設計は、導入成功率を大きく左右する。20社以上見てきた経験から、これは確信を持って言える。
Stage 2:制約抽出・構造化
各社の制約条件をJSON形式で構造化する。ここが一番地味だが、一番大事なステージだ。
各社の制約条件を以下のカテゴリに分類した。
| カテゴリ | 具体例 | 判定方法 |
|---|---|---|
| 除外業種 | 「飲食業はNG」 | ルールベース(完全一致) |
| 地域制限 | 「関東圏のみ」 | ルールベース(地域マスタ照合) |
| 取引履歴NG | 「A社とは過去にトラブル」 | ルールベース(履歴テーブル照合) |
| 競合関係 | 「B社とC社は同時紹介NG」 | ルールベース(競合マスタ照合) |
| 規模条件 | 「従業員50名以上」 | ルールベース(数値比較) |
| シナジー判断 | 「相互補完性が高い組み合わせ」 | AI判定 |
上5つはルールベース。下1つだけがAI判定。この比率が肝だ。「絶対NG」をAIに任せるとハルシネーションのリスクがある。機械的にフィルタリングできるものは、機械的にやる。
制約条件の構造化には約2週間かけた。41社分のExcel備考欄を一つずつ読んで、構造化データに変換する作業だ。ここを手抜きすると、後段のすべてが壊れる。
Stage 3:候補絞り込み(ルールベースフィルタリング)
Stage 2で構造化した制約条件に基づいて、Pythonで機械的にフィルタリングする。
候補プール全体から、ルールに違反するものを除外していく。除外業種に該当→除外。地域外→除外。取引履歴NG→除外。競合関係→除外。規模条件未達→除外。
このステージの処理時間は41社合計で約30秒。人間が100時間かけていた作業の大部分は、実はこの「ルールに基づく除外」だったということだ。
Stage 4:AIマッチング判定
Stage 3で残った候補に対して、Claude APIで適合度をスコアリングする。
具体的にAIが判断するのは以下の3点だ。
• シナジー評価: 2社の事業内容を比較し、相互補完性を0〜100でスコアリング
• ニーズマッチ度: 一方の「求めている」と他方の「提供できる」の一致度を評価
• 推薦理由の生成: なぜこの組み合わせが良いのかを、担当者が顧客に説明できる文章で自動生成
Claude APIへのプロンプトには、過去のマッチング成功事例(成約に至ったケース)のパターンを10件分含めている。成功パターンとの類似度も判定基準の一つだ。
ここでのポイントは、AIはあくまで「推薦」であって「決定」ではないこと。最終的なマッチングの決定は人間が行う。ヒューマン・イン・ザ・ループの設計だ。
Stage 5:結果出力
結果をGoogle Sheetsに自動出力する。マッチング候補、適合度スコア、推薦理由、注意事項がシートに書き込まれる。担当者は出力されたシートを見て、最終判断を行う。
人間がレビューするのは「AIが推薦した上位候補」のみ。全候補を1から見るのではなく、フィルタリング済み・スコアリング済みの結果をチェックするだけだ。このレビューにかかる時間が約10分。
品質保証:25件の違反からゼロへ
ここからが、この案件でもっとも学びが大きかった部分だ。
初回テスト:25件の制約違反
システムを構築して初回テストを実行したとき、25件の制約違反が検出された。想定内だ。
25件の内訳を分析すると、原因は3つに分類された。
| 原因 | 件数 | 対処 |
|---|---|---|
| 制約条件の構造化漏れ | 12件 | Excel備考欄の再精査、条件追加 |
| 制約ルールのロジック不備 | 8件 | フィルタリングコードの修正 |
| エッジケース(条件の組み合わせ) | 5件 | 複合条件ルールの追加 |
12件が「そもそもデータとして入力されていなかった制約」だ。担当者の頭の中にだけ存在していた暗黙知。これは構造化の段階で漏れていたもので、テストによって初めて可視化された。
段階的リリースで信頼を積み上げる
いきなり41社を本番運用に載せるようなことはしなかった。段階的に拡大した。
フェーズ1(5社): 制約条件がシンプルな5社で検証。違反0件を確認。
フェーズ2(10社): 制約条件がやや複雑な5社を追加。2件の新規違反パターンを検出し、ルールを追加。
フェーズ3(20社): さらに10社を追加。1件の複合条件エッジケースを発見し対処。
フェーズ4(41社全社): 全社展開。違反0件。
各フェーズの間に1週間のインターバルを設け、担当者による全件レビューを実施した。AIの推薦結果と人間の判断が一致しているかを比較検証し、不一致があればロジックを修正するサイクルを回した。
精度の検証結果
最終的な精度はこうだ。
• 制約違反: 0件(ルールベースで100%担保)
• マッチング精度(人間の判断との一致率): 95%
• 残り5%の内訳: AIの方が適切だったケース3%、人間の方が適切だったケース2%
95%の一致率のうち、AIの方が良い判断をしていた3%が興味深い。人間には「いつも紹介している相手」に偏るバイアスがあった。AIはそのバイアスなしに、データだけで判断する。結果として、人間が見落としていた好マッチを発見できたケースがあった。
Before / After:数字で見る改善
| 指標 | Before | After | 改善率 |
|---|---|---|---|
| 月間作業時間 | 100時間 | 10分 | 99.8%削減 |
| 処理速度 | 2.5時間/社 | 全41社で10分 | 約600倍 |
| 担当人員 | 2名 | 0.1名相当(レビューのみ) | 95%削減 |
| 制約違反 | 月数件 | 0件 | 100%改善 |
| マッチング精度 | ―(比較基準なし) | 人間判断と95%一致 | ― |
| スケーラビリティ | 線形(人員追加が必要) | 41社→100社でも追加工数ほぼゼロ | ― |
99.8%という数字は試算ではない。実績だ。本番稼働後2ヶ月間の実測値に基づいている。
特に注目すべきはスケーラビリティの行だ。人間がやる場合、顧客が41社から80社に倍増すれば工数も倍になる。このシステムでは、制約条件マスタに新しい企業を追加するだけで済む。処理時間はほぼ変わらない。事業成長のボトルネックが消えた。
技術的な所感:「制約の構造化」こそが自動化の核心
この案件を通じて改めて確信したことがある。AIを使った業務自動化で最も重要なのは、「AIの性能」ではない。「入力データの構造化」だ。
41社×10〜15項目の制約条件。これが担当者の頭の中とExcelの備考欄に散在していた状態で、どんなに高性能なAIを投入しても正確なマッチングはできない。制約を構造化データとして整理し、ルールベースで確実にフィルタリングする。この土台があって初めて、AIによる「判断」が活きる。
正直なところ、このプロジェクトの開発工数の約40%は、Stage 2の制約構造化に費やした。コードを書いている時間よりも、担当者にヒアリングして暗黙知を引き出す時間の方が長かった。ここが泥臭いが、ここを丁寧にやるかどうかで結果が決定的に変わる。
20社以上の技術顧問をやってきて、AI導入が失敗するパターンの7割は「入力データの品質問題」に帰着する。AIの選定や実装は残りの3割だ。華やかなAI技術の話の前に、まずデータを整理する。CRIEN式AI導入メソッドの第一フェーズが「診断(現状業務の棚卸しとデータ整理)」から始まるのは、この経験に基づいている。
もう一つの教訓:ヒューマン・イン・ザ・ループは妥協ではない
「100%自動化ではなく、最終判断は人間がやるんですね」と言われることがある。
これは妥協ではない。設計だ。
マッチングビジネスにおいて、「この組み合わせを提案します」という行為は、顧客との信頼関係に直結する。AIが99%正しい判断をしても、残り1%のミスが顧客の信頼を損なう可能性がある。その1%を人間がカバーする。
しかも、この設計にはもう一つの利点がある。担当者がAIの推薦結果を毎月レビューすることで、AIのロジックに対する信頼が徐々に醸成される。「ブラックボックスで怖い」という感覚が、「自分で確認しているから安心」に変わる。導入初期にこのプロセスを省略すると、現場の不信感が蓄積して、半年後に「やっぱり手動に戻したい」という事態になりかねない。
🏢 CRIEN視点 ── 業務の暗黙知を構造化することは、CRIENが「まるごとAI顧問」で日々やっていることそのものだ。経営者が「AI家庭教師」で自分の業務を分解できるようになると、AI化の打ち手が一気に見えてくる。これは Forward Deployed Engineer(FDE)モデル の中小企業実装。同様の「ルール+AIのハイブリッド」設計は CS自動化事例 や マーケ23業務自動化 でも採用している。
FAQ
Q. 41社分の制約条件の構造化にはどのくらい時間がかかりましたか?
約2週間だ。最初の1週間で担当者へのヒアリングとExcelの備考欄を精査し、残りの1週間でJSON形式への変換とルールの実装を行った。企業数が多いほど時間はかかるが、一度構造化すれば以降の更新はスプレッドシート上の修正だけで済む。
Q. Claude APIのコストは月間どのくらいですか?
41社分のマッチング判定で月間のAPI利用料は約3,000〜5,000円程度だ。Stage 3までのルールベースフィルタリングで候補を大幅に絞り込んでからAIに渡すため、トークン消費量は抑えられている。月100時間の人件費(時給換算で50〜100万円相当)と比較すると、コスト差は歴然だ。
Q. マッチングの精度を上げるためにどんなチューニングをしていますか?
主に3つだ。(1) 成功事例のパターンを定期的にプロンプトに追加(月1回更新)、(2) 担当者のレビューで不適切と判断されたケースのフィードバックを反映、(3) 制約条件マスタの定期メンテナンス。特に(2)が重要で、人間のフィードバックが蓄積されるほどAIの判断精度は上がっていく。
Q. 他のAI(GPT-4等)でも同じことはできますか?
技術的には可能だ。Stage 4のAIマッチング判定はClaude APIに限定されない。ただし、プロンプト設計はモデルごとに最適化が必要で、そのまま差し替えるだけでは精度が変わる可能性がある。今回Claude APIを採用した理由は、長い制約条件リストと候補データを一度に処理するための長いコンテキストウィンドウと、日本語での推薦理由生成の自然さだ。
Q. 導入にかかる期間と費用の目安は?
今回のケースでは、設計・開発・テスト・段階的リリースを含めて約2ヶ月、費用は技術顧問料込みで数百万円規模だ。ただし、ROI(投資対効果)は極めて高い。月100時間の工数削減を人件費に換算すると、年間で数百万〜1千万円以上のコスト削減になる。初年度で投資回収できるケースがほとんどだ。
マッチング業務の自動化を検討されている方へ
「手動マッチングに工数がかかりすぎている」「顧客数が増えるとスケールしない」「制約条件の見落としが怖い」。こういった課題を抱えているなら、5段階パイプラインの設計思想は参考になるはずだ。
すべてをAIに丸投げするのではなく、ルールベースとAI判定を適切に分離する。段階的にテストして品質を積み上げる。既存のツール(Google Sheets等)をそのまま使って導入障壁を下げる。この3原則を守れば、マッチング業務に限らず多くの「判断を伴う反復業務」に同じアプローチが適用できる。
CRIENでは、こうした業務自動化の設計・開発を含む技術顧問サービス「まるごとAI顧問」を提供している。月額5万円からの伴走支援で、現状の業務分析から自動化の設計・実装・運用定着までを一気通貫でサポートする。まずは無料相談で、自動化の余地がどこにあるかを一緒に見つけるところから始めたい。