← 制作記一覧へ

データ精度を上げるレビュープロセス(スマホ料金比較で学んだこと)

公開: 2026-05-13 · #25 / 最終更新: 2026-06-04 データ精度AI開発ツール工房制作記

📌 記事の取り扱いについて:本記事は公開当時の体験・気づきをまとめたものです。現在のツール数・プラン数・対象年齢・記事数・仕様とは異なる場合があります。最新の内容は各ツールページをご確認ください。ツールや外部サービスの仕様・料金は変更されることがあるため、利用前には各公式情報も併せてご確認ください。記載に誤りを見つけられた場合はお問い合わせフォームよりご連絡いただけると助かります。

ツール工房のツールはどれも「データ」が主役です。ホテル検索、スマホ料金比較、楽天最安値検索、子連れスポット検索、お金診断。どのツールも、信頼できるデータがないとツールとして成立しません。

特に スマホ料金比較ツール で、データ精度の難しさを痛感しました。この記事では、そのときに学んだことを書きます。

最初の AI生成データの問題

初期版のスマホ料金比較は、21ブランド・99プラン以上のデータからスタートしました(公開後も少しずつブランド・プラン数を増やしています。現在のプラン数は公開サイト側を参照してください)。最初は AI(Claude Code)に「主要キャリアのプランを調べて整理して」と依頼して、99件分のデータを plans.json にまとめてもらいました。

ところが、何度確認しても 新しい間違いが見つかる という状態でした。

  • 割引込みの価格が割引前として登録されていた
  • 家族割の条件が抜けていた
  • すでに改定された旧プランが混ざっていた
  • データ容量の単位(GB / GB+α)が混ざっていた
  • 国内通話オプションの有無が反映されていない

「料金比較ツール」を名乗っているのに、料金が間違っていたら使い物になりません。これは公開できない状態でした。

なぜAIだけでは難しいか

AIに「主要キャリアの料金プランを調べて」と頼むと、それなりの精度のデータは出てきます。ただ、最新の細かい条件まで完全に正確 にはなりません。

理由は:

  • 学習データの時点では古い情報が混じっている
  • キャリアの公式サイトの構造が変わると、AIが情報を取り違える
  • 割引・家族割・キャンペーンなど、条件が複雑な情報は読み解きが難しい
  • 一部、ハルシネーション(事実でない情報の生成)が混じる

AIが書いた内容を そのまま信じて公開すると、必ず間違いが残る という体験をしました。

レビュープロセスを入れる

そこで、データ精度を上げるためのレビュープロセスを導入しました。

ステップ1:AIで一次データを作る

まず、AI(Claude Code)に各キャリア・MVNOのプランを整理してもらいます。これは出発点としてのドラフト。

ステップ2:別のAI(確認役)にまとめて検証させる

ドラフトに対して、別の Claude(確認役のAI)に「各プランの条件を、各社公式サイトと照らし合わせて検証してほしい」と依頼。AIが公式ページを自動で読みに行って、データのズレを報告してもらいます。

ステップ3:報告を疑って、自分で再確認

ここが重要です。確認役のAIの「全件一致」報告を信頼しすぎない ようにしました。

実例として、IIJmio のプランで、確認役のAIが「データが一致している」と報告したものの、メインの私が念のため公式ページを確認したら、実は間違いが残っていた、ということがありました。

確認役のAIはページを自動で読み取っているのですが、ページの一部だけを見て判断したり、見落としたり、というケースがあります。修正適用前に、メインのClaude(または私自身)が公式ページで裏取り することで、漏れを潰せました。

ステップ4:notes フィールドで例外を吸収

すべての条件を構造化データで完璧に表現するのは、現実的に難しいです。

そこで、各プランに notes フィールドを追加して、「この条件は注釈で説明する」 という運用にしました。割引・家族割・キャンペーン・特殊条件などは、notes で補足する形。

ステップ5:定期的な再検証

キャリアのプランは1〜2か月で改定されます。月次で再検証する自動処理を組んで、変化を検知できる仕組みにしました。

「正確に書かない」という選択肢

データ精度を追求しすぎると、逆に情報量が減る という発見もありました。

たとえば、料金プランの「実測速度」のデータ。各キャリアが公式に発表している速度は、ベストエフォートで実測値とは違います。一方で、ユーザーレポートの実測値は地域・時間帯で大きく変わるので「正確」とは言えません。

完全に正確なデータがない場合、「目安として参考になる数値を出して、注意書きを十分にする」 のが現実解だと感じました。「実測速度は公式値ではなく、公開されているユーザーレポートを参考にした目安です」と明記する形です。

私による最終確認

最後に、私自身が一度すべてのデータに目を通す ようにしました。

「AIに全部任せたい」気持ちはあるのですが、ツール公開後にユーザーから「このデータが間違っている」と指摘されるリスクを考えると、最後の人間チェックは外せません。

私が見ても気づかない間違いはありますが、それでも「AIだけ」よりは精度が上がります。

ユーザーフィードバックの組み込み

公開した後も、ユーザーから「このプランの条件が間違っているのでは?」というフィードバックを受け付けられるように、トップに「気づいた点があればリクエストフォームから」というリンクを設置しました。

これは恥ずかしさより実用性を優先した結果。完璧なデータを目指すよりも、間違いを訂正できる仕組みを持つほうが、サイト全体の信頼性は上がります。

私の感想

データ精度の問題は、AIで開発するときに 避けられない壁 だと感じました。

「AIが書いてくれた → 完成」ではなく、「AIが書いてくれた → 検証 → 修正 → 再検証 → 公開」という流れが必須。これに気づくまでに、実際に間違ったデータを公開しかけた経験もあります。

非エンジニアでもAIで開発できる時代ですが、最終的な責任は人間が持つ という意識は変わらないんだなと思いました。データ系ツールを作るときは、レビュープロセスをセットで設計するのがおすすめです。


← 他の制作記を見るトップお問い合わせ