AIで会社を回す
Netsujoの「運用OS」を公開する
Netsujo株式会社は、京都を拠点とする少人数のスタートアップです。私たちは、AIエージェント(Claude Code)と自動化、そして「事実を仕組みで担保する」品質ゲートを組み合わせることで、少人数でも安定した品質を保つ運用を組んでいます。本記事では、その運用の中身を実装に即して公開します。
派手なAI活用論ではなく、日々の業務をどう回しているかの実際です。判断を人間が握り、実装と検証をAIに任せ、誤りは仕組みで止める——この3つを軸にした「運用OS」を、隠さずにお見せします。
この記事の要点
- ▸Netsujoは少人数で、判断は人間・実装と検証はAIエージェント(Claude Code)という役割分担で複数の事業とサイト運用を回しています。
- ▸品質は「気をつける」ではなく仕組みで担保します。第三者AIによるファクトチェック(運用ルール)、事実誤りを機械的に弾くCI(本番前に自動で強制)、出典必須のProof検証という3つの仕組みで検証します。
- ▸毎週月曜の朝に、SEO監査・Core Web Vitals・導線分析・独自性監査などが自動実行されるよう設定し、結果がDiscordに通知されます。
- ▸ポジショニング・公開判断・実績の一次裏取り・倫理の線引きは、人間が握り続けます。
— 01
なぜ「運用OS」が必要だったのか
Netsujoは2023年6月に設立した、京都拠点の少人数スタートアップです。Web3・AIといった先端領域で、コンサルティングだけでなく実装まで踏み込む「実装型BizDev」を掲げています。少人数で複数の事業とサイト運用を抱えると、確認すべきことは指数的に増えていきます。
人の注意力だけでこれを支えようとすると、必ずどこかで漏れます。実際に私たちも、役職の誤表記や日付の取り違えといった誤りを経験しました。そこで方針を変え、「人ががんばって気をつける」のではなく、「誤りが起きない・起きても止まる仕組み」を運用そのものに組み込むことにしました。
その仕組みの集合体を、私たちは社内で「運用OS」と呼んでいます。AIエージェントに実装と検証を任せ、品質は自動化されたゲートで担保し、判断と責任は人間が握る。本記事は、その運用OSの中身を公開するものです。
運用を支える主な道具
従来の運用と、運用OSの違い
| 観点 | 従来の運用 | 運用OS |
|---|---|---|
| 品質の担保 | 担当者が「気をつける」 | CI・検証スクリプト・第三者AIで仕組み化 |
| 事実誤りの検知 | レビューで人が気づくまで残る | 禁止パターンに一致するとCIが失敗 |
| SEO/サイトの監視 | 問題が起きてから対処 | 毎週月曜に自動監査→Discord通知 |
| 作業の記録 | 個人の頭の中・チャットに散在 | マークダウン/台帳に残し後から検証可能 |
| 実装スピード | 人手の作業量に比例 | 反復・定型作業をAIと自動化に委譲 |
— 02
運用の3原則
運用OSは、3つのシンプルな原則の上に成り立っています。
判断は人、実装はAI
ポジショニング・公開可否・倫理の判断は人間が握り、調査・コード修正・分析・定型作業はAIエージェントに任せます。役割を明確に分けることで、スピードと責任の所在を両立します。
事実は「気をつける」ではなく仕組みで担保する
人の注意力に頼ると誤りは必ず漏れます。出典の必須化、禁止表現の自動検査、第三者AIによるファクトチェックといった仕組みに落とし込み、誤りを機械的に止めます。
全部、記録に残す
決定事項・作業結果・監査結果はマークダウンやDiscordに残し、後から検証できる状態にします。属人化を避け、次の判断の土台にします。
— 03
品質を担保する3層ゲート
AIが書いたものをそのまま世に出すことはありません。成果物は、性質の異なる3つの仕組みで検証します。1つは本番前に自動で強制されるCI、ほかは運用ルールと検証スクリプトです。強制力の異なる層を重ねることで、誤りを見つけやすくしています。
codexによる第三者ファクトチェック
成果物(記事・コード・調査結果)は、完了報告の前にOpenAIのcodex CLI(GPT)へ一度かける運用ルールにしています。リポジトリの実装と突き合わせて、誤り・誇張・検証できない断定を洗い出し、指摘を取り込んでから完了とします。書いた当人とは別のAIに検証させることで、思い込みによる誤りを減らします。
事実誤りを機械的に弾くCI
役職の誤表記・虚偽の経歴・改名前のサービス名・誤った日付など、過去に実際に起きた誤りを禁止パターンとしてCIに登録しています。該当する記述がコードに混じると、本番へ進む前にCIのチェックが自動で失敗します。3つの中で唯一、機械的に強制される層です。
出典を必須にしたProof検証
登壇・受賞・メディア掲載などの実績は、検証可能な出典URLと裏取り日をセットで登録する決まりにし、どちらかが欠けていれば検証スクリプトがエラーで止まります。出典の中身そのものは人間が一次裏取りし、スクリプトは「出典と裏取り日が必ず添えられているか」を担保します。
具体例:誤りが本番前に止まる
たとえば、ある人物の肩書きを実際と違う役職で書いてしまったとします。従来ならレビューで誰かが気づくまで残りますが、その間違いは「事実誤りを弾くCI」の禁止パターンに一致し、本番反映の前にCIのチェックが失敗します。過去に一度起きた誤りを禁止パターンとして登録しておくことで、同じ誤りは本番前に自動で検知できます。失敗を仕組みに変える——これが、私たちが誠実さを保つやり方です。
なぜ「別のAI」に検証させるのか
書いた本人(人でもAIでも)は、自分の思い込みに気づきにくいものです。だからこそ、書いた当人とは別のAIに、リポジトリの実装と突き合わせて検証させます。AIの嘘や誇張をゼロにはできませんが、独立した視点を一段挟むことで、明らかな誤りや検証できない断定を大きく減らせます。
— 04
毎週自動で回る監査
品質は一度きりの確認では保てません。Netsujoでは、毎週月曜の朝に複数の監査が自動実行されるようGitHub Actionsに設定しており、結果がDiscordに通知されます。「問題があるか聞かれてから見る」のではなく、定期的に回り続ける仕組みです。
GSC週次フル監査
Search ConsoleとGA4を統合し、サイトマップ・インデックス状況・CTR低迷・canonical不一致を網羅チェック
Core Web Vitals監査
PageSpeed Insightsでモバイル/デスクトップの表示速度を計測
効果測定(導線分析)
自治体導線・関西Web3まわりの流入と成果をGA4とGSCで分析
IndexNow Ping
主要URLをBing IndexNowへ自動通知し、クロールを促進
llms.txt整合性チェック
AI検索向けに提供しているllms.txtのURL整合性を検査
独自性監査
記事コンテンツの独自性を採点し、薄いコンテンツを検出
これらに加えて、コードを本番へ反映する前には「事実誤りを弾くCI」と「コンフリクトの取り残し検査」が自動で走ります。検出された重大な問題はその場で修正し、軽微なものは記録して次のサイクルで対応します。検知から修正までの流れも、できるだけ仕組みに乗せています。
— 05
人間が握り続けること
AIに任せるほど、人間が握るべきことが明確になります。次の判断は、仕組みに渡さず人間が責任を持ちます。
ポジショニング・メッセージの決定
公開してよいかの最終判断
事実かどうかの一次裏取り(固有名詞・実績)
倫理・誠実さの線引き
次に何を作るか・何をやめるかの意思決定
この運用OSが目指すのは「人間を減らすこと」ではありません。人間が、判断という最も価値の高い仕事に集中できる状態をつくることです。実装と検証の負荷をAIと仕組みに預けるほど、私たちは「何を作り、誰に届け、どう誠実であるか」に時間を使えます。
— 06
AIに任せて分かったこと(手応えと限界)
AI活用を美化するつもりはありません。実際に運用してみて分かった手応えと、超えられない限界の両方を、正直に書きます。
手応え
- ▸反復作業(一括修正・監査・申請)はAIと自動化で大きく短縮できる
- ▸仕組みに落とした品質チェックは、人の体調や繁忙に左右されない
- ▸記録が残るため、過去の判断を後から検証・再利用できる
限界・注意
- ▸AIも誇張や思い込みで誤る。第三者チェックと出典の裏取りは外せない
- ▸「何を作るか」「公開してよいか」は仕組みに渡せず、人間の判断が要る
- ▸仕組みづくり自体に初期コストがかかる。小さく始めて育てるのが現実的
— 07
よくある質問(FAQ)
AIエージェントによる運用について、よく寄せられる質問をまとめました。
Q1AIエージェントで会社を回すとは、具体的にどういう状態ですか?
AIエージェントで会社を回すとは、具体的にどういう状態ですか?
判断を人間が握り、調査・コード修正・分析・定型作業・監査をAIエージェント(Claude Code)と自動化スクリプトに任せている状態です。少人数でも、確認や品質チェックを仕組み化することで、見落としを減らし安定した品質を保てます。
Q2AIが書いたものに誤りが混じらないのですか?
AIが書いたものに誤りが混じらないのですか?
AIも人も誤ります。だからこそNetsujoは、書いた当人とは別のAI(codex/GPT)による第三者ファクトチェック(運用ルール)、事実誤りを機械的に弾くCI、出典必須のProof検証という3つの仕組みで検証します。とくに事実誤りを弾くCIは、本番反映の前に自動で走り、該当する記述があればCIのチェックが失敗します。仕組みで誤りを止めることを前提にしています。
Q3codexによるファクトチェックとは何ですか?
codexによるファクトチェックとは何ですか?
OpenAIのcodex CLI(GPT)に、成果物とリポジトリの実装を突き合わせて検証させる工程です。定量的な主張がコードと一致するか、検証できないのに断定していないか、誇張がないかを点検し、指摘を取り込んでから完了とします。
Q4事実誤りを弾くCIとは、どんな仕組みですか?
事実誤りを弾くCIとは、どんな仕組みですか?
過去に実際に起きた誤り(役職の誤表記・虚偽の経歴・改名前のサービス名・誤った日付など)を禁止パターンとして登録した静的検査です。該当する記述がコードに含まれると、本番反映の前にCIのチェックが失敗し、誤りが世に出るのを防ぎます。
Q5毎週どんな自動監査が動いているのですか?
毎週どんな自動監査が動いているのですか?
毎週月曜の朝に、SEO/アクセスのフル監査、Core Web Vitals計測、導線の効果測定、IndexNow通知、llms.txt整合性チェック、コンテンツ独自性監査などが自動実行されるようGitHub Actionsに設定しており、結果がDiscordに通知されます。「聞かれてから確認する」のではなく、定期的に回り続けます。
Q6すべてAIに任せて、人間は何をしているのですか?
すべてAIに任せて、人間は何をしているのですか?
ポジショニングの決定、公開可否の最終判断、固有名詞や実績の一次裏取り、倫理の線引き、次に何を作るかの意思決定は人間の仕事です。AIは実装と検証を担い、人間は方向と責任を担う、という役割分担です。
Q7AIに任せられない領域はどこですか?
AIに任せられない領域はどこですか?
価値観や責任が問われる判断はAIに任せません。具体的には、ブランドのポジショニング、誇張と事実の線引き、外部に公開してよいかの最終判断、そして「何を作り、何をやめるか」という事業の意思決定です。AIは選択肢の整理や実装を高速化しますが、最終的に責任を負うのは人間です。
Q8導入にコストや専門知識は必要ですか?
導入にコストや専門知識は必要ですか?
仕組みづくりには相応の初期コストがかかります。ただし一度に全部を作る必要はありません。たとえば「事実誤りを弾くCI」のように、過去に起きた失敗を1つずつ禁止パターンとして足していけば、運用しながら少しずつ堅牢にできます。小さく始めて育てるのが現実的です。
Q9同じ仕組みは他社でも再現できますか?
同じ仕組みは他社でも再現できますか?
同種の仕組みは再現できます。本記事で挙げた要素(第三者AIによるチェック、禁止パターンのCI、出典必須のデータ構造、定期監査の自動実行)は、いずれも一般的なツール(Claude Code・GitHub Actionsなど)の組み合わせで構成しています。重要なのはツールそのものより、「品質を人の注意力ではなく仕組みに落とす」という方針です。
まとめ
AIエージェントで会社を回すというのは、人間を仕組みに置き換えることではありません。判断を人間が握り、実装と検証をAIに任せ、誤りは仕組みで止める——この役割分担を徹底することです。
少人数のスタートアップでも、品質を仕組みに落とし込めば、確認漏れの少ない安定した運用は実現できます。Netsujoはその運用OSを、自社サイトという実物で日々検証しています。自分たちで使う道具を自分たちで作り、誠実さを仕組みで担保する。その積み重ねが、私たちが提供する開発・分析の品質に直結すると考えています。
この記事の著者
この記事が向いている方
少人数チームでAIを業務に組み込みたい経営者・担当者
AIの出力品質をどう担保するか悩んでいる方
Claude Codeの実務運用に関心のあるエンジニア
