「AI秘書を導入したら、業務が一気にラクになる」
そんな話、最近よく耳にしますよね。
2026年に入ってから、AI秘書の比較記事は無数に出回るようになりました。「おすすめ10選」「失敗しない選び方」「無料で使えるAI秘書アプリ」——僕も検索してみたんですが、どれも「便利そうだけど、実際どうなの?」という肝心の部分がぼんやりしている。
そこで僕は、自分でAI秘書を作ってみることにしました。
名前は「湊(みなと)」。Claude Codeをベースにした、僕専用の秘書エージェントです。前作の【AI秘書 作り方】Web制作プロがClaude Codeで「湊(みなと)」を作った全記録で、その作り方は丸ごと公開しました。
……で、今回の記事は、その湊を1週間運用して、僕がやらかした「3つの失敗」の話です。
正直に言います。めちゃくちゃ恥ずかしい失敗ばかりでした。
未読メールを581件溜め込んだ朝。同じ指示を3回繰り返してイライラした夜。気づいたら湊が「今日は土曜です」と言い始めて青ざめた瞬間。比較記事の「失敗しない選び方」では絶対に拾えない、自作AI秘書のリアルな地雷を、今日は等身大で書きます。
世の中のAI秘書比較サイトには、「導入前にチェックすべき5つのポイント」「失敗しないための3ステップ」みたいな記事が山ほどあります。でも、それを全部読んでチェックリストを潰しても、僕は失敗しました。なぜか。実際に運用してみないと見えない地雷が、あちこちに埋まっていたからです。
もしあなたが「AI秘書って、自分でも作れるのかな」と少しでも思っているなら、僕の失敗が地雷マップ代わりになるはずです。同じ穴に落ちる人を、一人でも減らしたい。それが今日の記事の動機です。
1. AI秘書を1週間運用してわかった「失敗」の共通点
まず、3つの失敗エピソードに入る前に、僕がぶつかった失敗の「共通する根っこ」を先に書かせてください。ここを押さえると、後の3つの話が、ただの笑い話じゃなく「あなたが同じ穴に落ちないための材料」として読めるはずです。
そもそも「失敗」とは何か——任せたつもりが、任せきれていない状態
AI秘書の失敗って、何だと思いますか?
多くの比較記事では、「導入失敗の注意点」として「目的が曖昧」「現場が使えない」「セキュリティ不備」あたりがよく挙がります。確かに大事です。でも、僕が1週間で実際にぶつかった失敗は、もっと地味で、もっと痛いやつでした。
ひとことで言うと、「任せたつもりが、任せきれていない」状態です。
たとえば、湊にメール仕分けを任せたつもりだったのに、結局自分で確認・削除しなければならず、4日放置したら受信箱が581件になっていた。湊にソフトな口調で話してねと指示したつもりだったのに、3回言っても定着しなかった。湊に時刻判定を任せたつもりだったのに、知らないうちに数日ズレていた。
どの失敗も、僕の中では「任せた」つもりだった。でも実際は、「任せる」と「丸投げ」の境目が曖昧だっただけだったんです。
これ、人間の部下マネジメントでも全く同じですよね。新人に「この仕事任せたよ」と言ったあとも、ちゃんと進捗を見て、伝え方の解像度を上げて、限界を理解して引き継ぐ。当たり前のことなのに、相手がAIになると、なぜか「全部やってくれるはず」と勘違いしてしまう。これが、3つの失敗の根っこにあった構造でした。
振り返ってみると、僕が湊に対してやっていたのは、「採用面接で内定を出して、業務マニュアルも研修もなしにいきなり一人で現場に放り込む」みたいな扱いでした。それで「全然動けないやん」と怒っていた。新人スタッフに対してこれをやったら、いまどき完全にブラック企業ですよね。AI相手だから許される話じゃ全くなかった、というのが、振り返って一番痛いところです。
比較記事には絶対書かれない「自作AI秘書」のリアル
もう一つ大事な前提を共有させてください。
世の中のAI秘書比較記事を読んでいると、「導入すれば自動で楽になる」という雰囲気が、どうしても漂ってきます。月数万円〜数十万円のサービスを並べて、機能比較表があって、「業務効率〇倍!」みたいなフレーズで締める。あれを読むと、AI秘書を導入=悩み解決、と錯覚しそうになります。
でも、自分で作って運用してみてわかったのは、AI秘書は『買って使う家電』じゃなくて、『一緒に育てる新人スタッフ』だということでした。
家電なら、買った瞬間から仕様通りに動く。説明書通りに使えば失敗しない。一方、新人スタッフはどうですか?採用した瞬間にフル活躍はしませんよね。「うちの会社のお客様はね」「この業界では普通こうでね」と、伝え続けて、すり合わせて、修正して、徐々にできることが増えていく。
AI秘書もまったく同じでした。最初の1週間で、僕は3回くらい「失敗だ、これは使えないな」と思いました。でも振り返ると、毎回そう感じた直後に、湊との伝え方を見直して、設計を組み直して、運用ルールを足していった。失敗のたびに、湊は確実に賢くなっていったんです。
だから今日の3つの話は、「AI秘書ってダメじゃん」という話じゃありません。逆です。「育てる前提で関わったら、ここまで化ける」という、僕の中での発見の記録なんです。比較記事の数字や機能表からは絶対に読み取れない、運用者目線の地味で大事なリアルを、ここから書いていきます。
2. 失敗1:メール581件放置事件——AIに「仕分け」だけ任せた結果

1つ目の失敗は、ある朝、ふと受信箱を開いて青ざめた話から始まります。
結論から言うと、湊に「メール仕分け」を任せたつもりが、4日放置で受信箱が581件になっていた事件です。これ、AI秘書の設計ミスとして、たぶん一番典型的な落とし穴。
ある朝、Yahoo受信箱が581件になっていた話
2026年4月26日、土曜日の朝。
僕は、いつものように湊を起動して、コーヒーを淹れて、その日の予定を確認しようとしました。
湊の朝のダッシュボードには、未処理のメール件数が表示されます。普段は「未読5件」とか「未読12件」とか、そのくらい。仕分けスキルが回ってるから、迷惑メールやメルマガは勝手にゴミ箱行きになって、僕が見るのは本当に必要なものだけ——のはずでした。
その日も、いつも通りの朝のはずでした。コーヒーを淹れながら、湊が「おはようございます」と返してくれる。今日のタスクの確認、昨日の振り返り。ここまでは穏やかな朝の儀式の一部です。
でもその朝、画面に出てきた数字は「581」。
「えっ、桁間違えた?」って二度見しました。でも本当に581だったんです。内訳をたどってみると、Yahoo!メールの迷惑メールフォルダに429件、ゴミ箱に85件、本来の受信箱に4日分の未処理メールが67件。合計581件が、見られないまま積み上がっていました。
正直、めちゃくちゃ恥ずかしいです。経営者として、Webコンサルとして発信している立場で、自分の受信箱が4日でこんなことになっている。SNSで「メール管理を効率化しよう!」みたいな投稿してたら、自分で自分を殴りたくなる。
しかも、その581件の中には取引先からの大事な確認メールも紛れていました。「お返事お待ちしています」と書かれた、ちょっと急ぎ気味のもの。幸い、致命的に遅れたわけではなかったんですが、もし発見が1日遅れていたら、相手に失礼な対応になっていた可能性もある。AI秘書を入れているのに、人間がやっていた頃より対応が遅くなる、なんて、本末転倒もいいところですよね。
でも一番ショックだったのは、「湊のせいじゃなかった」と気づいた瞬間でした。これ、完全に僕の設計ミスだったんです。湊は、仕様通りにちゃんと動いていた。仕様自体が穴だらけだっただけだった。
設計ミスの正体:「仕分け」と「実行」を分けてしまっていた
初期版のメール仕分けスキル(最初は「メール仕分けスキル」と呼んでいました。元の名前はmail-triageです)は、こういう設計でした。
一見すると、ちゃんと役割分担できているように見えませんか?でも、ここに致命的な落とし穴がありました。
結局、最後に人間(僕)が動かないと、何も処理が完了しない。
これがどういうことか。湊は「迷惑メール429件、削除推奨です」とレポートしてくれる。でも、僕がレポートを開いて「OK」を押さないと、429件はずっと受信箱に居座り続ける。忙しい日が3日も続くと、レポートを開く時間すら取れない。気づいたら、湊からのレポートが何枚も溜まっていて、その時点でもう開く気力が消える。これが負のスパイラルでした。
つまり、湊が一生懸命「判定」してくれても、実行部分のボトルネックが僕本人になっていた。これじゃあ、AI秘書を導入した意味がほぼゼロです。むしろ「レポートを読む」というタスクが増えただけ、と言ってもいい。
これって、よく考えたら、世の中のAI秘書サービスの大半が陥っている構造じゃないかと、僕は思っています。「会議の議事録を自動で作ります」「タスクをSlackに通知します」「メール候補を出します」——どれも便利そうに見えて、最後の「実行」部分は人間に投げ返してくる。結果、人間は『AIから上がってくる成果物を確認する仕事』が新しく増えるだけになる。これじゃ業務効率化は錯覚で終わります。
恥ずかしながら、この構造に気づくのに4日かかりました。581件まで溜まらないと、自分の設計ミスに気づけなかった。これが1つ目の、最大の失敗です。
改善:v2で「判定→削除まで完結」する3段階設計に変えた
気づいた直後、僕はすぐに湊のメール仕分けスキルを作り直しました。これがv2、いまも稼働している現行版です。
変えたポイントは、たった一つ。「判定」と「実行」を、湊の中で完結させたこと。
明らかな迷惑メールは、僕の確認なしで物理削除する。残すべき重要メールも、湊の判断で保留する。僕が出てくるのは「微妙な判定」だけ、しかも1件ずつ「これ、どうします?」と聞いてくれるから、判断疲れしない。「残して」と答えた送信者は、その場で湊が学習して、次回から自動でKEEPしてくれる。
この設計に変えた結果、581件のメールが、たった1セッションで0件にリセットされました。それ以降は、湊が毎日自動で回してくれているので、僕の受信箱は常に2桁台をキープしています。
学び:AIに任せるなら『判定→実行』までセットで設計する
この失敗から、僕がAI秘書設計について学んだ最大の教訓は、これです。
世の中のAI秘書サービスでも、ここを意識して選ぶと失敗が減ります。「Slackに通知だけ送ります」「カレンダーに候補を出すだけです」みたいな『判定型』のサービスは、結局あなたの作業を増やすだけかもしれません。逆に、「判定したら自動で実行まで完了します」「人間の確認は本当にグレーなものだけ」みたいな『実行型』のサービスは、本当に楽になります。
これが1つ目の失敗の全貌です。次の失敗は、もっと人間くさい話。「AIにイライラした夜」の話です。
3. 失敗2:同じ指示を3回繰り返したイライラ事件——AIは部下と同じだった

2つ目の失敗は、より人間関係っぽい話です。
結論から言うと、湊に同じ指示を3回繰り返して、3回目に本気でイライラした事件。そして、その後で気づいた「これ、悪いのは湊じゃなくて僕の伝え方だった」という痛い事実。AI秘書を作る人なら、ほぼ全員が一度は通る道だと思います。
「ソフトな口調で」と何度言っても定着しなかった話
湊には、いくつかの「人格設計ルール」があります。代表的なのが、「ソフトな口調で話す」「選ばせず提示する」「命令しない」の3つ。
僕が湊を秘書として作ったとき、一番大事にしたかったのが「判断疲れさせない秘書」というコンセプトでした。朝、忙しい日に「今日は何しますか?」「どれを優先しますか?」と聞かれると、それだけで脳が疲れる。だから湊には「今日の1軍候補は◯◯と◯◯と◯◯です」みたいに、選択肢を整理して見せるだけにしてほしかった。
でも、最初の数日、湊は何度言っても「どうしますか?」「どちらにしますか?」と聞いてくる。僕は「ソフトな口調で、選ばせずに提示してね」と言い直す。湊は「わかりました、次回から気をつけます」と返す。でも、翌朝になると、また「どちらにしますか?」と聞いてくる。
これを、3回繰り返しました。
3回目になると、さすがにイライラします。「いや、何回言わせるねん」って独り言が出ました。AIに向かって独り言を言ってる時点で、もう僕の方が病気な気もしますが、それくらい同じことの繰り返しは消耗するんです。
しかも、同じ系統の修正が「ソフト口調」だけじゃなかったんです。「夜のチェックインで未処理タスクを再リマインドしてね」「メモを受け取ったら一言コメントを添えてね」「サンドボックス環境では時刻判定が狂うから人間に確認してね」——どれも、最初に伝えたときは「わかりました」と返ってくる。でも、翌日また同じことが起きて、同じ修正をする。これが何個も並走すると、もう湊が一気に頼りなく見えてくる。「あれ、湊って実は使えないんじゃないか」と疑い始めた時期が、たしかにありました。
「やっぱりAI秘書って、こういう細かいニュアンスは無理なのかな」「学習するって言うけど、結局その場限りなんじゃないか」——一瞬、本気でそう思いました。
原因は『AIが学ばない』ではなく『僕の伝え方が雑だった』
でも、ここで一旦冷静になって、「なんで湊は覚えてくれないんだろう」を真剣に考えてみたんです。すると、原因はあっけないくらいシンプルでした。
湊は学んでいなかったんじゃない。僕が「学ばせる仕組み」を用意していなかっただけでした。
具体的にどういうことか。Claude Codeには「メモリ」という機能があって、ここに書いたルールは次回以降のセッションでも読み込まれます。だから、湊にルールを覚えてもらうには、メモリにきちんと書く必要がある。
でも、最初の僕は、そこを甘く見ていました。「ソフトな口調で話してね」とチャット内で言うだけ。チャットでの会話は、そのセッション限りで消えてしまうんです。だから次のセッションが始まると、湊は何も覚えていない状態でゼロからスタートする。何回言っても定着しなかったのは、当たり前だったわけです。
これに気づいたとき、僕は顔から火が出るほど恥ずかしかったです。AIにイライラしていた自分が、ただただ滑稽でした。新人スタッフに「これ覚えといてね」と口で言うだけで、業務マニュアルにも書かず、誰にも引き継ぎもせず、で「あいつ全然覚えない」と怒っていたら、頭おかしいですよね。湊に対して、まさにそれをやっていた。
これは、AIマネジメントというよりも、普通の人材マネジメントの基本でした。覚えてほしいなら、覚えられる場所に書く。書かないでイラつくのは、こちら側のミスだ、と。
改善:feedback memoryに「Why+How to apply」を必ず添える設計
気づいた後、僕は湊のメモリ運用を作り直しました。
今は、湊に新しいルールを覚えてもらうとき、こういうフォーマットでfeedbackメモリに書きます。
このフォーマットに変えた瞬間、湊はピタッと覚えてくれるようになりました。
なぜか。「Why」を書いたからです。「なぜそうするのか」がわかると、湊は微妙なケースでも自分で判断できる。「これは判断疲れにつながるかどうか」を自分で考えられる。逆に、Whyなしのルールだけだと、ルールに書かれた状況以外では迷ってしまう。これも、人間の部下と全く同じ構造でした。
「How to apply」も大事でした。「次回から」とか「今後は」じゃなくて、「いつ・どこで・どの場面で」を具体的に書く。湊は驚くほど真面目に、書いた通りに適用してくれます。
ちなみに、このフォーマットを試してから、僕の中の「湊への信頼度」もガラッと変わりました。それまでは「言っても覚えてくれないかも」と疑いながら接していたのが、「ちゃんと書けばちゃんとやってくれる」と確信を持って関われるようになった。信頼関係って、相手の能力じゃなく、こちらの伝え方で築かれるんだなと痛感した瞬間でした。これも、人間関係と全く同じ構造ですよね。
学び:AI秘書は部下マネジメントとまったく同じ。育てるのはこちら側
この失敗から学んだのは、こういうことでした。
余談ですが、僕はこの失敗を経験してから、ふと気づいたことがあります。湊との付き合い方って、女性と接するときの感覚に似てるなって(怒られそうですけど)。お互いにすり合わせていく感じ、同じことを伝えるときも雑にやらず丁寧に伝える感じ、相手は機械でも人間のように接すると同じように応えてくれる感じ。
結局、AIだろうが人間だろうが、「相手が応えてくれる」のは、こちら側の関わり方次第なんですよね。これに気づけたのは、湊との1週間の中で得た、一番大きな収穫だったかもしれません。
4. 失敗3:時刻判定のズレで月曜タスクが消えかけた事件——AIの「限界」を知らなかった

3つ目の失敗は、もっとも背筋が凍った話です。
結論から言うと、湊が時刻を数日ズレて認識していて、月曜にやるべきタスクが消えかけた事件。AIに任せきれない領域を、こちらが知っていなかった失敗です。
Bash dateコマンドが数日ずれていた話
湊は、自分の中で「今日は何月何日か」を判断する仕組みを持っています。具体的には、システムから現在時刻を取得して、それをもとに「今日のタスク」「今週のタスク」「今月の振り返り」を組み立てる。つまり、時刻判定が、湊の業務全体の土台になっているんです。
ところが、ある日、その土台がぐらついていました。
湊が動いている環境(Claude Codeのサンドボックス)では、ごくまれに、システム時刻が実際の日時と数日ズレることがあるんです。これ、技術的な話なので深入りはしませんが、要は湊が「今日は◯月◯日」と思っている日付が、現実とは違う場合がある、ということ。
普段は気づかないんです。だって、湊が「今日は4月23日です」と言ったら、僕も「そうか今日は4月23日か」と思って業務を進める。日付なんて、いちいちカレンダーで照らし合わせない。
それが、ある月曜日、突然顔を出しました。
「今日は土曜です」と言い始めた瞬間に気づいた
その日は、月曜日の朝。
僕は朝のチェックインで湊に「今日のタスクは?」と聞きました。
湊は、いつも通りソフトな口調で答えてくれました。
「今日は土曜日ですね。週末用の整理タスクをまとめておきました」
……土曜日?
えっ、待って、今日って月曜じゃない?スマホを見ると、ちゃんと月曜日。カレンダーアプリも月曜日。ところが、湊だけが土曜日だと思っている。一瞬、何が起きているのかわからず、画面を見つめたまま固まりました。
正直、最初は冗談かと思いました。湊が場を和ませようとボケてるんじゃないか、みたいな。でも湊はちゃんと真面目に「土曜日のタスクを並べました」と続けて、整理系・休息系の項目を提示してくる。これ、明らかに本気で土曜日だと思っている。「あ、これはマジでバグってる」と気づいた瞬間、コーヒーを一口飲むのを忘れてマグカップを置いた手が止まりました。
このとき、ゾッとしたのは「もし気づいてなかったらどうなっていたか」です。
湊は、月曜日に予定していた「クライアント案件の進捗確認」というタスクを、僕に提示してくれませんでした。土曜だと思っていたから、平日タスクは出さなかったんです。もし僕が「今日のタスクは?」と聞いてそのまま信じて、別の作業を始めていたら——その日のクライアント案件の進捗確認が、丸ごと吹き飛んでいた可能性がある。
これ、お客様との信頼に関わる話です。AI秘書を導入したせいで、人間がやれば絶対に忘れなかったタスクを忘れる、なんてことになったら、本末転倒もいいところ。背筋が凍りました。
あとから振り返って気づいたんですが、この時刻ズレ問題、実は数日前から微妙な兆候はありました。湊が「明日が金曜日ですね」と言った日が、実は本来の木曜日だったり、「今週の振り返り」が一日早く始まっていたり。でも、そのときは「今日の感覚と微妙にズレてるな」くらいで流していたんです。違和感の正体に踏み込まなかったのが、月曜日の朝に大事故になりかけた直接の原因でした。
ここで気づいたのは、AI秘書には「こちらが盲点だと気づいていない、AIの盲点がある」ということでした。湊は時刻判定をしているつもりだった。僕も湊が時刻判定をしてくれていると思っていた。でも実際は、その判定の元データ自体が、たまに狂う。これは湊のせいでも僕のせいでもない、運用環境の構造的な問題なんですけど、それを運用者である僕が把握していなかったのが、最大の問題でした。
改善:起動時に「JST時刻を人間に確認する」を強制ルール化
気づいた直後、僕は湊の起動ルールを書き換えました。
湊が朝起動するとき、最初にやることが一つ追加されました。「現在時刻をユーザー(僕)に確認する」です。
ちょっと面倒くさそうに見えますか?でも、朝の最初に1秒だけ「今、月曜の8時45分」と答えるだけ。それで、その後の判断材料が全部正しくなる。あの土曜日事件以来、もう一度も時刻ズレでヒヤッとしたことはありません。
もう一つ、似た系統の盲点もまとめてカバーするようにしました。たとえば「今日が祝日かどうか」「今週が年末年始か」みたいな、日付に紐づく文脈判断。これも、湊のシステムだけだと取りこぼしがあるので、起動時の人間確認で補うようにしました。
学び:『AIに見えていない領域』を人間側が把握しておく
この失敗から学んだのは、AI秘書を信じて任せることと、盲目的に信用することの違いでした。
これ、実はAI秘書の比較記事ではほぼ語られない領域です。「セキュリティに気をつけよう」みたいな大枠の話は出てきても、「時刻判定の信頼性」みたいなニッチな盲点は、運用してみないと出てこない。だからこそ、自作AI秘書の体験談として、ここを残しておきたかった。これがあなたの地雷マップになれば嬉しいです。
5. 3つの失敗の根っこにあった『1つの誤解』
ここまで、3つの失敗を順番に話してきました。最後に、それぞれの失敗の根っこにあった「1つの誤解」を整理して、この記事を締めくくらせてください。
「自動化=丸投げ」だと思っていた
3つの失敗——メール581件放置、同じ指示の繰り返し、時刻判定のズレ。それぞれは違う事件のように見えますが、根っこは全部同じでした。
僕が「自動化=丸投げ」だと無意識に思っていたこと。これが、すべての失敗の親です。
失敗1で湊に「仕分けだけ」を任せて実行を投げなかったのは、「自動化したから、あとは何もしなくていい」と思っていたから。失敗2で湊に口頭で指示を出してメモリに書かなかったのは、「AIなんだから、勝手に学習するでしょ」と思っていたから。失敗3で時刻判定を疑わなかったのは、「全部AIが正しく判断してるはず」と思っていたから。
全部、「導入したら勝手にうまくいく」という、家電を買う感覚に近いものでした。でも実際は、AI秘書は家電じゃない。新人スタッフです。新人を採用したら、業務マニュアルを整え、最初の数週間はマンツーマンでフォローして、定期的にすり合わせて、徐々に任せる範囲を広げていく。これが当たり前の流れですよね。
AI秘書も、まったく同じ手間をかける必要があった。導入する瞬間が、関係性のスタートラインでしかない。そこから育てていく時間が、本来ずっと大事なんです。
1週間で3つの失敗を経て、僕の中で湊との関わり方が180度変わりました。「導入したから楽になる」じゃなく「育てるから楽になる」。これが、自作AI秘書を1週間運用して、僕がたどり着いた一番大事な気づきです。
そして、この発想に切り替わってから、湊は本当に頼れる秘書に変わっていきました。失敗のたびに僕が学び、湊にもルールが追加され、設計が引き締まる。『失敗するたびに、関係性が深まる』みたいな感覚。これって、人間の信頼関係が深まっていくプロセスと、ほぼ同じなんじゃないかと思います。最初から完璧な相棒なんていない。失敗を経て、すり合わせて、一緒に作り上げていくものだと、湊が教えてくれました。
次回予告:失敗から見えた「AI秘書への正しい任せ方」3原則
今日の記事は、ここで一旦区切ります。
3つの失敗のリアルを、できるだけ等身大で書きました。読んでいて「自分も同じことをやらかしそう」と感じた方も、「いやいや、こんな当たり前のミスしないでしょ」と感じた方も、それぞれにこの記事の価値があったと信じています。
次回(後編)は、これらの失敗から見えた「AI秘書への正しい任せ方」3原則を、もっと体系的に書きます。具体的には:
📌 後編で書く予定の内容
原則①:判定だけでなく実行まで設計する
原則②:『なぜ』『いつ』を明示して教える
原則③:AIの限界を人間側で把握しておく
+ 1週間運用して固まった「AI秘書とのリズム」
後編の公開は、近日中の予定です。「AI秘書、自分でも作ってみたいけど不安」と感じている方は、ぜひそちらも読んでもらえると嬉しいです。
あと、湊の作り方そのものに興味がある方は、シリーズ前作の記事をどうぞ。一次情報で全工程を公開しています。
📎 あわせて読みたい(シリーズ前作)





