IT 家計改善

家計簿をAIに見せたら、危険な落とし穴に気づいた話

この記事は、こんな方におすすめです👇

  • 「家計簿をAIに見せたら、何かわかるんじゃないか」と思っている方
  • ChatGPTやClaudeに自分のデータを渡すとき、何に気をつければいいか知りたい方
  • 「集計はPython、解釈はAI」という役割分担をイメージしてみたい方

こんにちは、あひるです🐤

「家計簿、AIに見せたら何かわかるのかな」——そう思ったことはありませんか?私もデータサイエンティストという仕事柄、よく聞かれます。せっかくなので、自分の家計簿(直近1年分・12か月)を使って、実際にAIに分析させてみました。

結論を先に言うと、「AIに丸投げ」はうまくいきません。でも「集計はPython、解釈はAI」という役割分担にすると、驚くほどよく効きます。そして検証の過程で、ひとつ大事な落とし穴も見つかりました。今回はその一連の流れを、実際の検証結果とあわせて紹介します。Let's go 🚀


最初に踏んだ地雷——生CSVをそのままAIに渡してはいけない

家計簿アプリからダウンロードできるCSVファイルには、想像以上に細かい情報が入っています。試しに、私の家計簿CSVの1行をそのままの形式でお見せします(氏名・口座番号はすべてダミーに差し替えています)。

日付内容金額
2026/01/15振込*ヤマダ タロウ ○○銀行△△支店 普通1234567(依頼人:ヤマダ タロウ)-50,000

この「内容」列には、送金者の氏名・利用銀行・支店名・口座番号の一部までそのまま記録されています。これをCSVのままChatGPTやClaudeにアップロードすると、AIはこの行を当然そのまま読み込みます。つまり、生データをそのままAIに渡す行為そのものが、個人情報を外部サービスに渡すリスクになるわけです。

ここがポイント

だからこそ、AIに渡す前に「集計して、匿名化する」というワンクッションが必須になります。具体的には、個別の取引明細は捨てて、「月ごとの貯蓄率」「カテゴリ別の支出構成比」といった集計済みの数字だけを渡す。この一手間で、AIの便利さは活かしつつ、個人情報のリスクは切り離せます。


まずPythonで集計する——1年分の実データから

そこで、Python(pandas)を使って、2025年6月〜2026年5月の12か月分(直近1年)の家計簿を集計しました。やり方はこちらの記事で紹介した仕組みと同じです👇

結果を見る前に、ひとつお断りを。この記事で載せる数字は、すべて「貯蓄率」「構成比」といった割合か、後述する代表値(イメージ)に置き換えています。世帯の収入・支出の実額は載せません。さきほどの「生データをそのまま渡さない」という話を、この記事自身でも実践している、というわけです。

まず月ごとの貯蓄率(収入に対して何%残ったか)を見ると、12か月の平均は約+2%。ボーナスの入る月は大きくプラスになる一方、生活費が収入を上回る赤字の月も複数あり、月ごとの振れがかなり大きいという形が見えてきました。

続いて、支出全体に対する大項目別の構成比です(以下は代表値のイメージ)。

大項目構成比(月平均・イメージ)
その他変動費(交際費ほか)約28%
住宅約26%
食費約22%
日用品約19%
教養・教育約4%
趣味・娯楽約0.4%
未分類約0.3%

固定費(住宅のみ)と変動費の比率は、おおよそ固定費26% / 変動費74%。次に、Pythonに「いつもの月より、ぐっと多く使った月」を自動で拾わせてみました。すると7件が引っかかりました。各カテゴリが「いつもの月の何倍使ったか」をグラフにすると、こうなります。

使いすぎた月7件を『いつもの月の何倍か』で並べた横棒グラフ。趣味・娯楽12倍・未分類11倍が最も大きいが家計の0.4%以下、教養・教育4倍と交際費3.6倍が要注意
「いつもの月の何倍使ったか」で並べた7件(代表値のイメージ)

ここまでがPythonの仕事です。数えるだけなら数秒で終わります。ただし、Pythonが教えてくれるのは「いつもより多い月がある」という事実だけ。「なぜ増えたのか」「気にすべきか、放っておいていいか」までは教えてくれません。ここからがAIの出番です。


同じデータをAIに解釈させてみた

この「7件の倍率」と「各カテゴリが家計に占める割合」だけを渡して、AIに解釈してもらいました。実際に返ってきた答えの要旨はこんな内容です。

悩める人

「使いすぎた月」が7件もあるなんて、うちの家計やばいですか…?一番大きいのは12倍って出てますけど。

大丈夫です。一番大きい「12倍」は趣味・娯楽ですが、これは家計のわずか0.4%。もともと月数百円のところが数千円になっただけで、金額で見ればごく小さな話です。本当に気にすべきは、もともと金額の大きいカテゴリが増えた2件だけですよ。

AI

これが、今回の検証で一番おもしろかった点です。「いつもの何倍か」だけを見ると、判断を誤ります。「趣味・娯楽が12倍!」と聞くとドキッとしますが、もともと月数百円のカテゴリ。それが数千円になっただけで「12倍」に見えるんです。金額にすれば数千円の話で、月◯十万円の家計全体からすればごくわずか。AIは「家計に占める割合」と照らし合わせて、「倍率は派手でも、もともと少額なら気にしなくていい」と仕分けてくれました。

一方で、AIが「本当に注意すべき」と判断したのは、もともと金額の大きいカテゴリが増えた次の2件です。

  • 交際費ほか・いつもの約3.6倍:家計の約28%を占める大きなカテゴリでの急増。ボーナス時期に大きな出費(家具・家電のまとめ買いや慶事など)が重なりやすい時期と一致します。一度きりなら問題ありませんが、毎年同じ時期に増えるなら「あらかじめ見込んでおく出費」として予算に組み込む価値あり。
  • 教養・教育・いつもの約2.6倍(じわじわ増加中):これは一度きりの跳ね上がりではなく、数か月かけてだんだん増えているのが特徴。家計に占める割合はまだ約4%と小さいですが、教育費は子どもの成長とともに右肩上がりになりやすい費目。早めに「これからも増える前提」で家計に織り込んでおくのが得策です。

「使いすぎた月を見つける」のはPythonが一瞬でやってくれます。でも「7件のうち、本当に向き合うべきは2件」という優先順位づけは、AIに解釈させて初めて出てきた価値でした。


結局、Python集計とAI解釈どっちが必要なのか

今回の検証をまとめると、両者の役割は次のように分かれます。

観点Python集計(pandas)AI解釈(ChatGPT/Claude)
得意なこと月ごとの集計や「いつもの何倍か」を、正確に・何度でも同じ基準で計算できる「なぜ増えたか」を言葉にし、気にすべきかどうかを判断できる
苦手なこと「なぜ」には答えられない。「何倍で多いとみなすか」の線引き次第で、拾いすぎたり見逃したりする計算そのものは不得意。生データを直接渡すと個人情報がもれるリスクがある
今回の結果「使いすぎた月」を7件、自動で拾い出した7件のうち、本当に気にすべきは2件と判別。残りは影響が小さいと判断

ここがポイント

「AIに丸投げ」では、個人情報のリスクと集計精度の両方で分が悪い。逆に「AIだけで判断」もできません(生データを見せられないので)。「集計はPython、解釈はAI」という分業にしたとき、初めて両方の強みが活きる、というのが今回の結論です。


自分のデータでもやってみたい人へ

「集計はPython、解釈はAI」を自分の家計でも試すには、まずpandasで集計する側を自分の手で組めるようになる必要があります。AIに渡す前の「匿名化・集計」のステップこそが、今回の検証でいちばん重要だった部分です。

家計データの集計に役立った“手を動かす系”の学び方

動画で手を動かしながら学べるオンライン講座(Udemy)は、「pandasでの集計」「条件によるフィルタリング」をまとめて練習できるので、今回のような匿名化・集計のステップにはとても相性がよかったです。

▶ Udemyでpandas・データ分析の講座を探す

※本記事はアフィリエイト広告(PR)を含みます。学習教材は内容・レビューをご確認のうえ、ご自身の判断でお選びください。


まとめ:AIに丸投げせず、使いこなす側に回る

この記事のまとめ

  1. 生の家計簿CSVをそのままAIに渡すと、氏名・口座番号まで読み込まれるリスクがある。渡す前に集計・匿名化が必須。
  2. 1年分(12か月)の実データをPythonで集計し、「使いすぎた月」を7件自動で拾い出した。
  3. 同じデータをAIに解釈させると、7件中「本当に向き合うべき」は2件だけと分かった。残りは「いつもの何倍」が派手でも、もともと少額で家計への影響が小さい項目だった。
  4. 結論は「AIに丸投げ」ではなく「集計はPython、解釈はAI」という分業。そのためにはまず自分でpandasを使えるようになることが近道。

AIは便利な道具ですが、丸投げするとリスクも精度も中途半端になります。「自分で集計できる」という土台があるからこそ、AIの解釈力を安全に・正確に使いこなせる。家計簿AI分析、ぜひ自分のデータでも一度試してみてください。

それではまた、あひるでした🐤

-IT, 家計改善
-, , , , ,