これはTeamJ Advent Calendar 2025の20日目の記事です。
昨日は
id:kanata_02による2025年の初体験 - かなたのめもでした。飛行機の乗り継ぎはかなり難しそうなので体験していてすごい。自分にとっては、そもそも空港が難しすぎて国内線ですらいつまでも攻略できていないので尊敬している。空港の環境音を聴くのは好きなので、ときどきYouTubeを垂れ流しにしながら作業していたりはします。
今日は、2025年に触ったLLMを覚えている範囲で感想を添えてまとめてみます。今年はローカルモデルにも手を出せたのがよかった。時間が取れていなくてプロダクト化は進んでいないけれど、だいぶコツは掴めたと思います。
- GPT-4.1
- 4oの次のモデルとして試していた
- o4-mini
- Phonno: 画像の視覚的な説明生成機能でもo4-miniを採用 - #daiizメモ
- マルチモーダル性能が向上していい感じ
- GPT-5
- AI Agentを作っている
- エージェントに渡すツールの設計が楽しい
- Claude Sonnet 4.5 🏆️
- いまのところ自分と相性がいいモデル
- コードも日本語も綺麗に出力してくれる。段落構成や文体の指示にも素直に従ってくれる傾向がある。素直。
- Phonnoのチャット検索機能でよく使っている
- Claude Codeでもこのモデルを使っている
- Gemini 2.0 Flash Exp
- 一貫性のある画像加工の能力に感動した
- Geminiの画像編集能力に感動した - #daiizメモ
- いま振り返ると、このモデルあたりからNano Bananaの完成に向けた準備が着々と進んでいたのだろうと思える
- Gemini 2.5 Flash / Pro
- 文書や画像データの理解にちょうどよいモデル。特にFlashは処理速度も価格も手頃で使いやすい。
- Okonomi - 知的生産活動支援 AI Agent の試作 - #daiizメモ
- Phonno: 写真に対するCrop with AI機能の改善 - #daiizメモ
- Gemini APIのFile Search Toolを試した - #daiizメモ
- この頃に書いていたGeminiに関する考察メモが見つかった。今でも自分の考えは変わっていないのでここにも置いておく。個人の感想です。
Geminiの思想はやはり検索エンジンの前処理を効率よく精度よくこなすことなのかもしれない。推論中にウェブ検索ツールで外部の情報を取ってくるのがあまり上手くないのは、これに重きをおいていないのだろう。閉じたドキュメント空間を徹底的に読んで理解する、構造化する、加工する、要点をまとめるのは得意ということ。理解に全振りしている気がする。NotebookLMがうまくいっているのもこのへんの強みだけを活かしているからだと思う。
- つまりこういう用途ではGeminiが最も頼もしい
- Gemini 3.0 Flash / Pro
- 2.5を呼び出している箇所を順当にアップデートしている最中
- Proは高すぎて使いどころを迷うが、逃げていては勘が鈍ってしまうのでちょうどいい実験場所を作っていきたい
- Nano Banana Pro 🍌
- Grok 4 / 4.1 Fast
- Phonnoのチャット検索機能で使っている
- 整っていないテキストをざっくり読ませたり、ラフな文章を生成したいときに重宝する
- Gemma 3 4B
- #生成AIなんでも展示会 Vol.4 に出展しました - #daiizメモ
- ローカルLLMデビューした
- 便利なファイル探索ツールを作ろうとしていた
- その他のローカルモデル
- LM Studioをインストールしていろいろと試していた
- お金のことを気にせずに話し続けられるのはよい体験だった
だいたい書けたはず!
今年もたくさんお金を払って充実した一年でした💸 来年もよろしくお願いします!!
この記事を書いている最中に新キャラが生まれました。名前はまだない。暇つぶしに自作ツールのSVG Drawingを使うとなにかが生まれがち。線を気持ちよく描ける環境を大事に育てていきたい。
Nano Banana Proにバイブコーディングしている様子を描いてもらった。
絵の素人にもこんなことができるようになったのが最高にワクワクするのです!!
明日はkanataくんが書いてくれます。お楽しみに!