#生成AIなんでも展示会 Vol.4 に出展しました

すみだ産業会館で開催された生成AIなんでも展示会 Vol.4にTeamJとして参加してきました。個人開発で生成AI絡めていろいろやってきたものたちを展示しました。ブースにお越しいただいた皆様、ありがとうございました！

下記の4個を用意していきましたが、おそらくネットの不調の影響によりPhonnoのブラウザ拡張のSidebarのデモが動かなかったのでこれ以外を並べました。Phonnoは富豪的にリクエストを投げまくっているので、テザリング環境がどうこうではなくこちらの設計が悪い。次回のリベンジ戦に向けて直します！

Phonno
- ブラウザのSidebarでのRecall機能
- This Day, This Placeでのライフログ機能
- 画像から知識を抽出して構造化する機能
ミャクミャクバリアント生成器
- SVGを出力することで言語モデルでイラストを書く取り組み
- Few-shotで例示してChatGPT APIを呼び出すデモ
- 定期的に実行しているミャクミャクのバリアント生成チャレンジ 2025/9 - daiiz のデモをインタラクティブにした。生成時にカスタムプロンプトを与えられるようにした。
マックのチキンナゲットの形状分類器
- マクドナルドのナゲットは公式に4種類の形状（Bone, Ball, Bell, Boot）がある
- 写真を撮ることで4値分類するモデルを作った
  - 入力として「RGB画像」「モノクロ画像」「輪郭線」の3種類のモデルを学習して試したところ、RGBが最も安定していた。個人的には輪郭が有力候補だったのだが。
ローカルLMでの写真整理（新作）
- とにかく写真が大量に入っているフォルダから目的の画像を探し出すシステム
  - マルチモーダルモデルとして、Gemma 3 4Bを使っている
  - 専門家の方から、PaliGemmaを使うと精度とモデルサイズのバランスがよいはずとアドバイスをもらった。試してみたい。
- 今日のデモでは写真を題材にしたけれど、テキストファイルやPDFファイルも処理できるので、個人的なユースケースとしては「ダウンロードフォルダの中を全部見る」タスクに使っている。
  - ローカルLMの精度が不満な場合はGemini 2.5 Flashなどに差し替えることもできる
- 早くアプリ化して提供してほしいという応援コメントや、想像が及んでいなかった分野でのユースケースの要望をもらったのでやっていきます！
- 詳細は別の機会にまとめます📝