#daiizメモ

ときどきいいことを書きます

#生成AIなんでも展示会 Vol.4 に出展しました

すみだ産業会館で開催された生成AIなんでも展示会 Vol.4にTeamJとして参加してきました。個人開発で生成AI絡めていろいろやってきたものたちを展示しました。ブースにお越しいただいた皆様、ありがとうございました!

下記の4個を用意していきましたが、おそらくネットの不調の影響によりPhonnoのブラウザ拡張のSidebarのデモが動かなかったのでこれ以外を並べました。Phonnoは富豪的にリクエストを投げまくっているので、テザリング環境がどうこうではなくこちらの設計が悪い。次回のリベンジ戦に向けて直します!

  • Phonno
    • ブラウザのSidebarでのRecall機能
    • This Day, This Placeでのライフログ機能
    • 画像から知識を抽出して構造化する機能
  • ミャクミャクバリアント生成器
    • SVGを出力することで言語モデルでイラストを書く取り組み
    • Few-shotで例示してChatGPT APIを呼び出すデモ
    • 定期的に実行している ミャクミャクのバリアント生成チャレンジ 2025/9 - daiiz のデモをインタラクティブにした。生成時にカスタムプロンプトを与えられるようにした。
  • マックのチキンナゲットの形状分類器
    • マクドナルドのナゲットは公式に4種類の形状(Bone, Ball, Bell, Boot)がある
    • 写真を撮ることで4値分類するモデルを作った
      • 入力として「RGB画像」「モノクロ画像」「輪郭線」の3種類のモデルを学習して試したところ、RGBが最も安定していた。個人的には輪郭が有力候補だったのだが。
  • ローカルLMでの写真整理(新作)
    • とにかく写真が大量に入っているフォルダから目的の画像を探し出すシステム
      • マルチモーダルモデルとして、Gemma 3 4Bを使っている
      • 専門家の方から、PaliGemmaを使うと精度とモデルサイズのバランスがよいはずとアドバイスをもらった。試してみたい。
    • 今日のデモでは写真を題材にしたけれど、テキストファイルやPDFファイルも処理できるので、個人的なユースケースとしては「ダウンロードフォルダの中を全部見る」タスクに使っている。
      • ローカルLMの精度が不満な場合はGemini 2.5 Flashなどに差し替えることもできる
    • 早くアプリ化して提供してほしいという応援コメントや、想像が及んでいなかった分野でのユースケースの要望をもらったのでやっていきます!
    • 詳細は別の機会にまとめます📝

記念写真

上司の秋山さんが来てくださった。ありがとうございました!

設営

技術書典でいただいたテーブルクロスと、先々月になぜか衝動買いしたモバイルモニタ(2台目)が役に立ちました。生成AI関連の技術同人誌の見本誌も持っていったところ、予想以上の方が手にとって読んで質問してくれたので驚きました。

いつだかのハッピーセットのおもちゃで引き当てたチキンナゲットの模型も役に立ちました。次回は本格的な食品サンプル制作を依頼したい。あと、ナゲットの画像と輪郭データがそれなりの量あるので、Hugging Faceとかでデータセットとして公開したい?

左の画面を見る限り、この時点ではPhonnoは動いていたようだ。

新作解禁

プロジェクト Value-Value Store(VVStore)という仮称で進めいる。前日に、コードや設計ドキュメントに基づいてNotebookLMで解説動画を作ってみたが、自分が熱量を注いでいる箇所がAIにうまく伝わっていなかったのでお蔵入りにした。展示会では全て口頭で説明して乗り切った。

Desktop PWAとしてインストールしておくと、しっかりしたアプリ感をお手軽に演出できてデモ映えが良い。

いろいろフィードバックもらえて勉強になりました。やはり今回のようなイベントに積極的に展示参加してリアルなお話を聞くのは大事ですね。今後の技書博や技術書典でも、これくらい本気なデモ並べると来場者とのコミュニケーションが活性化して楽しいかもしれない。