#daiizメモ

ときどきいいことを書きます

32歳

おかげさまで32周年を迎えました🎊🎉

自分のステータスページ https://status.daiiz.org/version では、生存時間が分かるようになっている。今日は11,688日目だった。秒数にするとより長く感じる。10億秒。

バージョン 3.2.0 がリリースされた

ちょっとバタバタしており、サプライズ企画やほしいものリストの準備ができていません!すみません!!!

ここから年末にかけていろいろ仕込んでいきます。 25 にちなんで、5個くらいは面白いものを世に出していきます。次の技書博12に出展します。技術書典19にも現地出展の申し込みをします!

焼肉屋の卵かけご飯

今年も美味しいものをたくさん食べたい。

東京滞在中

東京に滞在中です。昨日は関東の友人と秋葉原でカレーを食べた。ハイビーム秋葉原本店で、ずっと気になっていたGPD MicroPC2の実機も見てきた。キーボードがBlackBerryを彷彿とさせて惹かれる。出先でちょっとコードを読んだり、Cosenseを書いたり、AIと話したりする瞬間で役に立ちそう。買ってしまうかもしれない。

カレーからのハイビーム

東京に居すぎているせいか、普段と違う環境での活動認定されているらしく、Googleアカウントの本人確認が頻繁に挟まるようになってきた。よくできてるなあ。

ChatGPT Proをやめて浮いたお金で、PerplexityのProプランを再開しました。プロプレキシティです。CommetブラウザでPhonnoとの連携実験も進めていきたい。よろしくお願いします。

#生成AIなんでも展示会 Vol.4 に出展しました

すみだ産業会館で開催された生成AIなんでも展示会 Vol.4にTeamJとして参加してきました。個人開発で生成AI絡めていろいろやってきたものたちを展示しました。ブースにお越しいただいた皆様、ありがとうございました!

下記の4個を用意していきましたが、おそらくネットの不調の影響によりPhonnoのブラウザ拡張のSidebarのデモが動かなかったのでこれ以外を並べました。Phonnoは富豪的にリクエストを投げまくっているので、テザリング環境がどうこうではなくこちらの設計が悪い。次回のリベンジ戦に向けて直します!

  • Phonno
    • ブラウザのSidebarでのRecall機能
    • This Day, This Placeでのライフログ機能
    • 画像から知識を抽出して構造化する機能
  • ミャクミャクバリアント生成器
    • SVGを出力することで言語モデルでイラストを書く取り組み
    • Few-shotで例示してChatGPT APIを呼び出すデモ
    • 定期的に実行している ミャクミャクのバリアント生成チャレンジ 2025/9 - daiiz のデモをインタラクティブにした。生成時にカスタムプロンプトを与えられるようにした。
  • マックのチキンナゲットの形状分類器
    • マクドナルドのナゲットは公式に4種類の形状(Bone, Ball, Bell, Boot)がある
    • 写真を撮ることで4値分類するモデルを作った
      • 入力として「RGB画像」「モノクロ画像」「輪郭線」の3種類のモデルを学習して試したところ、RGBが最も安定していた。個人的には輪郭が有力候補だったのだが。
  • ローカルLMでの写真整理(新作)
    • とにかく写真が大量に入っているフォルダから目的の画像を探し出すシステム
      • マルチモーダルモデルとして、Gemma 3 4Bを使っている
      • 専門家の方から、PaliGemmaを使うと精度とモデルサイズのバランスがよいはずとアドバイスをもらった。試してみたい。
    • 今日のデモでは写真を題材にしたけれど、テキストファイルやPDFファイルも処理できるので、個人的なユースケースとしては「ダウンロードフォルダの中を全部見る」タスクに使っている。
      • ローカルLMの精度が不満な場合はGemini 2.5 Flashなどに差し替えることもできる
    • 早くアプリ化して提供してほしいという応援コメントや、想像が及んでいなかった分野でのユースケースの要望をもらったのでやっていきます!
    • 詳細は別の機会にまとめます📝

記念写真

上司の秋山さんが来てくださった。ありがとうございました!

設営

技術書典でいただいたテーブルクロスと、先々月になぜか衝動買いしたモバイルモニタ(2台目)が役に立ちました。生成AI関連の技術同人誌の見本誌も持っていったところ、予想以上の方が手にとって読んで質問してくれたので驚きました。

いつだかのハッピーセットのおもちゃで引き当てたチキンナゲットの模型も役に立ちました。次回は本格的な食品サンプル制作を依頼したい。あと、ナゲットの画像と輪郭データがそれなりの量あるので、Hugging Faceとかでデータセットとして公開したい?

左の画面を見る限り、この時点ではPhonnoは動いていたようだ。

新作解禁

プロジェクト Value-Value Store(VVStore)という仮称で進めいる。前日に、コードや設計ドキュメントに基づいてNotebookLMで解説動画を作ってみたが、自分が熱量を注いでいる箇所がAIにうまく伝わっていなかったのでお蔵入りにした。展示会では全て口頭で説明して乗り切った。

Desktop PWAとしてインストールしておくと、しっかりしたアプリ感をお手軽に演出できてデモ映えが良い。

いろいろフィードバックもらえて勉強になりました。やはり今回のようなイベントに積極的に展示参加してリアルなお話を聞くのは大事ですね。今後の技書博や技術書典でも、これくらい本気なデモ並べると来場者とのコミュニケーションが活性化して楽しいかもしれない。