#daiizメモ

ときどきいいことを書きます

Phonno: Boxの概要生成

Boxに収録されている画像ソースをざっくり理解して、概要を生成できるようになった。画像を新たにアップロードしたときや、雑多なテーマを扱っていて様々な切り口から書けそうなときは適当なタイミングで再生成される。

概要を書くためにLLMが一度に読めるコンテンツ量には限りがあるので、でかいデータセットの場合はランダムに選択している。無作為に選ばれた画像郡から新しい概要を作り、既存の概要とミックスする。この二段構えにすることで、過去の生成結果も適度に取り込みつつ新鮮さも得られていい感じだった。ランダム凝縮と名付けた。GraphRAGのコミュニティ要約のアプローチも気になるので時間をみつけて実験してみたい。

既存のBoxの概要は順次生成されていきます。待ちきれない方は、ボックス名*1をクリックしてください。即時に生成処理が実行されます。

概要はログインしているときだけ表示されます。

daiizのWiki

『LLM時代の​検索を​考える​観察日記』

論文の箱

雑談: LLMは字数制限を守ってくれない。毎回のようにオーバーしてくるので表示時にカットしている。いまでも GPT, Gemini, Claude みんな苦手っぽい。

*1:スクリーンショット例での「daiizのWiki」や「LLM時代の​検索を​考える​観察日記」の部分