#daiizメモ

ときどきいいことを書きます

phonno の検索結果:

ChatGPT 3周年

…めた日でもあります。Phonnoでスクリーンショットを探してみると、最初の会話が見つかりました。これが運命の出会いというやつですね。 大規模言語モデルとの最初の会話 当時のChatGPTは研究プレビュー版として無料提供されていたようでした。 Research previewの文字が読み取れる いまとなっては懐かしい、思い出となるよい画像です。どんなものでもスクショは撮っておくにかぎります。 この出会いからさらに月日が経ち、LLMは順調に流暢に自然言語を話すようになってきました…

Phonno Legacy: Google Mapsを使ってみる

Phonno Legacyで画像の撮影場所を示すための地図を改良している。この機能では、これまではOpenStreetMapの地図タイルを使っていた。交通機関や店の情報が小さいアイコンで示されているため情報量が豊富でよい。また道路や線路も目立つようにデザインされている。これらは撮影地を思い出すためのヒントとなるため、充実していてかつ見やすいことが大事である。 現状でも特に不満はなかったが、Google Mapsバージョン(Maps JavaScript API)も使えるように…

水曜日

洗濯、残業、すき家のカレー、Phonnoの軽微な修正、再配達の依頼をやった。寒かったり、暑かったり。明日も忙しい。大変だ〜

日曜日

昨日に引き続き、Phonno Legacyでの思い出機能の開発を進めていた。基本的なAPIやUIパーツは実装済みなのでClaude Codeでの半自動開発が捗っている。昨日までの状態では、画像が持つ位置情報と現在位置を突き合わせることで過去のアイテムを取得していた。この仕組みにより、直接的に位置に紐づく写真を列挙できていた。 今日はさらに一歩進んで、スクリーンショットなどの位置情報を持たない画像も一緒に提示できるようにした。その名も「Grounded at This Plac…

「この場所での思い出」機能

Phonno Legacyで、Memories at This Place 機能(タイムマシン機能)を試作中。検索結果リストからタイムマシンビューに入るとその場所で撮られた写真を振り返ることができる。「<」「>」で移動することで、アクティビティ単位(ref. Semantic chunking - #daiizメモ)の塊で時間移動できる。例えば、東京ドームでのライブを思い出せて便利。 東京ドームで最後に撮った写真 Googleマップで表示中の緯度経度情報を引き継いでPhonn…

ほぼ日手帳アプリが気になった

…いない。 個人開発のPhonnoでも「この日、この場所」機能を作っているくらいなので、自分がどこでどういう活動をしていたかをライフログ的に記録しておき、あとから見直すことで過去の自分から刺激をもらうような仕掛けは大好き。意識せずに記録されていることが大事なポイント。 techoapp.1101.com Android版は近日配信予定とのことだったので、インストールの予約だけしておいた。 思い出プリント機能の動画も見て予習しておいた。 youtu.be 紙のノートも好きなので、…

土曜日

…otebookLMやPhonnoもゲーム機で動かしている感覚で楽しめる。手に包み込むようにしてGyazoを起動して撮影できるのも楽しい。Ctrl+0でキャプチャできるようにした。 この端末でがっつり開発するのは想定していないので、今回は最初からVS Codeは入れないことにした。GeminiやClaude、Google AI Studioでバイブコーディングすることを強制していく。コードを読まずして勢いだけで何かを作る訓練機だ。 こんな感じで、よく使うAIたちをデスクトップで…

絵文字で探索

…tchen感のある見た目のものができた。 絵文字を一つずつ選んで画像とページを絞り込んでいける。一個選ぶたびに、選択不可能な組み合わせはグレーアウトしていく。最大3個まで組み合わせられる。 絵文字を2個選んだところ いくつか具体例を見てみよう。 例1: 花粉症 くしゃみの絵文字を選んで花粉症の記事が見つかった様子 例2: カフェ カフェで過ごした時間を思い出す探索結果 例3: 技術書 技術書📚️💻️を発見できる 楽しいですね!!Phonnoのコンテンツを混ぜるとさらに楽しい!

個人開発トークナイトに登壇しました

…はこんな感じです。 Phonno 写真とスクリーンショットのナレッジベース 自分自身の分身を目指しているやつ Okonomi インスピレーションを広げるAIエージェント 論文や書籍を読んで、根拠付きでレポートする(DeepResearch Agent) VVStore ローカルフォルダを整理するツール 写真フォルダやダウンロードフォルダから目的のファイルを探す Griddlet 大量のドキュメントをザッピングするツール 10万件オーダーの関心情報に定期的に触れ続ける方法を考え…

東京滞在中

…eアカウントの本人確認が頻繁に挟まるようになってきた。よくできてるなあ。 ChatGPT Proをやめて浮いたお金で、PerplexityのProプランを再開しました。プロプレキシティです。CommetブラウザでPhonnoとの連携実験も進めていきたい。よろしくお願いします。 Phonnoで抽出した知識をPerplexityで深堀りできるようにしてみた。面白いかも。 pic.twitter.com/mBAJtWR3vr— daiiz (@daizplus) 2025年9月4日

#生成AIなんでも展示会 Vol.4 に出展しました

…トの不調の影響によりPhonnoのブラウザ拡張のSidebarのデモが動かなかったのでこれ以外を並べました。Phonnoは富豪的にリクエストを投げまくっているので、テザリング環境がどうこうではなくこちらの設計が悪い。次回のリベンジ戦に向けて直します! Phonno ブラウザのSidebarでのRecall機能 This Day, This Placeでのライフログ機能 画像から知識を抽出して構造化する機能 ミャクミャクバリアント生成器 SVGを出力することで言語モデルでイラス…

Pixel 10 を使い始めた

…eferred Care(AppleCareみたいなやつ)にも入っていることだし裸で使い始めてもよいでしょう! ずっと気になっていたPixel Screenshotsも試せるようになった。Gemini Nanoがオフライン処理でスクリーンショットを整理してくれるやつ。Phonnoの開発の刺激になるユースケースの発見があるかもしれない。期待。 利用開始直後のチュートリアルでNotebookLMに言及されていた。プリインストールされているらしい。本気だなあ。 9月のはじまりです。

NotebookLMで自分の本の動画解説を作った

NotebookLMに「Phonno」の解説本『知的生産のための画像検索システム開発記』のプレゼン動画を生成してもらった。せっかくなのでYouTubeにアップロードした。 やる気が出ないときは、過去の自分の成果物を眺めながら調子が戻るのを待つしかないのだ。 高評価とチャンネル登録よろしくお願いします。ではでは!

Phonno LegacyにGrok 4を搭載した

Phonno Legacyで、xAIが開発している言語モデル「Grok 4」に対応した。久しぶりにモデルの種類が増えた。 簡単に出力結果を比較してみよう。私が所有しているスクリーンショットや写真などの画像郡からざっくりと取得した情報を用いて、クエリに対する回答を作文するRAGタスクをやってみる。 実験クエリ Phonnoとはなんですか? SVGの魅力は? Claude Sonnet 4 Gemini 2.5 Pro Grok 4 🎉 悪くないね!!

osckyoto曜日

…ジェットストリーム Phonno Legacyで写真推薦機能の開発がきっかけでOpenStreetMapにも興味があるので、地図と写真とWikidataの連携技の領域での貢献を模索したい。 まとめ エンジニア人生が長くなってくると、関わったことがある(= 助けられたことがある)オープンソースプロジェクトが増えてくるので、ブース訪問が楽しくなる #osckyoto— daiiz (@daizplus) 2025年8月3日 おまけ チラックス ソーダピーチ / 昼下がりの丹波口駅…

Beginners DX DojoでLTした土曜日

…nomi」の話など。Phonno Legacyで実験している「Webページをクエリとして写真を探す機能」*1もちら見せできてよかった。わりと好評で、懇親会の残りの時間でもたくさん質問してもらった。まだブログに書けていなかったGemini 2.5 Flash-Liteが精度と応答速度のバランスの観点で優れているという話をした。 scrapbox.io LTの締めとして、カンファレンスのセッションの録音データを使ったOkonomiの即興デモにも挑戦した。無事に動いて良かった。ただ…

金曜日

ピザハットのグラタンとハニーフォカッチャを食べた。

水曜日

Uber Eatsでおすすめされた重ねかつ丼を食べた。暑すぎて食事のサイクルがおかしくなっているため、今日は夕方のこれ一食で済んだ。 ここのところ久しぶりにLLM関連の論文を読み漁っている影響で、「重ね」とか見るとモデルのアーキテクチャ図を思い浮かべてしまう。イメージしたものをClaudeにそのまま図にしてもらった。 Layered Pork Cutlet Figure 1: The Katsudon-Transformer architecture showing the …

日曜日

投票所近くの喫茶店に立ち寄った。高菜オムライスを食べた。 いつからかバターライスの方が好きになっていた せっかく外出に成功したので、散髪も済ませた。当日予約しかできない理容室を使っている。先のスケジュールを組むのが苦手な、自分のような人にとってはとてもありがたい。 Phonnoによると、前回の参院選の投票後には京都駅のカフェで珈琲を飲んでいることがわかった。Deno Deployにもサインアップしていた。

もくようなぎ

すき家でうな牛を食べた。今年初の鰻。 flowchart LR A["牛丼の上に蒲焼き鰻を載せた料理"] --> B["赤い漆調の丼"] A --> C["トレーに乗せられている"] C --> D["味噌汁と白菜の浅漬けが添えられている"] E["ファストフード店のカウンター"] --> F["注文用タブレット"] F --> G["「タッチして、ご注文ください」と表示"] はてなブログでもMermaid記法のチャートを展開できるのか!! staff.hatenablog.…

水曜日

X(Twitter)に登録して12年が経った。登録した当時は、Google+を少し眺めていたくらいで、SNSとはほぼ無縁だった。 大学一年のプログラミングの講義で隣の席だった友人に勧められてアカウントを作った。いい思い出だ。同時にAndroidデバイス沼にも引き込んでくれた。おかげでGoogleのソフトウェアエンジニアリングの話題を追っかけたり、Javaを書けるようになったりした。Nexus 7を買ったことでレポート生活の質が上がって嬉しかったのを覚えている。初めて自力で買っ…

独自のGoLinksを実装して運用している

…手書きのノートにd/Phonno や d/snapshotsと書くだけでどのプロジェクトの話をしているのかが明確になります。 さらに、ファンとして応援している櫻坂46関連のコンテンツにすぐに辿り着けるのも最高です。これらは配信サービス名と番組名の組で覚える必要があるため、嬉しい悲鳴ではありますが、追いかけるものが増えるほど厳しくなっていきます。このように普段の呼び方で登録しておけばOKです。 自分が欲しいアプリを自給自足できる世界、いいですね! *1:daiizの"d"です。…

金曜日

…熟考モードとして、Gemini 2.5 Proを選べるオプションを実装したい。Gemini 2.5 Flashしか使っていない状態でも先月に5,300円もかかっているのでちょっと怖い。設計ミスか何かでContext cachingがうまく効いていない可能性は大いにあり得る。 話は変わって、脳内のPhonno開発チームがいいアイデア思いついたから試したいって言っているけど、いま開発リソースが足りないのでしばらく待ってもらう。もっと期待できる提案を持ってきてもらいたい。がんばれ!

月曜日

眠すぎる!!!!先週の月曜日も眠かった。今日はオフィスに行ったのでまだ救われていた。 daiiz.hatenablog.com 雨上がりのアイスコーヒー。ローソンの紙コップが夏仕様になって朝顔が咲いていた。 今月も毎日何かしら書けてよかった。いま振り返ったら一記事多かった。WWDCの日に二つ書いていたようだ。うるう記事。 2025-06-10から1日間の記事一覧 - #daiizメモ この記事みたいなしょうもない内容であっても、続けることが大事。一日さぼるだけでもエンジンがか…

Semantic chunking

Phonno Legacyの「この日、この場所」機能*1がパワーアップした。写真がメタデータとして持っている撮影日時と地理情報の組を利用して、一連の写真記録を自動で複数の塊に分けることができる。時間的な連続性と地理的な離散性をうまく組み合わせた結果、いい感じに動いている。 GUIでの表現としては、ナビゲーションボタンを配置して、パラパラ漫画のような見せ方を実現できたりする。これもこれで思い出の振り返りUIとして大変便利だが、システム的にはデータ全体を部分的なチャンクに分けて理…

日曜日

この土日は中途半端な時間に3回くらい寝た。短い睡眠時間でも数が多いと誤魔化せる感がある。寝て起きてもまだ休みが終わっていないという、なんとも言えない得をした気分になれてお得。夕方にダイソーに行ってきた。 技術書典の倉庫に紙の本を送るための箱を買った。最低限要求される箱の高さを測ろうとしたけど、部屋で定規が見つからなかった。指先を0として、本の山の高さと同じ位置をボールペンでマークして店に行った。案外これで十分。 夕飯はサブウェイのタンドリーチキンサンドとサラダ。期待したほど辛…

Phonno: 写真に対するCrop with AI機能の改善

PhonnoのCrop with AI機能の精度を改善した。この機能では、ボタンを押すだけで画像から得られる知識として重要な箇所を特定できる。実装としては、以下の記事のように、従来のCloud Vision APIをやめてGeminiを使うよう舵を切っていた。 daiiz.hatenablog.com 今回はGeminiに渡す際のプロンプトの調整を行った。その結果、特に写真に対する切り抜き領域の特定が安定した。熱海旅行での写真を例にいくつか紹介してみる。 ボトルを中心にして程…

Okonomi: PNG/JPEG画像の入力に対応

…だけ与えても動くが、Phonnoでの研究知見では、文字での概要も一緒に渡すほうが回答精度が安定する傾向があったので今回もこの作戦を採用した。 ここからは、先日の熱海旅行で撮った写真の一部を用いた実験結果を紹介する。 daiiz.hatenablog.com 旅行中の食事のまとめ 2日間の写真フォルダのなかから抽出された食事情報 よく見ているなあ。 旅行経路の分析 出発地がわかる写真をフォルダに敢えて含めていないため、「不明」になっているのがミソ。常識的に考えると帰着地と同じと…

フローチャートを育てる

…の恩恵を受けた結果、Phonnoで生成されるフローチャートが安定してきた。リリース当初と比べて生成結果の文法エラーが減少し、さらに本質的な情報を捉える能力や表現力も向上している。画像知識からフローチャートを生成できるこの機能、Phonnoのキラーフィーチャーとして育てていけるかもしれない。 技術書典18に関する情報を構造化した様子 チャートのノードをクリックして検索できるようにしたら、これまた楽しい。ユーザーに検索クエリツリー(グラフ)を見せてあげている感じになる。リスト形式…

火曜日

頭のなかで、開発作業を怠けていないかを見張られている。なんで手を動かしてないの〜って言われる。惰性であっても手を動かしていればなにか形になってきて、形が見えてくると今度は改良したくなる。こうやって生まれてくるなにかもある。