G曜日 - #daiizメモ

Google 渋谷オフィスで開催されたGoogle I/O Extended Tokyo 2025に参加してきました。ずっとAI / Cloudの部屋にいた。気になったキーワードをまとめたメモはこちらです。書きかけの項目もそのうち完成します。

日頃LLMを追っかけている自分にとっても、「GeminiとVeoで創る！Webパズルゲーム開発入門」と「Gemini の音声出力モデルを使って遊ぼう」は特に新鮮な話だった。学びが多かった。前者はゲーム開発経験者ならではの視点で、まったく思いつかなかった生成AIの使い方を見せてくれた。Veoをアプリに自然に組み込んで使うイメージがなかった（Whiskくらいしか実例を知らなかった）ので勉強になった。

後者の発表では、NotebookLMの音声概要機能で提供されるような複数話者（現時点では最大2人）の会話を出力するAPIがすでに提供されていることを知れた。音声を扱うアプリ開発に参戦したいので、キャッチアップの手始めとしてこの記事を読んでおこう。懇親会では、実際にポッドキャストを自動生成するサービスの開発者の方にもシナリオの作り方などの話を聞けてよかった。

おふたりともGoogle AI Studio *1を使いこなしていることも印象的だった。このブログでも何度か紹介しているように、このツールは最高です。無料で（なぜ？）好きなだけ試行錯誤して実験した後にPythonやNode.jsのSDKを使ったコードを出力してくれるのでプロトタイピングがかなり捗る。最近搭載された「Build apps with Gemini」機能ではVibe codingも体験できる。ゲーム開発のトークで、Vibe codingとの向き合い方について「Geminiに仕事を任せてコーヒーを飲みに行って、戻ってきて、ああできているな〜と言う」「面白いかどうかを確認できるレベルのものが作れればいい」と語っていたのがよかった。これくらい肩の力を抜いてやっていきたい。

ここからは写真集です。