#daiizメモ

Cosenseに夢中

gemini-2.0-flash-exp に夢中

こんにちは。この記事はTeamJ Advent Calendar 2024の12日目の記事です。 昨日は id:kanata_02 による 2024年のイベント - かなたのめも でした。この間kanataくんのイベント終わりに合流するために初めて京都コンサートホールに立ち寄って外観を見ましたが、かなりお洒落な建物でした。北大路よりも北に行く機会が少ないので良い体験でした。

GoogleからGeminiの新しいバージョンがいきなり発表されましたね!!
Gemini 2.0 Flash Experimental!!

Gemini Flash - Google DeepMind

すでに日本語版のGemini Advancedのウェブアプリにも来ている。

早速いろいろ試してみているけれど、かなりの進化を遂げている気がする。Google AI Studioでのデモも充実してきていて全部試すには時間がない!リアルタイムでの会話もできるし、写真での物体検出(2D、3Dバウンディングボックス)をはじめとする画像理解能力もやばい。応答も速いし、ちまちまCloud Vision APIを呼び出す必要もなくなっていきそうだなあ。

Vertex AIのAPIも使えるようになっていたので、Phonnoでもモデルの選択肢に含めておきました。最新モデルの威力をフル活用するためにプロンプトの調整も必要になりそうだけど、まあとりあえず。スピード感をもって遊びながら考えていきましょう!

いまのところは流石に安定している。当然Google検索エンジンの裏側での活用を意識してトレーニングされていることだろうし、AI Overview(旧称 SGE)機能のような情報抽出と要約タスクは特に向いている気がする。

また、面白い用途を見つけたら共有します!