こんにちは。この記事はTeamJ Advent Calendar 2024の12日目の記事です。 昨日は id:kanata_02 による 2024年のイベント - かなたのめも でした。この間kanataくんのイベント終わりに合流するために初めて京都コンサートホールに立ち寄って外観を見ましたが、かなりお洒落な建物でした。北大路よりも北に行く機会が少ないので良い体験でした。
GoogleからGeminiの新しいバージョンがいきなり発表されましたね!!
Gemini 2.0 Flash Experimental!!
Gemini Flash - Google DeepMind
すでに日本語版のGemini Advancedのウェブアプリにも来ている。
早速いろいろ試してみているけれど、かなりの進化を遂げている気がする。Google AI Studioでのデモも充実してきていて全部試すには時間がない!リアルタイムでの会話もできるし、写真での物体検出(2D、3Dバウンディングボックス)をはじめとする画像理解能力もやばい。応答も速いし、ちまちまCloud Vision APIを呼び出す必要もなくなっていきそうだなあ。
Gemini 2.0 Flashで物体検出できるらしいんだけど、これすごいのでは!! Google AI Studio > Starter Appsで試せる! pic.twitter.com/snp369qc7d
— daiiz (@daizplus) 2024年12月11日
gemini-2.0-flash-expの写真認識力すごすぎでは pic.twitter.com/elBWjjAo2t
— daiiz (@daizplus) 2024年12月12日
Vertex AIのAPIも使えるようになっていたので、Phonnoでもモデルの選択肢に含めておきました。最新モデルの威力をフル活用するためにプロンプトの調整も必要になりそうだけど、まあとりあえず。スピード感をもって遊びながら考えていきましょう!
gemini-2.0-flash-exp 対応済み! #Phonno pic.twitter.com/vigzrqHzeg
— daiiz (@daizplus) 2024年12月11日
Cosense /daiiz を題材にした #Phonno のデモで gemini-2.0-flash-exp が応答するようにしておきましたhttps://t.co/lwZytCcDHK
— daiiz (@daizplus) 2024年12月11日
いまのところは流石に安定している。当然Google検索エンジンの裏側での活用を意識してトレーニングされていることだろうし、AI Overview(旧称 SGE)機能のような情報抽出と要約タスクは特に向いている気がする。
また、面白い用途を見つけたら共有します!