Gemini 2.0とアプリと統合されたLLM

Gemini 2.0とアプリと統合されたLLM
Gemini 2.0とアプリと統合されたLLM

Googleにとって今日は忙しい一日でした。同社は12月に発表済みのGemini AIアシスタントのバージョン2.0を、様々な新規モデルとアップデートモデルを搭載し、より多くのユーザーに向けてリリースしました。Googleブログより:

本日、Google AI Studio および Vertex AI の Gemini API を通じて、アップデートされた Gemini 2.0 Flash の一般提供を開始しました。開発者の皆様は、2.0 Flash を使用した本番環境アプリケーションの開発が可能になります。

また、コーディングパフォーマンスと複雑なプロンプトの精度においてこれまでで最高のモデルであるGemini 2.0 Proの実験版もリリースします。Google AI StudioとVertex AI、そしてGemini Advancedユーザー向けのGeminiアプリでご利用いただけます。

これまでで最もコスト効率の高い新しいモデル、Gemini 2.0 Flash-Lite を、Google AI Studio と Vertex AI のパブリック プレビューとしてリリースします。

最後に、2.0 Flash Thinking Experimental は、デスクトップとモバイルのモデル ドロップダウンで Gemini アプリ ユーザーに提供される予定です。

Googleの推論モデル(DeepSeek-R1やOpenAIのo1/o3ファミリーと同様に、「思考の連鎖」を表示し、ユーザーのクエリについて多段階的な思考を実行できます)は、現在、人気のChatbot Arena LLMリーダーボードで1位にランクされています。Googleの別のブログ投稿では、Gemini 2.0 APIとの統合を希望するサードパーティ開発者向けの新しい価格体系の詳細も公開されており、Gemini 2.0 Flashと2.0 Proの両方に近日リリース予定の画像や音声出力などの機能についても確認されています。注目すべきは、開発者にとってさらに安価な2.0 Flash-Liteモデルも用意されていることです。これは、Obsidian Web Clipperなどのユーティリティやソーシャルメディアクライアントのコンポーザーフィールドなどで、近いうちに目にすることになるでしょう。

AI支援ツールの評価の一環として、12月にGeminiが初めてリリースされて以来、ChatGPTの代わりにGeminiを使い、徐々にChatGPTを置き換えてきました。そして本日、Flash 2.0の一般公開後、ついにiPhoneのDockでChatGPTをGeminiに切り替えました。

これはいずれ詳細な記事になると思いますが、これまでの私の見解としては、ChatGPT の方がメディアで大きく取り上げられ、より主流の製品1ではあるものの、Google は、a) 独自の AI シリコンと、b) LLM を自社のエコシステムに統合された個人および業務用の実際の製品にすることで、より魅力的な取り組みを行っていると思います。Gemini は(当然のことながら)昨年の最初のリリースで悪評を浴び、いまだに幻覚的な応答をしますが(LLM はどれもそうですが)、2.0 モデルは、私が以前 ChatGPT に尋ねていたような検索クエリには十分すぎるほどです。さらに、MacStories では Google Workspace の料金を支払っていますが、Gemini は Drive や Gmail など、日常的に使用するサービスと直接統合されているのが気に入っています。

何よりも、 Geminiの拡張機能サポートに大変興味をそそられます。拡張機能は、チャットボットとの会話を他のGoogleアプリで実行できるアクションに変換します。例えば、アプリを起動して保存したいものを尋ねるだけで、リサーチした内容をGoogle Keepに保存できる機能に満足しています。YouTube動画を検索したり、Googleマップで場所を検索したり、さらには(私のアパートではHomeKit、Alexa、Google Homeをネイティブにサポートするプラットフォームに依存しないホームオートメーションシステムを運用しているので)照明の制御までも行っています。ChatGPTのカスタムGPTは今や廃墟のようですが、Geminiのアプリ統合は完全に機能し、Googleエコシステム全体に統合されており、サードパーティサービスにも拡張されています。2

さらに驚くべきことに、Googleは本日、YouTube、マップ、検索と連携可能なGemini 2.0の推論バージョンのプレビュー版を公開しました。これは、Geminiがユーザーのリクエストをより長く考え、思考プロセスを表示した上で、アプリで何らかの処理を実行するというものです。そこで私はこう尋ねました。

リアムがボーカルを務めるオアシスのアコースティックパフォーマンスのYouTube動画で、最高のものを見つけてください。1994年から1996年にかけてヨーロッパで行われたパフォーマンスに限ります。デモや歌詞ビデオ、その他ライブではないパフォーマンスは対象外です。ノエルがギターを弾き、リアムが歌うアコースティックセットに限ります。

予想通り、確かな結果が提示されました。Googleが推論機能をGmailの高度な検索機能に統合できれば、ShortwaveやSuperhumanといったサービスに匹敵する性能を発揮するでしょう。そして、Googleのスイートに含まれる他のアプリも、理論上は同様の扱いを受ける可能性があるのは言うまでもありません。

しかし、Gemini アプリは、iOS/iPadOS ユーザー エクスペリエンスの点では、いくつかの重要な領域で ChatGPT や Claude に及ばない。

このアプリはウィジェット(Claudeにはある)をサポートしておらず、ショートカット機能も提供されていません(ClaudeとChatGPTにはあるのに)。ネイティブiPadアプリもありません(ため息)。iOSで新しいチャットを素早く開始するためのディープリンクがあるのか​​どうかも分かりません。写真ピッカーも、一度に1枚しか添付できないという点で使いにくく、WebアプリはiPhoneとiPadでのネイティブPWAインストールをサポートしていません。

GoogleがGeminiをAppleプラットフォーム上で素晴らしい体験にするには、まだ長い道のりが待ち受けていることは明らかです。しかし、Geminiは非常に高速で、既に使っている他のGoogleサービスと会話を連携させることができるので、これらの機能が欠けていることは私にとって大きな問題ではありません。だからこそ、ネイティブiOSアプリと統合またはディープリンクされた会話をサポートする「Siri LLM」(製品名としては「Siri Chat」でしょうか?)こそが、2026年においてAppleにとって最大の資産となる可能性があると私は確信しています。

ChatGPTが世界中の注目を集めているとはいえ、結局のところ、Appleが打ち負かすエコシステムとなるのはGeminiだと私は考えています結局のところ、iPhone対Androidという構図に終始することになります。ただ今回は、Appleが追い上げを狙っているというだけです。


  1. さらに、o1-pro の大規模コードベースにおけるコーディングパフォーマンスは他に類を見ないものです。しかし、月額 200 ドルという高額な料金設定は、個人のワークフローを支援する AI ツールに関心のある一般ユーザーが支払うべき金額をはるかに上回っています。↩︎
  2. いつか Gemini 用の Todoist 拡張機能が登場することを期待しています。↩︎

クラブ・マックストーリーズ

追加コンテンツと特典にアクセスする

Club MacStories は 2015 年に設立され、ほぼ 10 年間にわたって毎週独占コンテンツを提供してきました。

毎週、毎月の電子メール ニュースレターから始まったものが、すべての MacStories ファン向けに設計されたメンバーシップ ファミリーに成長しました。

詳細については、こちらおよびクラブの FAQ をご覧ください。

Club MacStories : アプリ、ヒント、自動化ワークフロー、長​​文執筆、MacStories Unwind ポッドキャストへの早期アクセス、定期的な景品など、盛りだくさんの情報を満載した、電子メールと Web 経由の週刊および月刊ニュースレター。

Club MacStories+ : Club MacStories が提供するすべての機能に加え、アクティブな Discord コミュニティ、クラブの過去のカタログ全体を閲覧するための高度な検索機能とカスタム RSS 機能、ボーナス コラム、多数のアプリ割引などが含まれます。

Club Premier : 上記のすべてに加え、早期に、広告なしで、高ビットレートのオーディオで配信される当社の主力ポッドキャストの拡張バージョンである AppStories+ が含まれます。