Siriではないもの:Perplexityの音声アシスタントとiOSに統合されたLLMの可能性

Siriではないもの:Perplexityの音声アシスタントとiOSに統合されたLLMの可能性
Siriではないもの:Perplexityの音声アシスタントとiOSに統合されたLLMの可能性

Perplexity という会社が、OSのネイティブ機能と連携する音声アシスタントのiOS版をリリースしたというニュースを耳にしたことがあるかもしれません。Perplexity のWebスクレイピング手法は私が大嫌いで、MacStoriesでは現在もブロックしている唯一のAIボットです。見逃した方のために、彼らのプロモーションビデオをご紹介します。

これは非常に巧妙なアイデアです。他の主要なLLMの音声モードはチャットボットとの会話(率直に言って、Siriを圧倒するほどの品質と会話の流れ)に限定されていますが、Perplexityは独自の工夫を凝らしています。ネイティブのApple APIとフレームワークを使用することで、会話をより実用的なもの(人によっては「エージェント的」とさえ言えるでしょう)にし、毎日使うAppleアプリと統合しています。Perplexityの音声アシスタントを「Siriのあるべき姿」と評したり、このためAppleはPerplexityを買収対象として検討すべきだと主張する人が多くいます。そこで、Perplexityの音声モードをしばらく使ってみた上で、いくつか追加のコメントとメモを共有したいと思います。

この機能の最も重要な点は、後から考えると非常に明白なことであり、OpenAI が、非常に人気のある ChatGPT 音声モードに同じ機能をまだ出荷していないことに驚いていることです。Perplexity の iOS 音声アシスタントは、「秘密の」トリックや隠し API を使用していません。サードパーティの iOS 開発者がすでに使用できる既存のフレームワークや API と統合しているだけですリマインダー/カレンダー イベントの取得と作成には EventKit を活用しています。Apple マップの場所のインライン スニペットの読み込みには MapKit を使用しています。Mail のネイティブ作成シートと Safari View Controller を使用して、ユーザーが事前入力されたメールを送信したり、Web ページを手動で閲覧したりできるようにしています。Music アプリがインストールされ、アクティブなサブスクリプションがある場合は、MusicKit と統合して Apple Music の曲を再生します。理論上、PerplexityがShazamKit、Image Playground、WeatherKit、クリップボード、さらには写真ライブラリへのアクセスといった追加フレームワークを音声アシスタントに組み込むことを阻むものは何もありません。PerplexityはSiriの機能を模倣するための「抜け穴」を見つけたわけではありません。彼らは単に、そうしたことを初めて実現した大手AI企業だったというだけです。

しかし、だからといってその統合がそれほど印象的でなくなるわけではありません。なぜなら、人々がもはやSiriの限界に耐えられない理由を完璧に示しているからです。LLM後の世界、特にLLMに音声モードが搭載された今、自然言語を完全に理解し、その文脈全体を保持し、Web検索、ユーザーコンテキスト、そしてPerplexityの場合はアプリ統合といったツールを組み合わせてリクエストを完了できるアシスタントと、長時間の会話ができることが期待されます。この点から見ると、Perplexityの音声モードはSiri(ChatGPT統合版でさえも)をはるかに凌駕しています。

2つの例を挙げると、私はSiriとPerplexityの両方に次の質問をしました。

『The OC』でセス・コーエンがスパイダーマンのマスクをかぶって天井から逆さまにぶら下がっていたときに流れていた曲を演奏できますか?

iOS のコントロール センターはこれまで何回、大幅な再設計が行われたか教えていただけますか?

ChatGPT連携が有効になっているにもかかわらず、Siriは全く役に立たなかった。コントロールセンターのクエリでは、Google検索から無関係な結果がいくつか返され、そのうちの一つはApp StoreのAlexaアプリへのリンクだった(?)。音楽のクエリでは、Babygirlの「Seth and Summer Forever」という曲が再生され始めた。うーん

一方、Perplexityは両方のクエリを一発で解決しました。音楽のクエリでは、同じ質問をもう一度しましたが、「Apple Musicを購読していないので、YouTubeでやってみてください」と付け加えたところ、案の定、埋め込みのYouTubeプレーヤーにそのシーンの動画が読み込まれました。iOSの履歴クエリでは、コントロールセンターの主要なデザインを長年にわたり確認するために何度かやり取りしましたが、Perplexityは正しく回答してくれました。最後に、これらの情報を確認するためのリマインダーを作成するように指示したところ、まさにその通りに実行してくれました。

ご存知の通り、ここで話題にしているのは、ランダムな生成AIの雑多な話ではありません。2025年の時点では、あらゆる最新のAIアシスタントが利用可能な様々なツールを用いて、確実かつ迅速に回答できると期待される実用的な質問です。これらのテクノロジーがそもそもどのように開発されたのかという原理に異論があるかもしれませんが、Siriが全くのゴミを生み出している一方で、Perplexityが真に有用な機能を提供していることは否定できないと思います。

しかし、そうは言っても、プラットフォームの制限を考えると、Perplexity の音声アシスタントでできることには限界があります。また、既存の統合にもさらに作業が必要です。

まず、彼らの音声アシスタントは、今日が期限のリマインダーに期限を追加できないことがよくあり(奇妙です)、リマインダーをリマインダーアプリの特定のリストに保存できません。これらの機能は、それらを実現するサードパーティのリマインダークライアントが多数あるため実装可能であることはわかっています。したがって、問題はすべて Perplexity の実装にあります。上で述べたように、Perplexity がこの製品の最初のバージョンでサポートしないことに決めた他の iOS フレームワークもいくつかあります。技術的には、Perplexity は HomeKit と統合してホームアクセサリを制御することもできました(最近私が Siri を使用している数少ないことの 1 つです)が、彼らのアシスタントはこの機能をサポートしていません。さらに、Siri 専用の統合がすべてありますが、Apple が関連する開発者 API を提供していないため、Perplexity はこれを実装できません。ショートカットの実行、タイマーの設定、App Intent の呼び出し、メッセージの送信、メモの作成、デバイス設定の表示と変更など、多くの操作を行えるのは Siri だけです。私に言わせれば、これらはどれも、公正な競争の名の下にAppleにオープン化を強制する政府機関にとって格好の候補です。でも、まあ、私には偏見があるんです。

少し全体像を見てみると、Appleは確かに危うい状況にあるように思います。同社がAIに最適なコンピューターを製造しているという事実は、諸刃の剣です。消費者にとっては素晴らしいことですが、その同じ消費者がAppleデバイスを他社のAIの単なる媒介物として利用し、データ、コンテキスト、そして最も重要な習慣をAppleが制御できないシステムに注ぎ込んでいるのです。何億人もの人々がChatGPTの音声モードで日々生産的な会話をすることに慣れつつあるのであれば、Appleがこの分野に参入するのはあと1年先になり、OpenAIがiPhoneアプリの音声アシスタントにネイティブiOS統合のスイッチを入れたらどうなるでしょうか?

Perplexityの独創的なアプローチに倣えば、OpenAIはここで最も面白いことをするかもしれません。SiriはChatGPTの助けを借りていますが(多くの場合、結果は芳しくありません)、OpenAIはChatGPTアプリにiOSの他の機能を統合させる決定を下すかもしれません。私はそれが実現すると確信しており、Siriの新しい経営陣がこの可能性に備えて計画を立てていることを願っています。

クラブ・マックストーリーズ

追加コンテンツと特典にアクセスする

Club MacStories は 2015 年に設立され、ほぼ 10 年間にわたって毎週独占コンテンツを提供してきました。

毎週、毎月の電子メール ニュースレターから始まったものが、すべての MacStories ファン向けに設計されたメンバーシップ ファミリーに成長しました。

詳細については、こちらおよびクラブの FAQ をご覧ください。

Club MacStories : アプリ、ヒント、自動化ワークフロー、長​​文執筆、MacStories Unwind ポッドキャストへの早期アクセス、定期的な景品など、盛りだくさんの情報を満載した、電子メールと Web 経由の週刊および月刊ニュースレター。

Club MacStories+ : Club MacStories が提供するすべての機能に加え、アクティブな Discord コミュニティ、クラブの過去のカタログ全体を閲覧するための高度な検索機能とカスタム RSS 機能、ボーナス コラム、多数のアプリ割引などが含まれます。

Club Premier : 上記のすべてに加え、早期に、広告なしで、高ビットレートのオーディオで配信される当社の主力ポッドキャストの拡張バージョンである AppStories+ が含まれます。