皆さんはGoogleのGeminiを使ったことはありますか?
ChatGTP派の方々も、話題となったこの動画はご存知の方も多いでしょう。
まるで人間と対面でやりとりしているかのような受け答えで、かなりすごい性能だと感じますが、概要欄に「デモ用にレイテンシを短縮し、Gemini の出力を簡潔にまとめています。」という注意書きがあり、実際には音声処理はできるものの、ウェブカメラなどには対応していないので、このようなやり取りは出来ません。しかし、テキストでのやりとりは回答速度も速く会話もとても自然です。
今回はそんなGeminiについてご紹介します。
Google Geminiとは
Geminiは、Google AIによって開発された大規模言語モデルで、テキスト、動画、音声などの様々な種類のデータを扱うことができます。
最適化された3種類のGemini
Geminiは、3つの種類・サイズに最適化されています。
- Gemini Nano: デバイス上のタスクに最も効率的なモデルで、スマートフォン、特にGoogle Pixel 8 Proでの実行を想定して設計されています¹[5]。外部サーバに接続せずに、効率的なAI処理を必要とするデバイス上のタスク(チャットアプリケーション内での返信の提案、音声からテキスト要約など)が実行できます。
- Gemini Pro: 幅広いタスクに対応する最良のモデルで、GoogleのAIチャットボット、Bardの最新バージョンでの使用を想定して設計されています。応答時間が短縮されるほか、複雑なクエリを理解できる特徴があります。2023年12月13日から、開発者や企業は、Google AI Studio、Google Cloud Vertex AIのGemini APIを介して利用できるようになりました。
現在Geminiウェブアプリの無償版で使用できるモデルです。 - Gemini Ultra: 非常に複雑なタスクに対応する、高性能かつ最大のモデルで、テキスト、画像、音声、動画、コードなどのさまざまな種類の情報を迅速に理解し、それにもとづいて動作するように開発されています。
Gemini Advancedにアップグレードすると利用可能になります。
月額2900円ですが、2 TB の保存容量とその他の Google One の特典が付きます1。
Geminiの機能
Geminiが扱える機能は以下の通りです。2。
- テキスト生成: 文章の生成、翻訳、要約、質問応答など
- 音声処理: 音声認識、音声合成、音声翻訳、会話生成など
- コード生成: コードの生成、翻訳、要約、デバッグなど
- その他: 論理的な推論、クリエイティブな文章表現、複雑なタスクの遂行など
さて、機能面ではChatGTPと大差はないように感じますが、ChatGTPの最新の情報は2022年1月までで、その後の情報は回答出来ないのに対し、GeminiはGoogleによって開発され、検索エンジンとしての役割を果たし、最新の情報も回答することが出来ます。
Geminiの魅力
Geminiの魅力は利便性の高さでしょう。
シンプルで使いやすい UI
GeminiのUIは、シンプルで使いやすいだけでなく、カスタマイズ性の高さも兼ね備えています。初めて使用する人でも迷わず操作でき、ダークモードへの切り替えも「設定」から簡単にできます。
ダークモードの配色が洗練された印象で、個人的にお気に入りです。
エクスポート機能
Geminiは、生成した表をワンクリックでGoogleスプレッドシートにエクスポートできます。

会話履歴もGoogleドキュメントにそのまま保存したり、Gmailの下書きとしてエクスポート可能です。
プラグイン
Geminiはプラグイン機能で、複数のサービスをGeminiの画面上で活用できます。

使い方はとても簡単。
プロンプト入力欄に@を入力するだけで、プラグインが立ち上がります。
また、Geminiとの会話の流れによっては、Geminiが自動的にプラグインを立ち上げてくれるので、そのままYouTubeやGoogle Mapなどが利用できます。

このように、Geminiで直接YouTubeを検索でき、検索結果について質問や会話を広げたりできます。
3つの解答を同時に生成
Geminiは一つの質問に対して三つの異なる回答を提供するため、最適な解答を選ぶことができます。これは他のAIアシスタントにはない特長であり、特に文章生成の際には異なるニュアンスを持つ複数の選択肢を提供することで非常に便利です。
いかがでしたか?Geminiの魅力が伝わったら嬉しいです。
- AIプレミアム 2TB ↩︎
- 以前は画像生成機能がりましたが、現在は休止中です。 ↩︎