G-gen の米川です。Google が開発した大規模言語モデル Gemini は、その高い性能と多岐にわたるプロダクト展開で注目を集めています。当記事では、Gemini プロダクトの全貌を網羅的に解説します。
- はじめに
- 生成 AI 基盤モデル としての Gemini
- Gemini プロダクト
- 導入すべき Gemini プロダクト
- ビジネス導入における注意点
- 導入事例
はじめに
Gemini は、Google が開発した生成 AI 基盤モデル、およびそれを利用した生成 AI プロダクト群です。Gemini を用いたプロダクトには、以下があります。
プロダクト名 | 概要 |
---|---|
Gemini アプリ | ブラウザやモバイルアプリから利用な生成 AI チャットアプリ |
Gemini for Google Workspace | Google Workspace に組み込まれた業務補助 AI |
Gemini for Google Cloud | Google Cloud 上の開発を効率化するツール群 |
Generative AI on Vertex AI | Google Cloud の Vertex AI API 経由で Gemini モデルを呼び出し |
Gemini API | Google AI Studio の API 経由で Gemini モデルを呼び出し |
それぞれに異なる機能や特徴があり、ビジネスシーンに合わせて最適なプロダクトを選択できます。当記事ではこれらを Gemini プロダクトと呼称して、それぞれ紹介します。
生成 AI 基盤モデル としての Gemini
モデルとは
まず、機械学習におけるモデルとは、大量のデータからパターンやルールを学習し、特定のタスクを実行できるようになった仕組みのことを指します。
例えば画像認識モデルは、たくさんの猫の画像データから、“猫らしさ” を学習することで、人が教えることなく初めて見る猫の画像でも「これは猫だ」と認識できます。
Gemini も機械学習モデルの1つです。Gemini はマルチモーダルな生成 AI モデルです。マルチモーダルなモデルとは、テキスト、画像、音声、動画など、複数の種類の情報を理解し、コンテンツを生成することができることを指します。
当記事で紹介する Gemini プロダクトは、この Gemini モデルを用いています。
Gemini のモデルファミリー
Gemini のモデルには複数の種類があり、それぞれ得意なタスクや能力が異なります。Gemini アプリや Gemini for Google Workspace に組み込まれているモデルや、Google Cloud から API 経由で利用できるモデルには、以下のようなものがあります。
Gemini Ultra
Gemini ファミリーの中でも最も高性能なモデルです。複雑な推論や高度なコーディングなど、専門的な知識を必要とするタスクに優れています。
Gemini Pro
幅広いタスクに対応できる汎用性の高いモデルです。文章生成、翻訳、質疑応答など、様々な用途で利用できます。
Gemini Flash
高速な応答速度を誇るモデルです。レイテンシが重要なアプリケーションに最適です。
Gemini Nano
軽量なモデルです。スマートフォンなどのデバイス上で動作するように設計されており、限られた計算資源でも効率的に動作します。
これらのモデルは、Gemini プロダクトに組み込まれています。私たちユーザーから明示的にモデルの種類が選択できるプロダクトもあれば、Google が最適なモデルを選択して組み込み済みのこともあります。
Gemini モデルのバージョン
上記のモデルに加えて、Gemini にはバージョンという概念があります。バージョンは、モデルの改善や機能追加が行われるたびに更新されていきます。
例えば2024年12月現在、Gemini Pro の一般利用可能なバージョンは Gemini 1.0 Pro と Gemini 1.5 Pro の2つです。
1.0 から 1.5 へのアップデートにより、コンテキストウィンドウ(一度に処理できる情報量、単位はトークン)がより大きくなったり、推論能力、コード生成能力が向上しました。
2024年12月には、Gemini 2.0 が発表されました。2024年12月現在、Google Cloud(Vertex AI)等で Gemini 2.0 Flash の試験運用版が利用可能であるほか、Gemini アプリでも 2.0 の試験運用版が既に利用可能になっています。
Gemini プロダクト
Gemini アプリ
Gemini アプリとは
Gemini アプリ(Gemini app)とは、以下の2つのチャットプロダクトの総称です。
- Gemini ウェブアプリ(
gemini.google.com
のこと。かつて Bard と呼ばれていた Web ブラウザ向け生成 AI チャット) - スマートフォン向け生成 AI チャットアプリ(Android および iOS 向け)
いずれも、Google の生成 AI 基盤モデルである Gemini を基盤としたチャットアプリケーションで、Google アカウントさえあれば無料で利用できます。
- 参考 : gemini.google.com
- 参考 : Gemini アプリ ヘルプ
データ保護
Gemini アプリは、Google アカウントがあれば誰でも無料で利用できます。ただし、無償の Google アカウントで Gemini アプリを使う場合、入力したデータは Google によってサービス改善のために利用される場合があります。
一方で以下のエディションの Google Workspace で管理されたアカウントであれば「エンタープライズグレードのデータ保護」が適用されます。この場合、データは Google によってサービス改善のために利用されることはなく、人間のレビュワーによって見られることもありません。
- Business Starter / Business Standard / Business Plus
- Enterprise Starter / Enterprise Standard / Enterprise Plus
- Essentials
- Enterprise Essentials / Enterprise Essentials Plus
- Frontline Starter / Frontline Standard
- Nonprofits
さらに Google Workspace では、Gemini アプリを利用できるユーザーを限定したり、逆に組織全体で利用可能にするなど、利用可否のコントロールも可能です。
Gemini Advanced
Gemini Advanced は、様々な追加機能を含む、Gemini の有償版です。Gemini Advanced では、Gemini アプリで最新版の Gemini モデルを選択できるようになったり、情報レポートを簡単に作成できる Deep Research、長文テキストやファイルの分析、Gmail や Google ドキュメントとのシームレスな連携などが利用可能です。
個人の場合、個人向けの有償 Google サービスである Google One AI プレミアムプランに加入することで利用可能になります。Google Workspace の場合、Gemini for Google Workspace アドオンを購入すると利用可能になります。
- 参考 : Gemini Advanced
- 参考 : Gemini Advanced にアップグレードする
Gems
Gemini ウェブアプリの拡張機能として、Gems があります。Gems は Gemini ウェブアプリをカスタマイズするための機能です。2024年8月28日に、Gemini Advanced ユーザー向けに公開されました。
例えば、YouTube 動画の要約を表示するのに特化した Gems や、画像からテキストを抽出することに特化した Gems などを作成することができます。
詳細は以下の記事を参考にしてください。
Gemini for Google Workspace
Gemini for Google Workspace とは
Gemini for Google Workspace とは、Google Workspace にアドオンして利用する AI アシスタント機能です。利用には、Gemini for Google Workspace アドオンの追加購入が必要です。
Gemini の強力な AI 技術が Gmail、Google ドキュメント、Google スライド、Google スプレッドシートなど、普段使い慣れた Google Workspace アプリに統合されることで、業務が効率化されます。
また Gemini for Google Workspace ではエンタープライズグレードのデータ保護が適用されており、データは Google によってサービス改善のために利用されることはなく、人間のレビュワーによって見られることもないため、安心して業務に利用することができます。
サイドパネル
Gemini for Google Workspace では、サイドパネルを通して Gemini が利用できます。
Gemini が統合されている Google Workspace アプリ(Google ドキュメント、Google スプレッドシートなど)では、Gemini アイコンが表示されます。例えば Google ドキュメントの場合、画面右上に Gemini アイコンがあります。このアイコンをクリックすると、サイドパネルにプロンプト入力画面が表示され、Gemini に指示を出すことができます。Gemini は指示を受け取ると、数秒でコンテンツを生成してくれます。
Gemini for Google Workspace アドオン
Gemini for Google Workspace の利用には、Gemini for Google Workspace アドオンの追加購入が必要です。Gemini for Google Workspace アドオンは Gemini アドオンとも呼ばれ、以下の種類があります(価格は2024年12月現在)。
Gemini for GWS エディション |
料金(ユーザー/月) | 主な機能 | ユースケース |
---|---|---|---|
Gemini Business | 年間契約 : 2,260円 フレキシブル : 2,712円 |
- Gmail、ドキュメント、スプレッドシート、スライドでのAI支援 - 企業向け Gemini アプリの利用 |
- 情報収集、ブレスト、コンテンツ作成、デザイン作成など日常的な業務効率化 - 簡単なデータ分析 |
Gemini Enterprise | 年間契約 : 3,400円 フレキシブル : 4,080円 |
- Gemini Business の全機能に加え、高度な機能 - Meet の議事録作成、リアルタイム翻訳 - Chat の会話要約 |
- 高度な業務効率化 - 大規模なデータ分析と可視化 - 専門的なレポート作成 - 複雑なタスクの自動化 - 組織全体の生産性向上 |
AI Security | 年間契約 : 1,356円 フレキシブル : 1,130円 |
- AI を活用したセキュリティ強化(機密保持のための自動ラベル付け)に限定 | - サイバーセキュリティ脅威の検知と防御 - フィッシングメールの検出 - マルウェアの検知 - 不正アクセスの防止 - データ漏洩の防止 |
AI Meetings and Messaging | 年間契約 : 1,356円 フレキシブル : 1,130円 |
- AI を活用した会議とメッセージングの効率化に限定 | - 会議の自動要約 - 会議中のリアルタイム翻訳 - 会議後のアクションアイテムの自動生成 - チャットの要約・自動要約 |
アドオンの違いや詳細については、以下を参考にしてください。
Gemini for Google Cloud
Gemini for Google Cloud とは
Gemini for Google Cloud は、Google Cloud 上での開発に役に立つ、開発者向けの AI アシスタント機能です。ソースコードの自動生成、データ分析の効率化、セキュリティの強化などが可能です。
アプリケーション開発者はもちろん、データサイエンティストやビジネスアナリスト、セキュリティ担当者など、様々な Google Cloud ユーザーのオペレーション・開発を支援します。
機能一覧
Gemini for Google Cloud には以下の機能が含まれています。
機能名 | 概要 |
---|---|
Gemini in BigQuery | データ分析、可視化、SQL や Python のコード生成などを支援 |
Gemini Code Assist | IDE と連携して利用。ソースコード開発、デプロイ、トラブルシューティングを支援 |
Gemini in Colab Enterprise | Colab EnterpriseノートブックでのPythonコード生成を支援 |
Gemini in Databases | データベース管理、セキュリティ向上などを支援 |
Gemini in Looker | Looker(Google Cloud コア)や Looker Studio Pro でデータ可視化や解釈を支援 |
Gemini in Security Command Center | セキュリティに関する検索クエリ生成、ケース解釈、攻撃パス把握を支援 |
以下の当社記事も参考にしてください。
料金
Gemini for Google Cloud を利用するには、Gemini Code Assist サブスクリプションを購入して、ユーザーに割り当てます。ライセンスを割り当てられたユーザーは、Gemini in BigQuery、Gemini in Databases、Gemini in Colab Enterprise などの機能が利用可能になります。
Gemini Code Assist サブスクリプションには Standard と Enterprise の2エディションがあり、どちらを選ぶかによって付随する機能が異なります。以下は、2024年12月現在の価格です。最新の価格は、必ず公式ドキュメントを参照してください。
エディション | 料金(月額) | 料金(12ヶ月コミット) |
---|---|---|
Standard | $22.80 / 月 / 人 | $19.0 / 月 / 人 |
Enterprise | $54.0 / 月 / 人 | $45.0 / 月 / 人 |
また、Gemini in BigQuery のみ利用したい場合、BigQuery Editions の Enterprise Plus エディションを有効化することで利用可能になります。
こちらの場合、Gemini Code Assist をサブスクライブする必要はありません。またこちらの利用方法の場合、SQL や Python のコード生成、可視化補助など Gemini Code Assist に含まれる Gemini in BigQuery のすべての機能に加えて、パーティショニングとクラスタリングのレコメンデーションやマテリアライズド・ビューのレコメンデーションなど、追加の生成 AI 機能も利用可能になります。
Generative AI on Vertex AI
Generative AI on Vertex AI とは
Generative AI on Vertex AI とは、Google Cloud の AI/ML プラットフォームプロダクトである Vertex AI の REST API を通して、Gemini などの生成 AI モデルを利用する手法のことです。アプリケーション開発者は Vertex AI API を通して Gemini モデルにプロンプトを入力し、レスポンスを得ることができます。
これにより、Gemini を自社開発のアプリケーションに組み込むことができます。
Vertex AI API は、HTTPS での呼び出しや、Python や Java などの各プログラミング言語用の公式クライアントライブラリ、また BigQuery ML などから利用できます。
Google Cloud プロダクトですので、認証・認可は IAM によって管理されており、また課金も Google Cloud 利用料として請求されます。
データの保護
Vertex AI API 経由で Gemini に入力されるプロンプトやチューニングデータは保護されており、データが Google によってサービス改善に利用されることはありません。
- 参考 : 生成 AI とデータ ガバナンス
- 参考 : Gemini API に関するよくある質問
ユースケース
以下の当社記事では、Vertex AI API 経由で Gemini を呼び出すことで生成 AI アプリケーションを開発した事例を紹介しています。
その他のプロダクト
Google Cloud には Vertex AI API 経由での Gemini 呼び出しのほか、Gemini を利用した各種プロダクトがあります。
Vertex AI Agent Builder は Vertex AI の派生プロダクトの1つです。このプロダクトの Vertex AI Search 機能により、RAG 構成(生成 AI により生成されたコンテンツをデータにより根拠づけするアーキテクチャ)を簡単に構成したり、Google クオリティの企業データ検索(エンタープライズサーチ)を容易に構築できます。
以下の記事も参照してください。
料金
Generative AI on Vertex AI での Gemini 利用の料金は、入力したデータと出力したデータのボリュームに応じた従量課金です。固定料金は発生しません。
以下は、料金単価の一部抜粋です。情報は2024年12月現在のものですので、必ず最新の公式ドキュメントをご参照ください。
モデル | タイプ | 単価(入力トークンが128K以下の場合) |
---|---|---|
Gemini 1.5 Flash | テキスト入力 | $0.00001875 / 1,000 文字 |
Gemini 1.5 Flash | 画像入力 | $0.00002 / 画像 |
Gemini 1.5 Flash | テキスト出力 | $0.000075 / 1,000 文字 |
なお、一般的な生成 AI 基盤モデルサービスでは入力データの量をトークンという単位で計測し、トークン単位での課金となります。一方の Gemini では、入力文字数や画像の枚数などで計測するため見積もりが容易なほか、特に日本語においてはトークン数での計測よりも安価になる傾向にあります。
Gemini API
Gemini API とは
Gemini API は、個人利用や小規模デベロッパー向けの、API 経由で Gemini モデルを呼び出し可能なプロダクトです。Google Cloud とは独立しており、単一サービスとして提供されています。Gemini API は利用規約に従い、商用利用することができます。
Gemini API は Google AI Studio という AI 開発用プラットフォーム経由で提供されており、Google Cloud の Generative AI on Vertex AI と同じく REST API やクライアントライブラリ経由で利用できます。
Gemini API には無料枠があり、一定のレート制限のもと利用可能です。有償版は、リクエストや生成コンテンツのボリュームに基づいた従量課金です。
Google Cloud とは独立しているため、認証は IAM ではなく、Google AI Studio から発行する API キーで行われます。
- 参考 : Gemini API を使ってみる
- 参考 : Google AI Studio
データの保護
Gemini API を無料枠で利用する場合、入力したデータや生成されたコンテンツは、Google のサービス改善に利用されたり、人間のレビュワーに見られる可能性があります。Google はこれを利用規約に明記しており、機密情報や個人情報を送信しないことを求めています。
Gemini API の有償版を利用する場合はデータが保護され、サービス改善に利用されたり、人間のレビュワーに見られることはありません。
- 参考 : Gemini API 追加利用規約
料金
Google AI Studio 経由での Gemini API は、入力したデータと出力したデータのボリュームに応じた従量課金です。ただし、Google Cloud の Generative AI on Vertex AI で利用する場合とは異なる料金設定がされており、文字数や画像の枚数ではなく、トークン量に応じた課金です。
- 参考 : 料金モデル
導入すべき Gemini プロダクト
生成 AI で社内業務を効率化したい場合
社内業務を効率化したい場合は、Gemini アプリや Gemini for Google Workspace の導入を検討します。
これらのプロダクトにより、以下のような効果が期待できます。
- 個人やチームの生産性向上
- メール、ドキュメント作成、プレゼンテーション作成、情報収集などを効率化
ほとんどの Google Workspace のエディションでは Gemini アプリがデータ保護付きで利用可能になっており、gemini.google.com にアクセスすることですぐに業務利用することができます。
自社データを効率的に検索したり生成 AI に質問に答えさせたい場合
自社の大量のドキュメント類の中から必要なデータを効率的に検索したり、生成 AI に要約させたい場合、Google Cloud プロダクトの1つであるVertex AI Agent Builder(Vertex AI Search)を使います。
蓄積された大量の自社データをもとに生成 AI にコンテンツを生成させたり、日本語での質問に答えさせたりすることもできます。
自社の新サービスに生成 AI を組み込む場合
自社のアプリに生成 AI を組み込んだり、顧客へ提供するサービスに生成 AI を活用したい場合、Generative AI on Vertex AI を使います。
自社アプリから Vertex AI 経由で Gemini を呼び出し、プロンプトを入力して、生成結果を得ることができます。システム開発の知識さえあれば、機械学習の知識がなくとも、Vertex AI や Vertex AI Agent Builder(Vertex AI Search)の API 呼び出しにより高品質な検索や RAG を実現することができます。
システム開発を効率化したい場合
システム開発を効率化したい場合、コード生成補助機能などを備えた Gemini for Google Cloud を使います。
Gemini for Google Cloud の1機能である Gemini Code Assist は、月額サブスクリプション制であり、高度な開発補助機能を備えています。
ビジネス導入における注意点
生成 AI のビジネス適用
OpenAI 社が2022年11月に生成 AI チャットボット Chat GPT を公開してから、瞬く間に生成 AI ブームが巻き起こりました。2023年には多くの企業が、生成 AI のビジネス利用を試みる PoC(Proof of Concept)を行い、2024年には実際に業務で利用する企業も増えました。
生成 AI ブームに乗り遅れまいと、2025年も多くの企業が生成 AI の PoC や、業務への適用を試みるものと考えられます。しかし、生成 AI は銀の弾丸(万能薬)ではありません。以下に説明する性質を適切に理解し、ビジネスに適用することを検討してください。
生成 AI は確率エンジンであることを理解する
Gemini を含む生成 AI は、大量のデータから学習し、確率的に最もそれらしい回答を生成する「確率エンジン」です。そのため、完璧な回答を返すとは限りませんし、毎回同じコンテンツが生成されるとも限りません。
この点を理解した上で、Gemini を活用する業務とそうでない業務を見極める必要があります。これを理解していないと、精度向上に報われない労力を注ぎ続けることになってしまいます。
生成 AI に向いてる業務 / 向いてない業務
向いている業務
前述の性質から、生成 AI は以下のような業務領域を得意としています。
創造的な作業
新しいアイデアの創出、文章やコードの作成、デザイン、翻訳など
情報収集、分析
大量のデータの要約、トレンド分析、レポート作成など
コミュニケーション
高度な正確性が求められない顧客対応、社内コミュニケーション、教育など
反復的な作業
データ入力、議事録作成、単純な質問への回答など
向いていない業務
反対に、以下のような業務には向いていません。
高度な判断や意思決定
専門知識や倫理観が求められる業務
正確性が求められる業務
医療診断、金融取引、法律相談など
セキュリティ上、高度にセンシティブな業務
重要な個人情報や機密情報を含み、非常に高度なセキュリティ上の考慮が必要な業務
セキュリティ
データ保護
生成 AI の業務利用では、入力したプロンプトや生成されたコンテンツが、生成 AI サービス提供事業者によってどう扱われるかに十分注意する必要があります。
多くの場合、無償の生成 AI プロダクトでは、入出力データが事業者のサービス改善のために利用されます。これを防ぐには、有償版を購入し、オプトアウトと呼ばれる「事業者によって入出力データがサービス改善に用いられないようにする」オプションを有効化する必要があります。
Gemini の場合、無償版の Gemini アプリや無償版の Gemini API(Google AI Studio)では、入出力データがサービス改善に利用されることが利用規約に明記されています。
一方で、Gemini for Google Workspace や Generative AI on Vertex AI(Google Cloud)では、入出力データにエンタープライズグレードのデータ保護が適用され、サービス改善などには利用されません。
この点をよく理解し、利用規約などを確認してください。
生成 AI アプリへの攻撃
特に自社アプリに生成 AI を組み込んで一般ユーザー向けに公開する場合、生成 AI の脆弱性を突く攻撃手法であるプロンプトインジェクションなどに十分注意する必要があります。
プロンプトインジェクションは、生成 AI に悪意を持って工夫したプロンプトを投入し、本来ユーザーがしるべきではない情報等を答えさせる手法です。これにより、機密情報やシステムの内部構造が漏洩するリスクがあります。
「アプリケーション内部構造におけるデータのアクセス権限設計」「システム側プロンプトの工夫」「レスポンスへのフィルタ設定」「生成 AI が担当する機能範囲の調整」など、適切な対処を行うことでリスクを低減することができます。
不適切な生成コンテンツ
生成 AI は確率論的な仕組みであるため、不適切な生成コンテンツが生成される可能性を否定できません。特に外部に公開する可能性のある生成 AI を組み込んだ自社アプリでは、政治、宗教、性的なコンテンツ、差別的な発言、ブランドイメージを毀損するようなコンテンツなどが生成されるリスクを低減する必要があります。
システムプロンプトを工夫することでそういった生成を抑止したり、Gemini では安全フィルタによってそのようなコンテンツが返答されることを防ぐことができます。
- 参考 : 安全に関するシステム指示
- 参考 : 安全フィルタを構成する
導入事例
業種や業態を問わず、様々な企業が Gemini を導入し、業務効率化や顧客満足度を向上しています。具体的な導入事例は、以下の記事を参考にしてください。
G-gen 社の提供する「Generative AI 活用支援ソリューション」では、Google Cloud のスペシャリストエンジニアが、貴社の Gemini 活用を支援します。開発を内製化する場合と、外注する場合の両方で活用いただけます。
米川 佐満人 (記事一覧)
プラットフォームエンジニアリング本部 営業部 営業2課 兼 粉もん事業所
2022年7月にG-genにジョイン。
モットーは「クラウドで、関西を、もっと働きやすく」
課題解決に向けた提案&お客様との伴走プロジェクトにモチベーションを感じる日々。現在 Google Cloud 全資格コンプリート目指して奮闘中(あと1つ)。ですが、本職は 光の戦士@FFXIV です。