G-gen の堂原です。当記事では、生成 AI モデル「Claude 3」を Google Cloud(旧称 GCP)の Vertex AI 上で使う際のコスト・使用方法について紹介します。
はじめに
当記事では、Anthropic 社の生成 AI モデルである「Claude 3」を、Vertex AI の Model Garden より利用する際の以下の点について紹介します。
- コスト
- 使用方法
※ 当記事は Claude 3 を Vertex AI 上で使い始めるまでにフォーカスしているため、Gemini Pro との性能比較は行いません。
前提知識
Claude 3
Claude 3 は Anthropic 社から提供されている生成 AI モデルで、最高レベルの性能を誇ると注目されています。
Claude 3 には以下の 3 つのモデルが含まれており、上のモデルほど性能が高く、代わりにコストが高くなっています。
- Claude 3 Opus
- Claude 3 Sonnet
- Claude 3 Haiku
Google 社の Gemini や OpenAI 社の ChatGPT のように、コンシューマー向けのサービスが提供されており、以下のサイトからコンソールベースで Claude 3 を使うことが可能です。
また、API も提供されている他、Google Cloud や Amazon Web Services (AWS) からも利用することが可能です。
Model Garden
Vertex AI Model Garden は以下の記事で解説されている通り、Google やサードパーティより提供されている 100 以上のモデルを利用することができるサービスです。
Claude 3 についても、2024 年 3 月に Model Garden より利用可能となりました。 2024 年 4 月時点では Claude 3 Sonnet 及び Claude 3 Haiku が GA 、 Claude 3 Opus がパブリックプレビューとして利用可能です。
参考 : Google Cloud Vertex AI に Anthropic の Claude 3 モデルが登場
コスト
コスト
2024 年 4 月時点で、Vertex AI における Claude 3 の利用料金は以下のとおりです。
モデル | 項目 | 料金 |
---|---|---|
Claude 3 Opus | 入力トークン数 | 15 USD / 100 万トークン |
Claude 3 Opus | 出力トークン数 | 75 USD / 100 万トークン |
Claude 3 Sonnet | 入力トークン数 | 3 USD / 100 万トークン |
Claude 3 Sonnet | 出力トークン数 | 15 USD / 100 万トークン |
Claude 3 Haiku | 入力トークン数 | 0.25 USD / 100 万トークン |
Claude 3 Haiku | 出力トークン数 | 1.25 USD / 100 万トークン |
文字数ベースの課金である Gemini Pro とは異なり、Claude 3 はトークンベースとなっています。
サンプル
G-gen のホームページ記載の「代表からのメッセージ」を題材にコストの比較を行いました。
私たちは、AWS専業インテグレーターである株式会社サーバーワークスとマルチクラウドインテグレーションを提供しているBespin Global Inc.のジョイントベンチャーとして設立された Google Cloudインテグレーターです。 サーバーワークスでは2009年からAWSに特化したインテグレーション事業を開始し、おかげさまで東証プライム市場への上場することができました。その一方でクラウド活用においては多様化が進み、様々なクラウドサービスを適切に活用していくことが今後のお客様のITシステムにおける最適解になりそうだと感じ始めています。そのなかでGoogle Cloudはデータ分析やコンテナ技術などユニークな技術を有しており、お客様の多様化するニーズに応えるために重要な役割を果たすと考えています。 私たちは全員Chromebookで業務を行い、Googleの考える新しい世界を身を持って実現していこうと取り組んでいます。Google Cloud や Google Workspaceを中心にクラウドサービスを適切に活用することにより、場所に縛られず、高セキュリティで、アジリティの高いITシステムを実現する。この世界を全てのお客様に提供することがクラウドの醍醐味ですし、その先のDXによるお客様のビジネスの成功にも必ず繋がっていくと確信しています。 Bespin Global Inc.はGoogle Cloudでアジア圏トップクラスの実績とノウハウを保持しています。そのノウハウを活用しつつ、サーバーワークスでのAWSインテグレーション経験を活かし、私たちはGoogle Cloudのプロフェッショナルとしてお客様の「クラウドで、世界を、もっと、はたらきやすく」を実現していきます。
上記はスペースを無視すると 732 文字となっています。
当該文字列が Claude 3 において何トークンになるかは Anthropic から提供されている Client SDK を用いることで確認が可能です。
from anthropic import Anthropic client = Anthropic() message = """私たちは、AWS専業インテグレーターである株式会社サーバーワークスとマルチクラウドインテグレーションを提供しているBespin Global Inc.のジョイントベンチャーとして設立された Google Cloudインテグレーターです。 サーバーワークスでは2009年からAWSに特化したインテグレーション事業を開始し、おかげさまで東証プライム市場への上場することができました。その一方でクラウド活用においては多様化が進み、様々なクラウドサービスを適切に活用していくことが今後のお客様のITシステムにおける最適解になりそうだと感じ始めています。そのなかでGoogle Cloudはデータ分析やコンテナ技術などユニークな技術を有しており、お客様の多様化するニーズに応えるために重要な役割を果たすと考えています。 私たちは全員Chromebookで業務を行い、Googleの考える新しい世界を身を持って実現していこうと取り組んでいます。Google Cloud や Google Workspaceを中心にクラウドサービスを適切に活用することにより、場所に縛られず、高セキュリティで、アジリティの高いITシステムを実現する。この世界を全てのお客様に提供することがクラウドの醍醐味ですし、その先のDXによるお客様のビジネスの成功にも必ず繋がっていくと確信しています。 Bespin Global Inc.はGoogle Cloudでアジア圏トップクラスの実績とノウハウを保持しています。そのノウハウを活用しつつ、サーバーワークスでのAWSインテグレーション経験を活かし、私たちはGoogle Cloudのプロフェッショナルとしてお客様の「クラウドで、世界を、もっと、はたらきやすく」を実現していきます。""" token_count = client.count_tokens(message) print(token_count)
上記処理の結果、上記の文章のトーク数は 640 でした。
仮に同じ文章が入力及び出力されるとした場合、料金は以下の通りです。
モデル | 項目 | 文字数 / トークン数 | 料金 | Gemini Pro 対する倍率 |
---|---|---|---|---|
Gemini Pro | 入力文字数 | 732 | 0.0000915 USD | - |
Gemini Pro | 出力文字数 | 732 | 0.0002745 USD | - |
Claude 3 Sonnet | 入力トークン数 | 640 | 0.00192 USD | 20.98 倍 |
Claude 3 Sonnet | 出力トークン数 | 640 | 0.0096 USD | 34.97 倍 |
Claude 3 Haiku | 入力トークン数 | 640 | 0.00016 USD | 1.75 倍 |
Claude 3 Haiku | 出力トークン数 | 640 | 0.0008 USD | 2.91 倍 |
※ 2024 年 4 月時点の情報をベースとしたものであり、最新状況は公式サイトを確認ください。
いずれも上記の文章量程度だとほぼ料金は発生しませんが、Claude 3 は Gemini に比べるとコストは高いことがわかります。 そのため、現在の Gemini Pro と同じ感覚で使い続けると思わぬ課金が発生する可能性があるため注意が必要です。
使用方法
Model Garden から API を有効にする
Vertex AI で Claude 3 を用いるには、Model Garden にて Claude 3 API を有効化する必要があります。 Claude 3 の各種モデルは Model Garden の基盤モデルに存在しています。
モデルの「詳細を表示」より詳細画面に進み、「有効にする」を押すことで設定画面に進むことが出来ます。 利用にあたってはいくつかの情報を入力する必要があります。 ただ、入力後に審査を待つなどはなく、すぐに利用することが出来ます。
有効化後、「ノートブックを開く」を押すことで Colab Enterprise を用いてサンプルコードを実行することが出来ます。
Anthropic's Vertex SDK
Python でコーディングをする場合 Anthropic's Vertex SDK を用いることが出来ます。 先述したサンプルコードを確認することで基本的な使い方を学べます。
サンプルコードは全て英語となっていますが、日本語も対応しています。
from anthropic import AnthropicVertex MODEL = "claude-3-sonnet@20240229" REGION = "us-central1" PROJECT_ID = ${プロジェクト ID を記入} client = AnthropicVertex(region=REGION, project_id=PROJECT_ID) message = client.messages.create( max_tokens=1024, messages=[ { "role": "user", "content": "貴方は料理研究家です。家に人参が余っていて消費に困っています。美味しく大量の人参を処理できるレシピを教えてください。", } ], model=MODEL, ) print(dict(message)["content"][0].text)
上記コードを実行すると、以下のような出力となります。
人参をたくさん消費できる美味しいレシピをいくつかご紹介します。 1. 人参ケーキ しっとりとした人参ケーキは、おやつにも食事にも最適です。人参のほかにくるみやレーズンを加えると風味が更に良くなります。 2. 人参スープ クリーミーな人参スープは、寒い季節に最高の一品です。生クリームを加えてリッチな味わいに。パンとの相性も抜群です。 3. 人参グラタン 人参をスライスし、ホワイトソースとチーズをかけて焼くだけのシンプルなグラタン。副菜として優秀な一品です。 4. 人参フライ 人参を棒状に切り、卵と小麦粉につけてカラリと揚げれば、おつまみやおやつにぴったりの人参フライに。 5. 人参ジャム 人参を細かく刻んで、砂糖とレモン汁で煮詰めれば、パンに塗って食べられる人参ジャムが作れます。 6. 人参リゾット 人参をみじん切りにし、チーズと白ワインを加えて炊き上げれば、濃厚でリッチな人参リゾットに。 こうしたレシピを試していただければ、たくさんの人参を美味しく使い切れるはずです。色々アレンジを加えて楽しんでみてください。
また、公式のコードサンプルに記載されている Function Calling も実行することが出来ました。 Google Cloud サービスの各種 API と組み合わせていくことで、Google Cloud で Claude 3 を使うメリットがでてくると考えられます。
堂原 竜希(記事一覧)
クラウドソリューション部データアナリティクス課。2023年4月より、G-genにジョイン。
Google Cloud Partner Top Engineer 2023, 2024に選出 (2024年はRookie of the yearにも選出)。休みの日はだいたいゲームをしているか、時々自転車で遠出をしています。
Follow @ryu_dohara