Cloud Run worker poolsを徹底解説!

G-gen の佐々木です。当記事では、Google Cloud のサーバーレス コンテナサービスである Cloud Run の機能の一つ、Cloud Run worker pools について解説します。 注意点 Cloud Run worker pools とは 概要 ユースケース Cloud Run services と共通の仕様 リ…

Cloud Run Worker Poolsを使ってみた

G-gen の佐々木です。当記事では、Cloud Run の新しい実行モデルである Cloud Run Worker Pools を、実際に使ってみます。 注意 : 当記事の内容について はじめに Cloud Run Worker Pools とは 想定ユースケース 当記事の構成 Pub/Sub の作成 Cloud Run Work…

AlloyDB for PostgreSQLの停止・起動・再起動オペレーションを解説

G-gen の佐々木です。当記事では AlloyDB for PostgreSQL の停止・起動および再起動オペレーションについて解説します。 前提知識 AlloyDB for PostgreSQL とは AlloyDB の料金の基本 インスタンスの停止・起動 停止・起動の仕様 Activation policy 停止・起…

Pub/SubのSingle Message Transforms (SMTs) を使ってみた

G-gen の佐々木です。当記事では Pub/Sub の Single Message Transforms(SMTs)機能によるメッセージの変換処理について解説します。 前提知識 : Pub/Sub とは Single Message Transforms(SMTs)とは SMTs の基本 SMTs のユースケース UDF による定義 SMTs…

Vertex AI Pipelinesを解説

G-gen の佐々木です。当記事では Google Cloud の機械学習ワークフローオーケストレーションツールである Vertex AI Pipelines を解説します。 MLOps と ML パイプラインの必要性 Vertex AI Pipelines パイプラインの定義 2種類のインターフェース Kubeflow …

従来のApplication Load Balancerを新しいApplication Load Balancerに移行する

G-gen の佐々木です。当記事では、従来の Application Load Balancer(classic Application Load Balancer)リソースを、新しい Application Load Balancer であるグローバル外部 Application Load Balancer に安全に移行する方法を解説します。 前提知識 Ap…

Cloud RunでGemma 3を動かしてみた

G-gen の佐々木です。当記事では、Cloud Run における GPU 利用のユースケースとして、オープン LLM である Gemma 3 を Cloud Run のサービスにデプロイしてみます。 前提知識 Cloud Run サービスの概要 Cloud Run における GPU 利用 Gemma 3 Cloud Run にオ…

GKEの生成AIワークロードを支援する新機能を紹介(Google Cloud Next '25速報)

G-gen の佐々木です。当記事では Google Cloud Next '25 で発表された Google Kubernetes Engine(GKE)における最新の生成 AI 関連機能を紹介します。 概要 GKE における AI 推論 ワークロード GKE Inference Quickstart GKE Inference Gateway GKE TPU ser…

GKE Inference Quickstartを使用して生成AIモデルの推論サーバーをデプロイしてみた

G-gen の佐々木です。当記事では GKE Inference Quickstart を使用し、Google Kubernetes Engine(GKE)で Google Cloud のベストプラクティスに沿った生成 AI ワークロードのデプロイを試してみます。 GKE Inference Quickstart とは 事前準備 コマンド実行…

Cloud Runから内部ネットワーク経由で別プロジェクトのCloud Runを呼び出す

G-gen の佐々木です。当記事では、Private Service Connect を使用して、Cloud Run サービスから別のプロジェクトにある Cloud Run サービスを内部ネットワーク経由で呼び出す方法を解説します。 Cloud Run 同士のプライベートアクセス 呼び出し元アクセス制…

Cloud Runでロードバランサを使用せずIdentity-Aware Proxy(IAP)を構成する

G-gen の佐々木です。当記事では、Cloud Run のサービスに直接 Identity-Aware Proxy(IAP)を構成する方法について解説します。 前提知識 Cloud Run Identity-Aware Proxy(IAP) Cloud Run を IAP でアクセス制御する方法 ロードバランサを使用する方法 概…

Cloud Runの呼び出し元IAMチェックを無効化してサービスを公開する

G-gen の佐々木です。当記事では Cloud Run における呼び出し元 IAM チェックの無効化について解説します。 前提知識 Cloud Run について Cloud Run 呼び出し元の IAM 認証 呼び出し元 IAM チェックの無効化 概要 ユースケース 手順 必要な IAM 権限 コンソ…

BigQueryでSpanner外部データセットを使用する

G-gen の佐々木です。当記事では、BigQuery の外部データセットとして Spanner データベース内のテーブルを参照する方法を解説します。 前提知識 BigQuery Spanner BigQuery と Spanner の連携 2つの連携方法 連携クエリとは 外部データセットとは 連携クエ…

Spannerの階層型ストレージを解説

G-gen の佐々木です。当記事では Spanner の階層型ストレージ(tiered storage)機能について解説します。 Spanner とは 階層型ストレージについて 概要 ストレージの選択 ローカリティグループ 階層型ストレージを使用する方法 ローカリティグループの作成 …

入門!Cloud Runのススメ

G-gen の佐々木です。当記事では、Google Cloud のサーバーレス コンテナコンピューティング サービスである Cloud Run で簡単なサービスを作成する方法を解説します。また、サービスの基本的な設定項目や、よく使用される機能や構成についても解説していき…

新規プロジェクト作成時のプロジェクトID重複に関する仕様

G-gen の佐々木です。当記事では、Google Cloud で新規プロジェクトを作成する際の注意点として、プロジェクト ID 重複に関する仕様について解説します。 プロジェクトの識別情報について 新規プロジェクト作成時に ID が重複していた場合の動作 コンソール…

Cloud Runの手動スケーリングを解説

G-gen の佐々木です。当記事では、Cloud Run の手動スケーリング機能について解説します。 はじめに Cloud Run とは 注意事項 手動スケーリングの仕様 手動スケーリングとは サービスとリビジョンの設定 トラフィック分割への影響 サービスの無効化 手動スケ…

SpannerのManaged autoscalerを解説

G-gen の佐々木です。当記事では Spanner の組み込みのオートスケーリング機能である Managed autoscaler を紹介します。 前提知識 Spanner とは インスタンス、ノード、処理ユニット オープンソースのオートスケーリングツール Managed autoscaler とは ス…

Cloud RunからSecret Managerのシークレットにアクセスする

G-gen の佐々木です。当記事では Cloud Run から Secret Manager に格納したシークレットを利用する方法を解説します。 事前知識 Cloud Run Secret Manager Cloud Run で Secret Manager を利用する ユースケース 2つの方法 事前準備 シェル変数の設定 シー…

WARNING: Property validation for compute/region was skipped.

G-gen の佐々木です。当記事では、gcloud config set コマンドでデフォルトのリージョンやゾーンを設定する際に表示される警告メッセージについて解説します。 はじめに デフォルトのリージョン・ゾーン設定時の警告メッセージ 警告メッセージの意味 対処法 …

Kubernetes History Inspectorを使ってみた

G-gen の佐々木です。当記事では Kubernetes のためのオープンソースのログビューアである、Kubernetes History Inspector を使用してみます。 Kubernetes History Inspector とは KHI に必要な IAM 権限 クエリの実行 KHI ファイルのインポート 事前準備 当…

BigQuery MLを徹底解説!

G-gen の佐々木です。当記事では BigQuery 上で機械学習モデルを作成、評価、実行するための機能である BigQuery ML について解説します。 概要 BigQuery とは BigQuery ML とは BigQuery ML の使用方法 ユーザーインターフェース BigQuery Editions クエリ…

Compute EngineインスタンスにローカルKubernetesクラスタを構築する(Minikube)

G-gen の佐々木です。当記事ではコンテナ オーケストレーション ツールである Kubenretes の学習用のため、Minikube を使って Compute Engine(Google Compute Engine、GCE)仮想マシン上にローカル Kubernetes クラスタを構築していきます。 はじめに 当記…

Direct VPC Egress経由でCloud NATを利用するとCloud NATのモニタリング指標が記録されない

G-gen の佐々木です。当記事では、Direct VPC Egress を経由して Cloud NAT を利用する際の注意点として、Cloud NAT のモニタリング指標が Cloud Monitoring に記録されない仕様について解説します。 ※当記事に記載されているモニタリングに関する仕様は執筆…

新しく追加されたCloud Run実行用の事前定義ロールを解説

2024年12月17日より、Cloud Run を呼び出すための権限を持つ3つの事前定義ロールが新たに利用可能となりました。当記事ではロールの詳細や、従来から利用されてきた事前定義ロールとの違いなどを解説します。 はじめに 新たな事前定義ロール Cloud Run サー…

[Action Required] Ensure read access on container images deployed to Cloud Run

2024年11月25日、Google Cloud から管理者宛てに「[Action Required] Ensure read access on container images deployed to Cloud Run」というタイトルのメール通知がありました。当記事では、通知の内容とユーザー側で必要なアクション、影響範囲の確認方法…

DNSエンドポイントを使用してGitHub ActionsからGKEクラスタにリソースをデプロイする

G-gen の佐々木です。当記事では、GitHub Actions で GKE クラスタにリソースをデプロイする際に、DNS エンドポイントを使用する方法を解説します。 DNS エンドポイントとは GitHub Actions を使用した GKE へのデプロイ 従来の方法 DNS エンドポイントを使…

DNSベースのエンドポイントを使用してGKEのコントロールプレーンに接続する

G-gen の佐々木です。当記事では、GKE のコントロールプレーンにアクセスするための新しい方法として、DNS ベースのエンドポイント(DNS エンドポイント)を紹介します。 はじめに GKE におけるコントロールプレーンへのアクセス方法 従来の方法 パブリック…

Compute EngineインスタンスにPostgreSQLサーバを構築する

G-gen の佐々木です。当記事では、Google Cloud の仮想マシンサービスである Compute Engine(Google Compute Engine: GCE)に PostgreSQL サーバを構築していきます。 当記事の目的 Compute Engine インスタンスの作成 作業の概要 シェル変数の設定 VPC・サ…

Cloud Runのマルチリージョンサービスを解説

G-gen の佐々木です。当記事では Cloud Run のマルチリージョンサービスについて解説します。 マルチリージョンサービスとは メリット サービスのレイテンシ低下 リージョン障害への耐性 各リージョンへの一括デプロイ 注意点 利用料金 構成は全リージョン一…

Cloud RunやCloud Run functionsでグローバル変数を活用してパフォーマンスを向上する

G-gen の佐々木です。当記事では、Cloud Run や Cloud Run functions(旧称:Cloud Functions)のパフォーマンス向上のコツとして、グローバル変数の活用方法を紹介します。 サーバーレスにおけるコールドスタート グローバル変数によるリクエスト間のオブジ…

Cloud RunのDeterministic URLを解説

G-gen の佐々木です。当記事では 2024年9月より Cloud Run で利用可能となった Deterministic URL について解説します。 Deterministic URLs とは Deterministic URL のユースケース(Terraform の例) 既存の Cloud Run サービスへの影響 新規に作成した Cl…

Cloud RunでGPUを使用する

G-gen の佐々木です。2024年8月に Cloud Run で GPU の使用がサポートされました。当記事では Cloud Run で GPU を使用する方法と、GPU がサポートされている他のコンピューティングサービスとの使い分けを解説します。 Cloud Run における GPU Cloud Run で…

Cloud RunのサーバーレスVPCアクセスをDirect VPC Egressに安全に切り替える

G-gen の佐々木です。当記事では、Cloud Run サービスが VPC に接続する際に使用するサーバーレス VPC アクセスを Direct VPC Egress に置き換える方法を解説します。 Cloud Run から VPC にトラフィックを送信する方法 サーバーレス VPC アクセスと Direct …

Cloud FunctionsがCloud Run functionsとしてリブランディング。影響を解説

G-gen の佐々木です。2024年8月22日(日本時間)、Google Cloud のサーバーレス コンピューティング サービスである Cloud Functions が Cloud Run functions としてリブランディングされました。当記事ではリブランディングによる影響や変更点を解説します…

Cloud Runから内部ネットワーク経由で別のCloud Runサービスを呼び出す

G-gen の佐々木です。当記事では同一プロジェクトにある Cloud Run 間の通信をプライベートな通信経路で行う方法を解説します。 Cloud Run から Cloud Run へのアクセス方法 パブリックアクセス プライベートアクセス 構成図 事前準備 シェル変数の設定 Arti…

Cloud RunサービスのエンドポイントURLを無効化する

G-gen の佐々木です。当記事では、Cloud Run サービスの作成時に自動生成されるエンドポイント URL の無効化について解説します。 前提知識 Cloud Run サービスについて Cloud Run におけるロードバランサーの使用 デフォルト URL の無効化 URL 無効化のメリ…

Cloud Runのドメインマッピング機能で設定したカスタムドメインが削除できない

G-gen の佐々木です。当記事では、Cloud Run のドメインマッピング機能で設定したカスタムドメインが削除できない事象について、解決方法を解説します。 前提知識 事象の詳細 解決方法 削除時に Cloud Storage に関するエラーが発生する場合 余談:特定リー…

Geminiへの長文リクエストでResponseValidationError

G-gen の佐々木です。当記事では、Gemini Pro に長文のリクエストを送信した際に発生することがある ResponseValidationError について解説します。 当記事で使用する環境 事象 原因と解決方法 原因 原因の詳細 解決方法 当記事で使用する環境 当記事では、…

Cloud Runから固定IPでインターネット接続する(Direct VPC Egress編)

G-gen の佐々木です。当記事では、Cloud Run からインターネットアクセスを行う際に使用されるパブリック IP アドレスを固定する方法を解説します。 Cloud Run から Cloud NAT を使用してインターネット接続を行う はじめに サーバーレス VPC アクセスを使用…

Colab EnterpriseとVertex AI Workbenchを徹底解説

G-gen の佐々木です。当記事では、Google Cloud でマネージドな Jupyter ノートブック環境を利用できる、2種類のノートブックソリューション(Colab Enterprise / Vertex AI Workbench)を解説します。また、Colab Enterprise と Vertex AI Workbench の違い…

Cloud Runの最小インスタンス数をスケジュールベースで自動スケーリングする

G-gen の佐々木です。当記事では、Cloud Run の最小インスタンス数を、特定の時間帯で自動的にスケーリングさせる処理を実装していきます。 前提知識 Cloud Run について Cloud Run のコールドスタート サービスレベルの最小インスタンス数の設定 構成 スケ…

GKEでバースト可能なPodを使用する

G-gen の佐々木です。当記事では GKE で新たにサポートされた バースト可能な Pod について解説します。 また、この機能のサポートに伴い、従来よりも小さい容量で Pod のリソースリクエストが可能になったので、こちらもあわせて紹介します。 Pod のバース…

Workload Identity Federation for GKEの新しい設定方法を解説

G-gen の佐々木です。当記事では、GKE における Workload Identity Federation の、新しく追加された設定方法を解説します。 GKE における Workload Identity Federation 従来の方法 新しい方法 新しい方法の制限事項 新しい Workload Identity Federation …

GKEのIngressでIdentity-Aware Proxy(IAP)を有効化する

G-gen の佐々木です。当記事では GKE の Ingress リソースとして作成したロードバランサで Identity-Aware Proxy を有効化する方法を解説します。 当記事の概要 GKE クラスタにサンプルアプリケーションをデプロイ GKE クラスタの作成 Deployment リソースの…

Gemini ProとGradioを使用してシンプルな生成AIチャットボットを作成する

G-gen の佐々木です。当記事では Google が提供する生成 AI モデル Gemini Pro と、Web UI 用の Python フレームワークである Gradio を使用した、シンプルなチャットボットの作り方を紹介します。 前提知識 Gemini Pro Gradio Gradio を使用して Gemini Pro…

Cloud Runから"192.168.1.0/24"のサブネットにアクセスできない

G-gen の佐々木です。当記事では Cloud Run から VPC ネットワークに接続する際の、宛先サブネットの IP アドレス範囲に関する注意点を紹介します。 ※当記事に記載されている仕様は執筆時点のものであり、現在はアップデートにより改善されています。 宛先サ…

PaLM 2で同じ文章が何度も繰り返される事象への対処法

G-gen の佐々木です。当記事では、生成 AI モデルである PaLM 2 のチャットボットを構築した際に、モデルからの回答文で同じ文章が何度も繰り返されてしまう事象の解決策を紹介します。 前提知識 事象 解決策 Frequency Penalty パラメータ サンプルコード F…

Cloud RunからAlloyDBにパブリックIPアドレスで接続する

G-gen の佐々木です。当記事では AlloyDB for PostgreSQL でパブリック IP アドレスを有効化して、Cloud Run からの接続を試してみます。 前提知識 AlloyDB と Cloud Run パブリック IP アドレスを使用した AlloyDB への接続 Cloud Run から AlloyDB への接…

Cloud RunでCloud Storageバケットをマウントする

G-gen の佐々木です。当記事では Cloud Run で Cloud Storage バケットをボリュームマウントする方法を解説します。 前提知識 Cloud Run とは Cloud Storage(GCS)とは ネイティブ機能によるマウント Cloud Storage バケットの作成 バケットにテキストファ…