Google Cloud Vision AI APIの使い方を徹底解説!画像認識のための設定方法もご紹介
本記事に辿り着いた方の多くは「ITエンジニア」か「画像認識AIの導入を考えている担当者」のどちらかだと推察いたします。
というのも、昨今のAIサービス・プロダクトの進化が速すぎて、情報のキャッチアップに勤しむ頻度が増えたように思います。実際の仕事現場でもAI活用をしたい、DX化を進めたいという声が聞こえてくるのも普通になりましたね。
そんな中でも、「画像認識AI」を活用した業務効率化ニーズが多い印象を受けます。
そこで、本記事では画像認識AIを簡単に実装できる“Google Cloud Vision AI API”の基本概要から具体的な使い方までを初心者向けに解説します。
Google Cloud Vision AI APIとは?

Google Cloud Vision AI APIは、画像や動画から情報を抽出し、理解するための高度なコンピュータービジョンサービスです。正確には、Googleが開発したその技術をデベロッパー向けに提供するためのAPIのことを指します。
初心者でも簡単に利用でき、物体検出や画像認識など多様な機能を提供しているので、AIエンジニアでなくとも画像認識系のサービス・プロダクトを開発することが可能になるのです。
コンピュータービジョンサービス
コンピュータービジョンとは、ひとえに「視覚的な分析をコンピューターが行う」ことを概念として指す言葉です。具体的には画像や動画から視覚情報を解析・理解する高度な技術のことをいいます。
Google CloudのVision AIは、これらの機能をクラウド上で簡単に利用できるように設計されており、初心者でも直感的に操作可能です。
画像内の物体認識、顔検出、テキスト抽出(OCR)、ロゴ検出、ランドマーク検出など多様な機能を備えており、ビジネスアプリケーションやデータ分析に応用することができます。
これらはもともとGoogle社が自社でサービス化していたものをAPIに転用したものですので、すでに一般消費者の手によってPoCの済んでいる信頼のおける技術アセットだと考えて良いでしょう。
物体検出・画像認識ができる
Google Cloud Vision AI APIは、強力な物体検出および画像認識機能を有しています。
皆さんはGoogleレンズをお使いになったことはありますか?Googleレンズで外国語を読み込ませて翻訳したり、商品をカメラで写して画像検索をしたりなどができますよね。
端的に言えば、あの中核技術をAPIとして利用することができると捉えて差し支えありません。
具体的な応用例としては、小売業では商品画像から在庫管理を効率化したり、セキュリティ分野では監視カメラ映像から不審物を検出したりすることができます。
APIでアプリケーション開発が可能
Google Cloud Vision AI API(もといGCPで使える全てのAPI)は、一貫して各種プログラミング言語のクライアントを用意していたり、レスポンス形態が統一されていたりと“エンジニアフレンドリー”なものになっています。
これにより、初心者でも容易にアプリケーション開発が可能です。もっとも、高度なサービス設計のためにはそれなりのスキルが必要となりますが、少なくともGoogleの技術を簡単に扱えるという点では相違ありません。
APIはRESTおよびRPCインターフェースを提供しており、さまざまなプログラミング言語からアクセスできるので、ウェブアプリケーションやモバイルアプリケーションに画像認識機能をシームレスに統合することができます。
Google Cloud Vision AI APIの料金・制限

Google Cloud Vision AI APIの利用に際しては、無料枠もあるものの商用利用レベルのボリュームでは料金が発生することに留意が必要です。
また、同サービスは何回でも使い放題というわけではなく、閾値の設けられた使用制限が存在します。
本節では具体的な料金構造と利用制限について詳しく説明します。
料金体系
Google Cloud Vision API の料金は機能ごと・1,000 ユニット単位の段階制従量課金です。すべての機能で 最初の 1,000 ユニット/月は無料 ですが、それ以降の料金は機能別に異なります。
機能 | 1,000 ユニット | 1,001 ~ 5,000,000 ユニット | 5,000,001 ユニット以上 |
---|---|---|---|
ラベル検出 | 無料 | $1.50 | $1.00 |
テキスト検出 | 無料 | $1.50 | $0.60 |
ドキュメント テキスト検出 | 無料 | $1.50 | $0.60 |
セーフサーチ(不適切なコンテンツ)検出 | 無料 | $1.50(ラベル検出を利用している場合は無料) | $0.60(ラベル検出を利用している場合は無料) |
顔検出 | 無料 | $1.50 | $0.60 |
顔検出 – Celebrity Recognition | 無料 | $1.50 | $0.60 |
ランドマーク検出 | 無料 | $1.50 | $0.60 |
ロゴ検出 | 無料 | $1.50 | $0.60 |
画像プロパティ検出 | 無料 | $1.50 | $0.60 |
クロップヒント検出 | 無料 | $1.50(画像プロパティ検出を利用している場合は無料) | $0.60(画像プロパティ検出を利用している場合は無料) |
ウェブ検出 | 無料 | $3.50 | – |
オブジェクトのローカライズ | 無料 | $2.25 | $1.50 |
このように、多くの機能では大口利用になるほど単価が下がる “ボリュームディスカウント” が組み込まれています。
最新の料金や適用条件は Google Cloud 公式ドキュメントで必ずご確認ください。
割り当てと制限
Google Cloud Vision API では、サービスの安定性と公平な利用を保つためにレート制限(割り当て) が設定されています。
割り当てを超過した場合はエラー(HTTP 429 など)が返されるだけで追加料金が発生するわけではありません。必要に応じて Cloud Console から増枠申請が可能です。
Vision API の割り当て | 割り当てのタイプ | 値 |
---|---|---|
1 分あたりのリクエスト数(以下のリクエスト タイプを除く) | リクエストの割り当て | 1,800 |
1 分あたりの Celebrity Recognition リクエスト | リクエストの割り当て | 0 |
1 分あたりのラベル検出リクエスト | 機能の割り当て | 1,800 |
1 分あたりのテキスト検出リクエスト | 機能の割り当て | 1,800 |
非同期画像アノテーション* における処理中の画像数 | 処理中の割り当て | 8,000 |
非同期ドキュメント テキスト検出† における処理中のページ数 | 処理中の割り当て | 10,000 |
Product Search の割り当て | 値 |
---|---|
1 分あたりのリクエスト数(以下のリクエスト タイプを除く) | 1,800 |
1 日あたりの一括リクエスト数 | 300 |
1 分あたりのリソース管理の書き込みリクエスト数 | 1,200 |
1 分あたりのリソース管理リクエスト数 | 2,400 |
その他の技術的制限として、画像サイズは最大 20 MB/1 リクエストあたりの画像枚数は最大 16 枚 が公式ドキュメントで定められています。
これらの割り当ては課金とは独立しており、超過するとリクエストが拒否されるだけです。スムーズな運用のために、Cloud Monitoring で現在の使用量を監視し、必要に応じて増枠申請を行うことを推奨します。
最新の制限値や増枠手順は Google Cloud 公式ドキュメントでご確認ください。
Google Cloud Vision AI APIの設定方法

では、ここからは実際にGoogle Cloud Vision AI APIを扱うために必要な各種設定について、画像をもとに解説していきたいかと思います。
基本的なアカウント作成などを済ませておけば、本節の解説に沿って設定を進めていくだけで完了しますので、ぜひご利用の際の参考にしていただければ幸いです。
GCPコンソールへアクセス
まず、GCP(Google Cloud Platform)をWebで検索し、コンソールへアクセスしてください。すると下記のような画面へ移ります。
この画面から各種サービスへアクセスすることができます。

(すでに済んでいる方はスキップ)次に、ヘッダーのロゴの右隣にあるボタンから「プロジェクト」を選択し、新しいプロジェクトを作成するボタンから以下の画面へと遷移します。

このフォームから、お好みのプロジェクト名を決めて作成しておいてください。
Vison AI APIを有効化
次に、画面上部のヘッダーにある検索窓に「Vision AI API」と入力すると、「API」のロゴとともにGoogle Vision AI APIが表示されるので、これをクリックします。

Google Vision AI APIのホーム画面にたどり着くので、画面左部にある「有効にする」ボタンをクリックしてください。
※料金は発生しないのでご安心ください。

APIキーの発行・保存
APIを有効にしたら、次にAPIを利用するために必要なAPIキー(認証のための文字列)を発行します。
画面左部のナビゲーションから「認証情報」をクリックし、「+認証情報を作成」をクリックしましょう。

すると、ドロップダウンメニューが出現するので、一番上の「APIキー」をクリックしましょう。

しばらくするとAPIキーの生成が終わるので、これをコピーしてしっかりと保存しておきましょう。
※注意: このAPIキーは絶対に外部へ公開しないでください。悪用される危険性があります。

このAPIキーとVIsion AI APIのエンドポイントを使用することで、サービスの利用が可能となります。
以下にサンプルコードを記載しますので、必要に応じて参考にしてください。
# Python
import os
import requests
API_KEY = os.getenv("<先ほど発行したAPIキー>") # 環境変数化をお勧めします
# API_KEY = "<先ほど発行したAPIキー>" # ローカルPC環境ではベタ書きでも許容
ENDPOINT = "<使用したいAPIエンドポイント(URL)>"
def call_api(content) -> list[tuple[str, str, float]]:
payload = {
"document": {"type": "PLAIN_TEXT", "content": content},
"encodingType": "UTF8"
}
headers = {
"X-Goog-Api-Key": API_KEY,
"Content-Type": "application/json"
}
r = requests.post(ENDPOINT, headers=headers, json=payload, timeout=10)
r.raise_for_status() # 例外
return r.json()
Google Cloud Vision AI APIリファレンス一覧
ここまで紹介してきたGoogle Cloud Vision AI APIは、数多くのプログラミング言語のクライアントライブラリを公開しています。
本節で各種言語リファレンスへのリンクを記載しておくので、参考にしてください。
まとめ
Google Cloud Vision AI APIは、初心者でも容易に利用できる強力な画像認識サービスです。
本記事では、基本機能から物体検出・画像認識の具体的な活用方法、APIを用いたアプリケーション開発の手順までを詳しく解説しました。
本記事を読むことで初心者でもスムーズにGoogle Cloud Vision AI APIを導入し、実用的なアプリケーションを開発できるようになります。
参考にして最適な活用方法を見つけてください。
この記事の著者

児玉慶一
執行役員/ AI・ITエンジニア
愛称: ケーイチ
1999年2月生まれ。大学へ現役進学後数ヶ月で通信キャリアの営業代理店を経験。営業商材をもとに100名規模の学生団体を構築。個人事業主として2018年〜2020年2月まで活動したのち、2020年4月に広告営業事業を営む株式会社TOYを創業。同時期にITの可能性を感じプログラミングを始め、現在はITエンジニアとして活動中。2021年にLeograph株式会社に参画し、AI研究開発やWebアプリ開発などを手掛ける。 「Don't repeat yourself(重複作業をなくそう)」「Garbage in, Garbage out(無意味なデータは、無意味な結果をもたらす)」をモットーにエンジニア業務をこなす。
【得意領域】
業務効率化AIモデル開発
事業課題、戦略工程からシステム開発
Webマーケティング戦略からSaaS開発