簡単な概要: Amazon Rekognitionは、AWSが提供するフルマネージド型のコンピュータビジョンサービスで、機械学習の専門知識を必要とせずに、ディープラーニングを用いて画像や動画を分析します。顔検出、物体認識、テキスト抽出、コンテンツモデレーション、カスタムラベルのトレーニングなどに対応した、事前学習済みのAPIを提供しています。サービスは自動的にスケーリングされ、処理量に応じて課金されます。最初の100万枚の画像処理までは、1枚あたり$0.00001からとなります。.
Amazon Rekognitionは、アクセスしやすいコンピュータビジョン技術へのニーズの高まりに応えるため、AWSが2016年に発表したサービスです。これは、特定の課題を解決するために設計されています。つまり、ほとんどの開発者は画像や動画の分析機能を必要としているものの、機械学習モデルをゼロから構築する時間、予算、専門知識を持ち合わせていないという課題です。.
このサービスは完全にクラウド上で動作します。API呼び出しを通じて画像や動画を送信すると、Rekognitionは検出されたもの(顔、物体、テキスト、不適切なコンテンツなど、探しているものすべて)に関する構造化データを返します。.
しかし、重要なのは、Rekognitionは単一のツールではないということです。実際には、それぞれ異なるコンピュータビジョンタスクを処理する、専用のAPI群で構成されています。.

コア機能とAPIカテゴリ
Rekognitionは、その機能を画像解析と動画解析の2つの主要カテゴリに分類しています。各カテゴリには、複数の専用APIが含まれています。.
画像解析機能
画像解析側では静止画像を扱います。公式ドキュメントによると、物体や顔を確実に検出するには、画像内の短い方の寸法の少なくとも5%(ピクセル単位)以上の大きさが必要です。1600×900ピクセルの画像の場合、これは最低45ピクセルに相当します。.
ラベル検出は、画像内のオブジェクト、シーン、アクティビティ、概念を識別します。各検出結果に対して、通常0~100の範囲の信頼度スコアを返します。コンテンツモデレーションは、複数のカテゴリにわたる不適切または不要なコンテンツをスキャンします。.
顔検出・分析機能は、画像内の顔を識別し、推定年齢、性別、感情、眼鏡の有無などの属性を抽出します。顔比較機能は2つの顔の類似性を測定し、顔検索機能は検出された顔をデータベースに保存されている顔画像と照合します。.
テキスト検出機能は、画像から印刷されたテキストや手書きのテキストを抽出するもので、文書処理、道路標識の認識、その他同様の用途に役立ちます。.
ビデオ分析機能
動画分析の仕組みは異なります。保存された動画を非同期で処理することも、ストリーミング動画をリアルタイムで分析することも可能です。システムは人物を検出し、その動きを追跡し、物体や動作を認識し、シーンの変化を識別します。.
セグメント検出では、信頼度閾値で結果をフィルタリングできます。精度と網羅率のバランスを取るために、70%の最小信頼度フィルタが一般的に使用されます。.
しかし、ちょっと待ってください。2026年4月30日をもって、Amazonは新規顧客へのストリーミングビデオ分析とバッチ画像コンテンツモデレーションの提供を終了しました。過去12か月以内にこれらの機能を利用した既存ユーザーは引き続き利用できますが、新規アカウントではこれらの機能を有効にすることはできません。.

顔認証
顔認証機能は、Rekognitionがなりすまし攻撃に対抗するために開発した機能です。この機能は、短い自撮り動画を分析し、そこにいるのが実在の人物なのか、それとも写真、録画済み動画、3Dマスク、ディープフェイクを使用しているのかを判別します。.
本システムは、プレゼンテーション攻撃(カメラに映し出される印刷された写真、デジタルスクリーン、紙マスクなど)とバイパス攻撃(ビデオストリームに挿入される録画済みまたは合成ビデオなど)を検出します。システムは、0~100の範囲で設定可能な信頼度スコアを返します。.
この機能は、Reactウェブアプリケーション、ネイティブiOSアプリ、ネイティブAndroidアプリと統合できます。インフラストラクチャ管理は不要で、AWSによって完全に管理されます。.
特別な認識のためのカスタムラベル
事前学習済みのモデルは、一般的な用途には十分機能します。しかし、特定の車種の検出、製造上の欠陥の特定、独自製品の認識といった特殊なシナリオではどうでしょうか?
そこでカスタムラベルの出番です。カスタムカテゴリでラベル付けされたトレーニング画像を提供すると、Rekognitionがお客様の特定の認識ニーズに合わせたモデルを構築します。最近の改良により、以前よりも少ないトレーニングデータで高品質なモデルを構築できるようになりました。.
新たに7つのAPIが追加され、プログラムによるモデル作成、データセット管理、トレーニングワークフローの自動化がサポートされるようになりました。.
FlyPix AI を使用した地理空間画像解析の適用
Amazon Rekognitionは、一般的なコンピュータビジョンタスクにおける画像および動画分析に使用されます。. フライピックスAI より専門的な分野で活動し、衛星画像、ドローン画像、航空写真の分析を支援して、物体を検出したり、場所を区分けしたり、現実世界の現場における目に見える変化を監視したりします。.
FlyPix AIは、以下のような位置情報に基づく画像解析タスクをサポートできます。
- 目に見える物体、道路、建物、車両、植生、またはインフラストラクチャを検出する
- 土地、水域、畑、建築区域などの地図上の領域を分割する
- 衛星画像、ドローン画像、または航空写真における経時的な変化をレビューする
- 地理空間検出タスクのためのカスタムAIモデルの作成
FlyPix AIにお問い合わせください 地理空間画像解析が、位置情報に基づいた視覚的レビューのワークフローをどのようにサポートできるかについて議論します。.
価格体系とコスト管理
Rekognitionは、月間ボリュームに基づいた段階的な料金体系を採用しています。この構造が大幅に変更され、AWSは料金体系を簡素化し、ボリュームの多いユーザー向けに最大38%の料金を引き下げました。.
| 価格帯 | 掲載枚数(画像数/月) | グループ1 API 画像あたりの価格 |
|---|---|---|
| ティア1 | 最初の100万人 | $0.00001 |
| ティア2 | 次の400万人 | $0.00008 |
| ティア3 | 次の3000万人 | $0.00006 |
| ティア4 | 3500万人以上 | $0.00004 |
グループ1のAPIには、AssociateFaces、CompareFaces、DisassociateFaces、IndexFaces、SearchFacesbyImage、SearchFaces、SearchUsersByImage、SearchUsersといった最も一般的な機能が含まれています。グループ2のAPIには、DetectFaces、DetectModerationLabels、DetectLabels、DetectText、RecognizeCelebritiesが含まれており、それぞれ料金体系が異なります。.
顔ベクトルデータの保存費用は、顔メタデータ1件あたり月額$0.00001です。動画分析は、画像単位ではなく分単位で料金が計算されます。.
簡潔に言うと、適度な使用であれば、コストは十分に管理可能な範囲に収まります。.
信頼度閾値と精度
Rekognitionが行うすべての検出結果には、信頼度スコアが含まれています。適切な閾値を設定する方法を理解することは、実際のアプリケーションにおいて重要です。.
家族を識別するような一般的な写真アプリケーションでは、80%程度の閾値で十分です。しかし、セキュリティ上のリスクが高い場面では、誤検出を最小限に抑えるため、より厳格な基準(多くの場合99%以上)が必要となります。.
顔認識技術に関する研究によると、その性能は画像品質、照明、角度、および人口統計学的要因によって大きく変動することが示されている。実際の性能はこれらの条件に左右される。.
研究報告によると、顔認識による誤認は、記録に残る事例において不当逮捕の一因となっており、これらのツールを決定的な証拠としてではなく、捜査の補助手段として使用することの重要性が強調されている。.
統合とアクセス制御
Rekognitionは、アクセス制御のためにAWS Identity and Access Management(IAM)と統合されています。ポリシーによって、どのユーザーとアプリケーションがどのAPIを呼び出せるかが定義され、承認されたシステムのみがビジュアル分析機能にアクセスできるようになります。.
このサービスは、Python、JavaScript、Java、.NETなどの言語に対応した標準のAWS SDKを通じて動作します。カスタム統合のためにREST APIへのアクセスも可能です。.
Rekognitionに送信されたコンテンツの所有権は、お客様に完全に帰属します。AWSは、お客様の明示的な同意を得た場合、かつお客様の設定に従ってのみ、お客様のデータを使用します。.
一般的な使用例
実を言うと、Rekognitionは様々な業界で採用されている。メディア企業はビデオアーカイブの自動カタログ作成にRekognitionを利用している。セキュリティアプリケーションは本人確認に顔認証を採用している。Eコマースプラットフォームはユーザーがアップロードした画像から商品を検出する。.
ソーシャルメディアプラットフォームは、コンテンツモデレーションを活用して不適切な画像を大規模にフィルタリングします。製造現場では、カスタムラベルを使用して組立ライン上の欠陥を検出します。文書処理ワークフローでは、スキャンされたフォームや領収書からテキストを抽出します。.
オレゴン州ワシントン郡は、法執行機関による顔認証検索にRekognitionを導入した。ワシントン・ポスト紙によると、同郡は2019年までにすべての検索に月額約14.7ドルを支払っていた。2018年には、同機関は1,000件以上の顔認証検索を実施した。.
技術的考慮事項
パフォーマンスは自動的に拡張されるため、数百万枚の画像や動画ストリームを数秒で分析することが日常的に可能になります。インフラストラクチャのプロビジョニングは不要で、AWSが容量管理を行います。.
処理時間は操作によって異なります。単純なラベル検出は通常1秒以内に完了します。保存されたコンテンツのビデオ分析は非同期で処理され、結果はコールバックまたはポーリングによって取得できます。.
このシステムは、被写体が画面の適切な部分を占めている、鮮明で明るい画像で最も効果を発揮します。極端な角度、照明条件の悪い画像、または過度に圧縮された画像は、精度を低下させます。.
ドキュメントと開発者向けリソース
AWS は、概念概要、API リファレンス、実装ガイドなど、包括的なドキュメントを提供しています。Rekognition の標準機能とカスタムラベルについては、それぞれ個別の開発者ガイドが用意されています。.
通常、使い始めるには、AWSアカウントの作成、IAM権限の設定、SDKのインストール、サンプルイメージを使用した最初のAPI呼び出しを行う必要があります。ドキュメントには、一般的なシナリオに対応したサンプルコードが含まれています。.
よくある質問
Amazon Rekognitionは、画像や動画を分析して、物体、顔、テキスト、不適切なコンテンツ、および独自に学習したカテゴリを検出します。用途としては、セキュリティシステム、メディアカタログ作成、コンテンツモデレーション、文書処理、製品認識などがあります。.
グループ1 APIを使用した月間処理画像数100万枚までは、1枚あたり$0.00001の料金が適用されます。月間処理画像数が3500万枚を超えると、1枚あたり$0.00004に料金が下がります。.
いいえ。Rekognitionは、機械学習の知識がなくても動作する事前学習済みAPIを提供しています。API呼び出しで画像や動画を送信すると、構造化された検出結果が返されます。カスタムラベルはラベル付きトレーニングデータが必要ですが、モデル構築は自動的に行われます。.
精度は、信頼度閾値の設定と画像品質に依存します。写真アプリケーションの場合、家族識別には80%の信頼度で十分です。高度なセキュリティアプリケーションでは、通常99%の信頼度が必要です。性能は、照明、角度、および人口統計学的要因によって異なります。.
物体や顔を確実に検出するには、画像の短い方の辺の長さが少なくとも5%以上である必要があります。1600×900ピクセルの画像の場合、これは最低45ピクセルを意味します。これより小さい物体は、確実に検出されない可能性があります。.
顔認証機能は、印刷された写真、デジタル画面、3Dマスク、録画済み動画、ディープフェイクなど、なりすまし行為を具体的に検出します。短い自撮り動画を分析し、そこに実在の人物がいるかどうかを示す信頼度スコアを返します。.
既存のお客様は引き続きご利用いただけますが、ストリーミングビデオ分析は2026年4月30日以降、新規アカウントではご利用いただけなくなります。保存済みビデオ分析は引き続きすべてのユーザーが利用でき、ビデオを非同期で処理し、物体、人物、活動、シーンの変化を検出します。.
Amazon Rekognitionは、誰もが手軽に利用できるコンピュータビジョン機能に対する明確なニーズを満たします。事前学習済みモデル、柔軟な料金体系、マネージドインフラストラクチャの組み合わせにより、画像および動画分析の実装における従来の障壁が取り除かれます。.
コンピュータビジョンソリューションを検討しているチームにとって、Rekognitionはリスクの低い導入方法を提供します。使用した分だけ料金を支払い、事前に構築されたモデルから始め、ニーズの拡大に合わせて拡張できます。最新の機能提供状況や、お客様の具体的なユースケースに合わせた詳細な実装ガイダンスについては、AWSの公式ドキュメントをご確認ください。.