Résumé rapide : Amazon Rekognition est le service de vision par ordinateur entièrement géré d'AWS. Il utilise l'apprentissage profond pour analyser les images et les vidéos sans nécessiter d'expertise en apprentissage automatique. Il propose des API pré-entraînées pour la détection de visages, la reconnaissance d'objets, l'extraction de texte, la modération de contenu et l'apprentissage d'étiquettes personnalisées. Le service s'adapte automatiquement et sa facturation est basée sur le volume, à partir de $0,00001 par image pour le premier million traité.
Lancé en 2016, Amazon Rekognition est la réponse d'AWS au besoin croissant de technologies de vision par ordinateur accessibles. Ce service est conçu pour résoudre un problème précis : la plupart des développeurs ont besoin de fonctionnalités d'analyse d'images et de vidéos, mais n'ont ni le temps, ni le budget, ni l'expertise nécessaires pour créer des modèles d'apprentissage automatique de A à Z.
Le service fonctionne entièrement dans le cloud. Vous envoyez des images ou des vidéos via des appels d'API, et Rekognition renvoie des données structurées sur ce qu'il a détecté : visages, objets, texte, contenu inapproprié, etc.
Mais voilà : Rekognition n’est pas un outil monolithique. Il s’agit en réalité d’une suite d’API spécialisées, chacune gérant des tâches de vision par ordinateur différentes.

Fonctionnalités principales et catégories d'API
Rekognition divise ses fonctionnalités en deux grandes catégories : l’analyse d’images et l’analyse vidéo. Chaque catégorie comprend plusieurs API spécialisées.
Fonctionnalités d'analyse d'images
Le module d'analyse d'images traite les images statiques. D'après la documentation officielle, les objets et les visages doivent avoir une taille minimale de 5% (51 pixels de la plus petite dimension de l'image) pour une détection fiable. Pour une image de 1600 × 900 pixels, cela correspond à un minimum de 45 pixels.
La détection d'étiquettes identifie les objets, les scènes, les activités et les concepts présents dans les images. Elle attribue un score de confiance à chaque détection, généralement compris entre 0 et 100. La modération de contenu analyse les images à la recherche de contenus inappropriés ou indésirables dans plusieurs catégories.
La détection et l'analyse des visages permettent d'identifier les visages dans les images et d'en extraire des attributs tels que la tranche d'âge estimée, le sexe perçu, les émotions et la présence ou non de lunettes. La comparaison de visages mesure la similarité entre deux visages, tandis que la recherche de visages associe les visages détectés à une base de données.
La détection de texte extrait le texte imprimé et manuscrit des images, ce qui est utile pour le traitement de documents, la reconnaissance des panneaux de signalisation et autres applications similaires.
Fonctionnalités d'analyse vidéo
L'analyse vidéo fonctionne différemment. Vous pouvez traiter des vidéos stockées de manière asynchrone ou analyser des flux vidéo en temps réel. Le système détecte les personnes, suit leurs mouvements, reconnaît les objets et les activités, et identifie les changements de scène.
Pour la détection de segments, vous pouvez filtrer les résultats par seuil de confiance. Un filtre de confiance minimale 70% est couramment utilisé pour optimiser le compromis entre précision et couverture.
Mais attention ! À compter du 30 avril 2026, Amazon ne proposera plus l’analyse vidéo en streaming ni la modération par lots du contenu image aux nouveaux clients. Les utilisateurs existants ayant utilisé ces fonctionnalités au cours des 12 derniers mois conservent leur accès, mais les nouveaux comptes ne pourront pas les activer.

Détection de la présence du visage
Face Liveness est la réponse de Rekognition aux attaques par usurpation d'identité. Cette fonctionnalité analyse de courtes vidéos selfie pour déterminer si une personne réelle est présente ou si quelqu'un utilise une photo, une vidéo préenregistrée, un masque 3D ou un deepfake.
Il détecte les attaques par présentation (photos imprimées, écrans numériques, masques papier montrés à la caméra) et les attaques par contournement (vidéos préenregistrées ou synthétiques injectées dans le flux vidéo). Le système renvoie un score de confiance configurable de 0 à 100.
Cette fonctionnalité s'intègre aux applications web React, aux applications natives iOS et aux applications natives Android. Aucune gestion d'infrastructure n'est requise : elle est entièrement gérée par AWS.
Étiquettes personnalisées pour une reconnaissance spécialisée
Les modèles pré-entraînés fonctionnent bien pour les cas d'utilisation généraux. Mais qu'en est-il des scénarios spécialisés : la détection de modèles de véhicules spécifiques, l'identification de défauts de fabrication ou la reconnaissance de produits propriétaires ?
C'est là qu'interviennent les étiquettes personnalisées. Vous fournissez des images d'entraînement étiquetées avec vos catégories personnalisées, et Rekognition construit un modèle adapté à vos besoins spécifiques de reconnaissance. Grâce aux récentes améliorations, vous pouvez désormais créer des modèles de qualité avec moins de données d'entraînement qu'auparavant.
Sept nouvelles API prennent désormais en charge la création de modèles programmatiques, la gestion des ensembles de données et l'automatisation des flux de travail d'entraînement.
Appliquez l'analyse d'images géospatiales avec FlyPix AI
Amazon Rekognition est utilisé pour l'analyse d'images et de vidéos dans le cadre de tâches générales de vision par ordinateur. FlyPix AI Il intervient dans un domaine plus spécifique, aidant les équipes à analyser les images satellites, de drones et aériennes pour détecter les objets, segmenter les emplacements et surveiller les changements visibles sur des sites réels.
FlyPix AI peut prendre en charge des tâches d'analyse d'images géolocalisées telles que :
- Détection d'objets visibles, de routes, de bâtiments, de véhicules, de végétation ou d'infrastructures
- Segmentation des zones cartographiées telles que les terres, les eaux, les champs et les zones bâties
- Analyse des changements survenus au fil du temps sur les images satellites, de drones ou aériennes
- Création de modèles d'IA personnalisés pour les tâches de détection géospatiale
Contactez FlyPix AI pour discuter de la manière dont l'analyse d'images géospatiales peut soutenir votre flux de travail d'examen visuel basé sur la localisation.
Structure tarifaire et gestion des coûts
Rekognition utilise une tarification par paliers basée sur le volume mensuel. Cette structure a considérablement évolué : AWS a simplifié ses paliers et réduit les prix jusqu’à 381 TP3T pour les utilisateurs à volume élevé.
| Niveau de tarification | Volume (images/mois) | Prix par image des API du groupe 1 |
|---|---|---|
| Niveau 1 | Premier million | $0.00001 |
| Niveau 2 | Les 4 prochains millions | $0.00008 |
| Niveau 3 | Les 30 prochains millions | $0.00006 |
| Niveau 4 | Plus de 35 millions | $0.00004 |
Les API du groupe 1 comprennent les fonctionnalités les plus courantes : AssociateFaces, CompareFaces, DisassociateFaces, IndexFaces, SearchFacesbyImage, SearchFaces, SearchUsersByImage et SearchUsers. Les API du groupe 2 comprennent DetectFaces, DetectModerationLabels, DetectLabels, DetectText et RecognizeCelebrities, chacune avec sa propre grille tarifaire.
Le stockage des métadonnées vectorielles des visages coûte $0,00001 par visage et par mois. L'analyse vidéo est facturée à la minute et non à l'image.
En résumé ? Pour une utilisation modérée, les coûts restent tout à fait raisonnables.
Seuil de confiance et précision
Chaque détection effectuée par Rekognition est assortie d'un score de confiance. Il est essentiel de savoir définir des seuils appropriés pour les applications concrètes.
Pour les applications photo courantes d'identification des membres d'une famille, un seuil d'environ 80% est généralement suffisant. Les scénarios de sécurité critiques exigent des normes plus strictes, souvent 99% ou plus, afin de minimiser les faux positifs.
Les recherches sur la technologie de reconnaissance faciale montrent que ses performances varient considérablement en fonction de la qualité de l'image, de l'éclairage, de l'angle de prise de vue et de facteurs démographiques. Les performances réelles dépendent de ces conditions.
Des rapports de recherche indiquent que les erreurs d'identification par reconnaissance faciale ont contribué à des arrestations injustifiées dans des cas documentés, soulignant l'importance d'utiliser ces outils comme aides à l'enquête plutôt que comme preuve définitive.
Intégration et contrôle d'accès
Rekognition s'intègre à AWS Identity and Access Management (IAM) pour le contrôle d'accès. Les politiques définissent quels utilisateurs et applications peuvent appeler quelles API, garantissant ainsi que seuls les systèmes autorisés accèdent aux fonctionnalités d'analyse visuelle.
Ce service fonctionne grâce aux kits de développement logiciel (SDK) AWS standard disponibles pour Python, JavaScript, Java, .NET et d'autres langages. Un accès à l'API REST est également possible pour les intégrations personnalisées.
Vous conservez l'entière propriété du contenu envoyé à Rekognition. AWS utilise vos données uniquement avec votre consentement explicite et conformément à votre configuration.
Cas d'utilisation courants
En toute franchise : Rekognition est utilisé dans de nombreux secteurs. Les entreprises de médias l’utilisent pour cataloguer automatiquement leurs archives vidéo. Les applications de sécurité ont recours à la reconnaissance faciale pour vérifier l’identité. Les plateformes de commerce électronique détectent les produits sur les images téléchargées par les utilisateurs.
Les plateformes de médias sociaux utilisent la modération de contenu pour filtrer les images inappropriées à grande échelle. Les opérations de fabrication utilisent des étiquettes personnalisées pour repérer les défauts sur les chaînes de montage. Les flux de traitement de documents extraient le texte des formulaires et reçus numérisés.
Le comté de Washington, dans l'Oregon, a adopté Rekognition pour les recherches faciales effectuées par les forces de l'ordre. Selon le Washington Post, le comté payait environ 100 400 dollars par mois pour l'ensemble de ses recherches en 2019. En 2018, le service a enregistré plus de 1 000 recherches faciales.
Considérations techniques
Les performances s'adaptent automatiquement : analyser des millions d'images ou de flux vidéo en quelques secondes devient une routine. Aucun provisionnement d'infrastructure n'est requis ; AWS gère la capacité.
La latence varie selon l'opération. La détection d'étiquettes simples s'effectue généralement en moins d'une seconde. L'analyse vidéo du contenu stocké est traitée de manière asynchrone, les résultats étant disponibles par rappel ou par interrogation périodique.
Le système fonctionne de manière optimale avec des images nettes et bien éclairées où les sujets occupent une part raisonnable du cadre. Les angles extrêmes, un éclairage insuffisant ou des images fortement compressées dégradent la précision.
Documentation et ressources pour les développeurs
AWS propose une documentation complète comprenant des présentations conceptuelles, des références API et des guides d'implémentation. Des guides de développement distincts existent pour les fonctionnalités standard de Rekognition et les étiquettes personnalisées.
Pour commencer, il faut généralement créer un compte AWS, configurer les autorisations IAM, installer un kit de développement logiciel (SDK) et effectuer un premier appel d'API avec une image d'exemple. La documentation inclut des exemples de code pour les scénarios courants.
Questions fréquemment posées
Amazon Rekognition analyse les images et les vidéos pour détecter les objets, les visages, le texte, les contenus inappropriés et les catégories personnalisées. Ses applications incluent les systèmes de sécurité, le catalogage multimédia, la modération de contenu, le traitement de documents et la reconnaissance de produits.
Le tarif de base est de $0,00001 par image pour le premier million d'images traitées mensuellement avec les API du groupe 1. Il diminue ensuite à $0,00004 par image pour les volumes supérieurs à 35 millions par mois.
Non. Rekognition propose des API pré-entraînées qui fonctionnent sans connaissances en apprentissage automatique. Vous envoyez des images ou des vidéos via des appels d'API et recevez des résultats de détection structurés. La fonctionnalité « Étiquettes personnalisées » nécessite des données d'entraînement étiquetées, mais gère automatiquement la construction du modèle.
La précision dépend des seuils de confiance et de la qualité de l'image. Pour les applications photographiques, le niveau de confiance 80% est suffisant pour l'identification des membres d'une famille. Les applications de sécurité critiques requièrent généralement un niveau de confiance 99%. Les performances varient en fonction de l'éclairage, de l'angle de prise de vue et des caractéristiques démographiques.
Pour une détection fiable, les objets et les visages doivent mesurer au moins 51 × 3 × la plus petite dimension de l’image. Sur une image de 1 600 × 900 pixels, cela correspond à un minimum de 45 pixels. Les sujets plus petits peuvent ne pas être détectés de manière systématique.
La fonctionnalité de détection de présence du visage repère les tentatives d'usurpation d'identité, notamment les photos imprimées, les captures d'écran numériques, les masques 3D, les vidéos préenregistrées et les deepfakes. Elle analyse de courtes vidéos selfie et attribue un score de confiance indiquant la présence ou non d'une personne réelle.
Oui pour les clients existants, mais l'analyse vidéo en continu ne sera plus disponible pour les nouveaux comptes à compter du 30 avril 2026. L'analyse vidéo stockée reste pleinement accessible à tous les utilisateurs, traitant les vidéos de manière asynchrone et détectant les objets, les personnes, les activités et les changements de scène.
Amazon Rekognition répond à un besoin évident de solutions de vision par ordinateur accessibles. L'association de modèles pré-entraînés, d'une tarification flexible et d'une infrastructure gérée lève les obstacles traditionnels à la mise en œuvre de l'analyse d'images et de vidéos.
Pour les équipes évaluant des solutions de vision par ordinateur, Rekognition offre une solution à faible risque : vous ne payez que ce que vous utilisez, vous commencez avec des modèles préconfigurés et vous pouvez évoluer en fonction de vos besoins. Consultez la documentation AWS officielle pour connaître les fonctionnalités disponibles et obtenir des instructions d’implémentation détaillées adaptées à votre cas d’utilisation.