简要总结: Amazon Rekognition 是 AWS 提供的完全托管式计算机视觉服务,它利用深度学习技术分析图像和视频,无需机器学习专业知识。该服务提供预训练的 API,用于人脸检测、物体识别、文本提取、内容审核和自定义标签训练。该服务可自动扩展,并按处理量收费,前一百万张图像的处理费用为每张图像 $0.00001 美元。.
Amazon Rekognition 于 2016 年推出,是 AWS 为应对日益增长的易用型计算机视觉技术需求而推出的解决方案。它的设计旨在解决一个特定问题:大多数开发人员需要图像和视频分析功能,但缺乏从零开始构建机器学习模型的时间、预算或专业知识。.
该服务完全在云端运行。您通过 API 调用发送图像或视频,Rekognition 会返回有关其检测到的内容的结构化数据——人脸、物体、文本、不当内容,以及您要查找的任何东西。.
但需要注意的是,Rekognition 并不是一个单一的整体工具。它实际上是一套专门的 API,每个 API 都处理不同的计算机视觉任务。.

核心功能和 API 类别
Rekognition 将其功能分为两大类:图像分析和视频分析。每一类都包含多个专门的 API。.
图像分析特征
图像分析部分处理的是静态图像。根据官方文档,为了保证检测的可靠性,物体和人脸的最小尺寸必须至少为图像较短尺寸的 5%。对于一张 1600×900 像素的图像,这意味着最小尺寸为 45 像素。.
标签检测功能可识别图像中的物体、场景、活动和概念。它会为每次检测返回置信度分数,通常范围为 0 到 100。内容审核功能则会扫描多个类别中的不当或不良内容。.
人脸检测与分析功能可以识别图像中的人脸,并提取诸如估计年龄范围、感知性别、情绪以及是否佩戴眼镜等属性。人脸比较功能可以衡量两张人脸之间的相似度,而人脸搜索功能则可以将检测到的人脸与存储的数据库进行匹配。.
文本检测功能可从图像中提取印刷体和手写体文本,适用于文档处理、路标识别及类似应用。.
视频分析功能
视频分析的工作原理有所不同。您可以异步处理存储的视频,也可以实时分析流媒体视频。该系统能够检测人员、跟踪其移动轨迹、识别物体和活动,并识别场景变化。.
对于分段检测,您可以按置信度阈值筛选结果。通常使用 70% 最小置信度滤波器来平衡准确性和覆盖范围。.
但是等等。自 2026 年 4 月 30 日起,亚马逊已停止向新客户提供流媒体视频分析和批量图像内容审核服务。过去 12 个月内已使用这些功能的现有用户仍可继续使用,但新账户无法启用这些功能。.

人脸活体检测
人脸活体检测是 Rekognition 针对欺骗攻击的解决方案。该功能分析短自拍视频,以确定视频中的人是真人还是使用了照片、预录视频、3D 面具或深度伪造技术。.
它可以检测呈现攻击(例如向摄像头展示打印照片、数字屏幕或纸质面具)和绕过攻击(例如将预先录制或合成的视频注入视频流)。系统会返回一个可配置的置信度评分,范围从 0 到 100。.
此功能可与 React Web 应用程序、原生 iOS 应用和原生 Android 应用集成。无需任何基础设施管理——它完全由 AWS 管理。.
用于特殊识别的定制标签
预训练模型在一般应用场景下表现良好。但是对于特殊场景呢?例如,检测特定车型、识别制造缺陷或识别专有产品?
这时自定义标签就派上用场了。您可以提供带有自定义类别标签的训练图像,Rekognition 会构建一个满足您特定识别需求的模型。最近的改进意味着您现在可以使用比以前更少的训练数据构建高质量的模型。.
七个新的 API 现在支持程序化模型创建、数据集管理和训练工作流程自动化。.
利用 FlyPix AI 进行地理空间图像分析
Amazon Rekognition 用于一般计算机视觉任务中的图像和视频分析。. 飞像素 AI 它在更具体的领域发挥作用,帮助团队分析卫星、无人机和航空图像,以检测物体、分割位置并监测现实世界中的可见变化。.
FlyPix AI 可以支持基于位置的图像分析任务,例如:
- 检测可见物体、道路、建筑物、车辆、植被或基础设施
- 对地图区域进行分割,例如陆地、水域、田地和建成区
- 回顾卫星、无人机或航空影像随时间发生的变化
- 为地理空间检测任务创建自定义 AI 模型
联系 FlyPix AI 探讨地理空间图像分析如何支持您基于位置的视觉审查工作流程。.
定价结构和成本管理
Rekognition 采用基于月度使用量的分级定价。定价结构发生了重大变化——AWS 简化了分级方案,并为高使用量用户降低了高达 38% 的价格。.
| 定价层级 | 数量(张/月) | 第一组 API 单价 |
|---|---|---|
| 一级 | 前100万 | $0.00001 |
| 二级 | 接下来的400万 | $0.00008 |
| 三级 | 接下来的3000万 | $0.00006 |
| 第四级 | 超过3500万 | $0.00004 |
第一组 API 包括最常用的功能——AssociateFaces、CompareFaces、DisassociateFaces、IndexFaces、SearchFacesbyImage、SearchFaces、SearchUsersByImage 和 SearchUsers。第二组 API 包括 DetectFaces、DetectModerationLabels、DetectLabels、DetectText 和 RecognizeCelebrities,并采用不同的定价结构。.
人脸矢量存储费用为每张人脸元数据每月 $0.00001。视频分析采用按分钟计费,而非按图像计费。.
简而言之,对于中等使用量而言,成本完全可以控制。.
置信阈值和准确率
Rekognition 的每次检测都包含一个置信度评分。了解如何设置合适的阈值对于实际应用至关重要。.
对于用于识别家庭成员的普通照片应用,80% 左右的阈值通常效果不错。高风险安全场景则需要更严格的标准——通常为 99% 或更高,以最大限度地减少误匹配。.
人脸识别技术的研究表明,其性能会因图像质量、光照、角度和人口统计因素而显著变化。实际应用中的性能取决于这些条件。.
研究报告表明,面部识别错误识别已导致一些有记录的案件中出现错误逮捕,这凸显了将这些工具用作调查辅助手段而非最终证据的重要性。.
集成和访问控制
Rekognition 与 AWS Identity and Access Management (IAM) 集成,实现访问控制。策略定义了哪些用户和应用程序可以调用哪些 API,从而确保只有授权系统才能访问可视化分析功能。.
该服务通过适用于 Python、JavaScript、Java、.NET 和其他语言的标准 AWS 开发工具包 (SDK) 运行。此外,还提供 REST API 访问,方便进行自定义集成。.
您保留对发送至 Rekognition 的内容的完全所有权。AWS 仅在获得您的明确同意并按照您的配置使用您的数据。.
常见用例
说实话,Rekognition 的应用遍及各个行业。媒体公司用它来自动整理视频档案。安全应用利用人脸搜索进行身份验证。电商平台则用它来检测用户上传图片中的商品。.
社交媒体平台利用内容审核机制大规模过滤不当图片。制造业使用定制标签来识别装配线上的缺陷。文档处理工作流程从扫描的表格和收据中提取文本。.
俄勒冈州华盛顿县采用Rekognition系统进行执法部门的人脸识别搜索。据《华盛顿邮报》报道,截至2019年,该县每月用于所有搜索的费用约为1000万美元。2018年,该机构进行了超过1000次人脸识别搜索。.
技术考量
性能可自动扩展——在几秒钟内分析数百万张图像或视频流已成为常态。无需基础设施配置;AWS 会处理容量管理。.
延迟因操作而异。简单的标签检测通常在一秒内完成。对存储内容的视频分析是异步进行的,结果通过回调或轮询提供。.
该系统在图像清晰、光线充足且主体占据画面合理比例的情况下效果最佳。极端角度、光线不足或过度压缩的图像都会降低精度。.
文档和开发者资源
AWS 提供全面的文档,涵盖概念概述、API 参考和实施指南。标准 Rekognition 功能和自定义标签分别有单独的开发者指南。.
入门通常包括创建 AWS 账户、配置 IAM 权限、安装 SDK 以及使用示例镜像进行首次 API 调用。文档中包含常见场景的示例代码。.
常见问题
Amazon Rekognition 可分析图像和视频,以检测物体、人脸、文本、不当内容以及自定义训练的类别。其应用领域包括安全系统、媒体编目、内容审核、文档处理和产品识别。.
使用第一组 API 每月处理的前 100 万张图像,定价为每张图像 $0.00001。当每月处理量超过 3500 万张时,价格降至每张图像 $0.00004。.
不。Rekognition 提供预训练的 API,无需机器学习知识即可使用。您可以通过 API 调用发送图像或视频,并接收结构化的检测结果。自定义标签需要已标注的训练数据,但会自动构建模型。.
准确度取决于置信度阈值设置和图像质量。对于照片应用,80% 置信度足以用于家庭成员身份识别。高风险安全应用通常需要 99% 置信度。性能会因光照、角度和人口统计因素而异。.
为了确保可靠检测,物体和人脸的尺寸必须至少为图像较短边的 5%。在 1600×900 像素的图像中,这意味着至少需要 45 个像素。较小的物体可能无法被稳定检测到。.
人脸活体检测功能专门用于检测各种欺骗手段,包括打印照片、电子屏幕、3D面具、预录视频和深度伪造视频。它会分析短视频,并返回置信度评分,以判断视频中是否为真人。.
是的,现有客户仍可使用此功能,但自 2026 年 4 月 30 日起,流媒体视频分析功能将不再向新账户开放。存储视频分析功能仍将对所有用户完全开放,该功能可异步处理视频并检测物体、人物、活动和场景变化。.
Amazon Rekognition 满足了人们对易于使用的计算机视觉功能的迫切需求。预训练模型、灵活的定价和托管基础设施的结合,消除了图像和视频分析实施方面的传统障碍。.
对于正在评估计算机视觉解决方案的团队而言,Rekognition 提供了一个低风险的入门途径——只需为实际使用的功能付费,从预构建模型入手,并可根据需求增长进行扩展。请查阅 AWS 官方文档,了解当前功能的可用性以及针对您具体用例的详细实施指南。.