간략한 요약: Amazon Rekognition은 AWS의 완전 관리형 컴퓨터 비전 서비스로, 머신 러닝 전문 지식 없이도 딥 러닝을 사용하여 이미지와 비디오를 분석할 수 있습니다. 얼굴 감지, 객체 인식, 텍스트 추출, 콘텐츠 검열 및 사용자 지정 레이블 학습을 위한 사전 학습된 API를 제공합니다. 이 서비스는 자동으로 확장되며 처리량에 따라 요금이 부과됩니다. 처음 백만 개의 이미지를 처리할 때까지 이미지당 $0.00001의 요금이 부과됩니다.
Amazon Rekognition은 접근성이 뛰어난 컴퓨터 비전 기술에 대한 증가하는 요구에 부응하여 AWS가 2016년에 출시한 솔루션입니다. 이 제품은 대부분의 개발자가 이미지 및 비디오 분석 기능을 필요로 하지만, 머신 러닝 모델을 처음부터 구축할 시간, 예산 또는 전문 지식이 부족하다는 특정 문제를 해결하도록 설계되었습니다.
이 서비스는 완전히 클라우드에서 실행됩니다. API 호출을 통해 이미지나 비디오를 전송하면 Rekognition은 감지된 내용(얼굴, 사물, 텍스트, 부적절한 콘텐츠 등)에 대한 구조화된 데이터를 반환합니다.
하지만 여기서 중요한 점은 Rekognition이 하나의 통합된 도구가 아니라는 것입니다. 실제로 Rekognition은 각각 다른 컴퓨터 비전 작업을 처리하는 전문 API 모음입니다.

핵심 기능 및 API 범주
Rekognition은 기능을 이미지 분석과 비디오 분석의 두 가지 주요 범주로 나눕니다. 각 범주에는 여러 전문 API가 포함되어 있습니다.
이미지 분석 특징
이미지 분석 부분은 정적 이미지를 처리합니다. 공식 문서에 따르면, 객체와 얼굴은 안정적인 감지를 위해 이미지의 짧은 변 길이가 최소 5% 이상이어야 합니다. 1600×900 픽셀 이미지의 경우, 이는 최소 45픽셀에 해당합니다.
레이블 감지 기능은 이미지 내의 객체, 장면, 활동 및 개념을 식별합니다. 각 감지 결과에 대해 일반적으로 0~100 범위의 신뢰도 점수를 반환합니다. 콘텐츠 검토 기능은 여러 범주에 걸쳐 부적절하거나 원치 않는 콘텐츠를 검사합니다.
얼굴 감지 및 분석 기능은 이미지에서 얼굴을 식별하고 예상 연령대, 성별, 감정, 안경 착용 여부와 같은 속성을 추출합니다. 얼굴 비교 기능은 두 얼굴 간의 유사성을 측정하고, 얼굴 검색 기능은 감지된 얼굴을 저장된 얼굴 목록과 비교합니다.
텍스트 감지 기능은 이미지에서 인쇄된 텍스트와 손글씨를 추출합니다. 이는 문서 처리, 도로 표지판 인식 및 유사한 응용 분야에 유용합니다.
동영상 분석 기능
비디오 분석은 다양한 방식으로 작동합니다. 저장된 비디오를 비동기적으로 처리하거나 실시간 스트리밍 비디오를 분석할 수 있습니다. 이 시스템은 사람을 감지하고, 움직임을 추적하고, 사물과 활동을 인식하며, 장면 전환 시점을 파악합니다.
세그먼트 감지의 경우, 신뢰도 임계값을 기준으로 결과를 필터링할 수 있습니다. 정확도와 적용 범위의 균형을 맞추기 위해 일반적으로 70% 최소 신뢰도 필터가 사용됩니다.
하지만 잠깐만요. 아마존은 2026년 4월 30일을 기점으로 신규 고객에게 스트리밍 비디오 분석 및 일괄 이미지 콘텐츠 검열 기능을 더 이상 제공하지 않습니다. 지난 12개월 동안 해당 기능을 이용한 기존 사용자는 계속 이용할 수 있지만, 신규 계정에서는 해당 기능을 활성화할 수 없습니다.

얼굴 활성도 감지
얼굴 생동감 감지(Face Liveness)는 Rekognition이 스푸핑 공격에 대응하기 위해 개발한 기능입니다. 이 기능은 짧은 셀카 동영상을 분석하여 실제 인물인지, 아니면 사진, 사전 녹화된 비디오, 3D 마스크 또는 딥페이크를 사용했는지 판별합니다.
이 시스템은 프레젠테이션 공격(인쇄된 사진, 디지털 화면, 카메라에 보여주는 종이 가면)과 우회 공격(비디오 스트림에 삽입된 사전 녹화 또는 합성 비디오)을 탐지합니다. 시스템은 0에서 100까지의 설정 가능한 신뢰도 점수를 반환합니다.
이 기능은 React 웹 애플리케이션, 네이티브 iOS 앱 및 네이티브 Android 앱과 통합됩니다. 인프라 관리가 필요 없으며 AWS에서 완벽하게 관리합니다.
특정 용도에 맞는 맞춤형 라벨
사전 학습된 모델은 일반적인 사용 사례에서는 잘 작동합니다. 하지만 특정 차량 모델 감지, 제조 결함 식별 또는 독점 제품 인식과 같은 특수 시나리오에서는 어떨까요?
바로 여기서 사용자 지정 레이블 기능이 유용하게 사용됩니다. 사용자는 사용자 지정 카테고리로 레이블이 지정된 학습 이미지를 제공할 수 있으며, Rekognition은 사용자의 특정 인식 요구 사항에 맞춘 모델을 구축합니다. 최근 개선 사항 덕분에 이제 이전보다 적은 학습 데이터로도 고품질 모델을 구축할 수 있습니다.
이제 7개의 새로운 API가 프로그래밍 방식의 모델 생성, 데이터셋 관리 및 학습 워크플로 자동화를 지원합니다.
FlyPix AI를 활용한 지리공간 이미지 분석 적용
Amazon Rekognition은 일반적인 컴퓨터 비전 작업 전반에 걸쳐 이미지 및 비디오 분석에 사용됩니다. 플라이픽스 AI 보다 구체적인 분야에서 일하며, 팀이 위성, 드론 및 항공 이미지를 분석하여 물체를 탐지하고, 위치를 구분하고, 실제 현장에서 나타나는 변화를 모니터링하도록 지원합니다.
FlyPix AI는 다음과 같은 위치 기반 이미지 분석 작업을 지원할 수 있습니다.
- 눈에 보이는 물체, 도로, 건물, 차량, 식물 또는 기반 시설을 감지합니다.
- 지도상의 영역을 육지, 수역, 들판, 건축물 지역 등으로 분할
- 위성, 드론 또는 항공 이미지에서 시간에 따른 변화를 검토합니다.
- 지리 공간 탐지 작업을 위한 맞춤형 AI 모델 생성
FlyPix AI에 문의하세요 지리공간 이미지 분석이 위치 기반 시각적 검토 워크플로를 어떻게 지원할 수 있는지 논의합니다.
가격 구조 및 비용 관리
Rekognition은 월별 사용량에 따라 단계별 가격 책정 방식을 사용합니다. AWS가 요금 체계를 간소화하고 대용량 사용자에게 최대 38%까지 가격을 인하하면서 구조가 크게 변경되었습니다.
| 가격 등급 | 월간 이미지 수 | 그룹 1 API 이미지당 가격 |
|---|---|---|
| 1단계 | 첫 100만 명 | $0.00001 |
| 2단계 | 다음 400만 | $0.00008 |
| 3단계 | 다음 3천만 | $0.00006 |
| 4단계 | 3500만 명 이상 | $0.00004 |
그룹 1 API에는 가장 일반적인 기능인 얼굴 연결, 얼굴 비교, 얼굴 분리, 얼굴 색인, 이미지 기반 얼굴 검색, 얼굴 검색, 이미지 기반 사용자 검색 및 사용자 검색이 포함됩니다. 그룹 2 API에는 얼굴 감지, 라벨 감지, 라벨 감지, 텍스트 감지 및 유명인 인식 기능이 포함되며, 각 기능은 별도의 가격 구조를 갖습니다.
얼굴 벡터 저장 비용은 얼굴 메타데이터당 월 $0.00001입니다. 비디오 분석은 이미지 단위가 아닌 분 단위로 요금이 부과됩니다.
간단히 답하자면, 적당히 사용할 경우 비용은 상당히 감당할 수 있는 수준입니다.
신뢰도 임계값 및 정확도
Rekognition이 수행하는 모든 탐지에는 신뢰도 점수가 포함됩니다. 실제 응용 분야에서는 적절한 임계값을 설정하는 방법을 이해하는 것이 중요합니다.
가족 구성원을 식별하는 간단한 사진 애플리케이션의 경우, 일반적으로 80% 정도의 임계값이 적합합니다. 하지만 보안이 매우 중요한 시나리오에서는 오탐을 최소화하기 위해 99% 이상의 더 엄격한 기준이 필요합니다.
얼굴 인식 기술에 대한 연구 결과는 이미지 품질, 조명, 각도 및 인구 통계학적 요인에 따라 성능이 크게 달라진다는 것을 보여줍니다. 실제 성능은 이러한 조건에 따라 달라집니다.
연구 보고서에 따르면 얼굴 인식 오인으로 인한 부당 체포 사례가 기록되어 있으며, 이는 이러한 도구를 확정적인 증거가 아닌 수사 보조 도구로 활용해야 함을 강조합니다.
통합 및 접근 제어
Rekognition은 액세스 제어를 위해 AWS Identity and Access Management(IAM)와 통합됩니다. 정책을 통해 어떤 사용자와 애플리케이션이 어떤 API를 호출할 수 있는지 정의하여, 승인된 시스템만 시각 분석 기능을 이용할 수 있도록 보장합니다.
이 서비스는 Python, JavaScript, Java, .NET 및 기타 언어에서 사용할 수 있는 표준 AWS SDK를 통해 작동합니다. 사용자 지정 통합을 위해 REST API 액세스도 제공됩니다.
Rekognition으로 전송되는 콘텐츠에 대한 모든 소유권은 귀하에게 있습니다. AWS는 귀하의 명시적인 동의가 있고 귀하의 설정에 따라서만 데이터를 사용합니다.
일반적인 사용 사례
솔직히 말해서, Rekognition은 다양한 산업 분야에서 활용되고 있습니다. 미디어 회사들은 이를 이용해 비디오 아카이브를 자동으로 분류하고, 보안 애플리케이션은 얼굴 검색을 통해 신원을 확인하며, 전자상거래 플랫폼은 사용자가 업로드한 이미지에서 제품을 감지합니다.
소셜 미디어 플랫폼은 콘텐츠 검열 기능을 활용하여 부적절한 이미지를 대규모로 걸러냅니다. 제조 공정에서는 맞춤형 라벨을 사용하여 조립 라인의 결함을 찾아냅니다. 문서 처리 워크플로는 스캔한 양식과 영수증에서 텍스트를 추출합니다.
오리건주 워싱턴 카운티는 법 집행 기관의 얼굴 검색을 위해 Rekognition 시스템을 도입했습니다. 워싱턴 포스트에 따르면, 해당 카운티는 2019년까지 모든 검색에 대해 월 약 14,000달러를 지불했습니다. 2018년에는 1,000건 이상의 얼굴 검색이 이루어졌습니다.
기술적 고려사항
성능이 자동으로 확장되어 수백만 개의 이미지 또는 비디오 스트림을 몇 초 만에 분석하는 것이 일상화됩니다. 인프라 프로비저닝이 필요하지 않으며, AWS가 용량 관리를 담당합니다.
작업 종류에 따라 지연 시간이 다릅니다. 간단한 레이블 감지는 일반적으로 1초 이내에 완료됩니다. 저장된 콘텐츠에 대한 비디오 분석은 비동기적으로 처리되며, 결과는 콜백 또는 폴링을 통해 확인할 수 있습니다.
이 시스템은 피사체가 프레임의 적절한 부분을 차지하는 선명하고 조명이 잘 된 이미지에서 최상의 성능을 발휘합니다. 극단적인 각도, 열악한 조명 또는 과도하게 압축된 이미지는 정확도를 떨어뜨립니다.
문서 및 개발자 자료
AWS는 개념 개요, API 참조 및 구현 가이드를 포함하는 포괄적인 문서를 제공합니다. 표준 Rekognition 기능과 사용자 지정 레이블에 대한 개발자 가이드는 별도로 제공됩니다.
시작하려면 일반적으로 AWS 계정을 생성하고, IAM 권한을 구성하고, SDK를 설치하고, 샘플 이미지를 사용하여 첫 번째 API 호출을 수행해야 합니다. 설명서에는 일반적인 시나리오에 대한 예제 코드가 포함되어 있습니다.
자주 묻는 질문
Amazon Rekognition은 이미지와 비디오를 분석하여 사물, 얼굴, 텍스트, 부적절한 콘텐츠 및 사용자 지정 학습 범주를 감지합니다. 응용 분야로는 보안 시스템, 미디어 카탈로그 작성, 콘텐츠 검열, 문서 처리 및 제품 인식 등이 있습니다.
그룹 1 API를 사용하여 월 100만 이미지까지 처리하는 경우 이미지당 가격은 $0.00001부터 시작합니다. 월 처리량이 3,500만 이미지를 초과하면 이미지당 비용은 $0.00004로 감소합니다.
아니요. Rekognition은 머신러닝 지식이 없어도 사용할 수 있는 사전 학습된 API를 제공합니다. API 호출을 통해 이미지나 비디오를 전송하면 구조화된 탐지 결과를 받을 수 있습니다. 사용자 지정 레이블 기능은 레이블이 지정된 학습 데이터가 필요하지만 모델 구축을 자동으로 처리합니다.
정확도는 신뢰도 임계값 설정과 이미지 품질에 따라 달라집니다. 사진 기반 애플리케이션의 경우, 가족 구성원 식별에는 80% 신뢰도면 충분합니다. 고위험 보안 애플리케이션에는 일반적으로 99% 신뢰도가 요구됩니다. 성능은 조명, 각도 및 인구 통계학적 요인에 따라 달라질 수 있습니다.
사물과 얼굴은 안정적인 감지를 위해 이미지의 짧은 변 길이의 최소 5% 이상이어야 합니다. 1600×900 픽셀 이미지의 경우 최소 45픽셀입니다. 크기가 작은 피사체는 일관되게 감지되지 않을 수 있습니다.
얼굴 생동감 감지 기능은 인쇄된 사진, 디지털 화면, 3D 마스크, 사전 녹화된 비디오 및 딥페이크를 포함한 위조 시도를 특별히 감지합니다. 짧은 셀카 동영상을 분석하여 실제 인물인지 여부를 나타내는 신뢰도 점수를 제공합니다.
기존 고객에게는 스트리밍 비디오 분석 기능이 제공되지만, 2026년 4월 30일부터 신규 계정에는 더 이상 제공되지 않습니다. 저장된 비디오 분석 기능은 모든 사용자가 계속해서 이용할 수 있으며, 비동기적으로 비디오를 처리하여 객체, 사람, 활동 및 장면 변화를 감지합니다.
Amazon Rekognition은 접근성이 뛰어난 컴퓨터 비전 기능을 제공하여 분명한 수요를 충족합니다. 사전 학습된 모델, 유연한 가격 정책, 관리형 인프라의 조합을 통해 이미지 및 비디오 분석 구현의 기존 장벽을 제거합니다.
컴퓨터 비전 솔루션을 평가하는 팀에게 Rekognition은 위험 부담이 적은 진입점을 제공합니다. 사용한 만큼만 지불하고, 사전 구축된 모델로 시작하여 필요에 따라 확장할 수 있습니다. 최신 기능 가용성 및 특정 사용 사례에 맞춘 자세한 구현 지침은 AWS 공식 문서를 참조하십시오.