Media Intelligence 개요

Prev Next

VPC 환경에서 이용 가능합니다.

Media Intelligence 서비스는 기존에 수동으로 작업하던 영상 및 이미지 분석을 자동화한 미디어 AI 분석 솔루션입니다. 비전 분석 AI와 음성 분석 AI를 통합한 멀티모달 모델 엔진을 활용하여 영상, 이미지 및 음성 분석 결과를 종합적으로 이해하여 인물, 행동/객체/시공간, 자동 자막 등 다각적으로 인사이트를 추출합니다. 또한 분석된 결과를 한눈에 파악할 수 있는 구조화된 인터페이스에서 키워드를 검색하거나 장면 구간, 스크립트와 인사이트 정보를 확인할 수 있습니다.

Media Intelligence이 제공하는 다양한 기능

Media Intelligence 서비스가 제공하는 다양한 기능에 대한 설명은 다음과 같습니다.

  • 구간 단위 인사이트 추출: 영상을 일반 프레임 단위가 아닌 유의미한 구간(샷·Shot, 장면·Scene) 단위로 분석하여 각 구간에 대한 종합적인 정보를 제공합니다.
    • 샷(Shot) 구간: 연속된 촬영 구간을 의미하며 카메라 시점 변화, 화면 전환 등이 발생할 때 다른 샷으로 인식합니다.
    • 장면(Scene) 구간: 동일한 배경 및 맥락에서 촬영된 샷 구간을 모은 구간을 의미하며 장소 및 배경이 변경될 때 다른 장면으로 인식합니다.
  • 시각/음성 종합 분석 결과 제공: 비전 엔진과 음성 엔진이 결합된 멀티모달 엔진을 사용하여 시각적 요소와 음성 요소를 동시에 분석합니다. 시각 분석을 통해 주요 인물, 객체, 행동 등을 인식하고 음성 분석을 통해 발화자를 식별하여 자동으로 자막을 생성합니다. 특히 음성 인식 기능이 한국어에 최적화되어 있어, 자동으로 생성되는 자막의 정확도가 뛰어납니다.
  • 이미지 인사이트 추출: 정지 이미지에 대해 비전 엔진을 활용한 시각 분석을 수행하며, 주요 인물, 객체, 행동 등을 인식하여 분석 결과를 제공합니다.
  • 메타데이터 추출: 약 500개 이상의 객체, 행동, 시공간, 촬영 기법 관련 분석 키워드를 추출하고 프롬프트에 직접 자연어를 입력하는 검색 기능이 제공됩니다.
  • 인물 인식 및 DB 지원: 미디어 분석 시 검색하고자 하는 인물 정보를 직접 데이터베이스로 구축하여 저장하고 이를 분석 과정에서 활용할 수 있습니다(추후 제공 예정).
  • 메타데이터 수정 및 활용: 메타데이터가 포함된 JSON 파일을 활용하여 원하는 정보를 쉽게 검색하거나 편집 포인트를 찾을 수 있습니다.

Media Intelligence 사용 가이드 안내

Media Intelligence 서비스는 한국 리전에서 서비스를 제공하고 있습니다. Media Intelligence 서비스의 원활한 이용을 위해 다음 목차와 목차별 내용을 확인해 주십시오.

Media Intelligence 연관 리소스

네이버 클라우드 플랫폼에서는 Media Intelligence 서비스에 대한 고객의 이해를 돕기 위해 사용 가이드 외에도 다양한 연관 리소스를 제공하고 있습니다. Media Intelligence 서비스를 도입하기 위해 고민 중이거나 자세한 정보가 필요한 개발자, 마케터 등은 다음 리소스를 적극 활용해 보십시오.

  • Media Intelligence 서비스에 대한 이해와 사용 방법 고도화
  • Media Intelligence 서비스 사용에 필요한 연동 서비스 사용 가이드