Mercury 2는 기존의 자기회귀 방식 대신 확산 기반 생성을 사용하는 혁신적인 대규모 언어 모델(LLM)입니다. 이를 통해 여러 토큰을 병렬로 생성할 수 있어 GPT-5 mini나 Claude Haiku와 같은 주요 모델보다 5배 이상 빠른 속도를 제공합니다. 미세한 출력 제어와 멀티모달 데이터를 위한 통합 프레임워크를 통해 최고 수준의 품질을 비용의 일부로 제공합니다.
Paid
from $0.25 per 1M tokens
사용 방법 Mercury 2?
쉬운 통합을 위해 OpenAI API와 호환되는 API를 통해 Mercury 2에 접근하세요. 음성 에이전트, 자동 완성이 포함된 실시간 코드 편집, 빠른 지식 베이스 검색, 글쓰기 및 브레인스토밍을 위한 창의적 코파일럿과 같은 실시간 애플리케이션에 사용하세요. 지연 시간이 중요한 워크플로우를 위해 설계되어, 개발자가 지각할 수 있는 지연 없이 반응형 AI 에이전트, 고객 지원 봇, 몰입형 게임 경험을 구축할 수 있습니다.
Mercury 2 의 주요 기능
확산 아키텍처를 통한 병렬 토큰 생성으로 초당 1000개 이상의 토큰을 처리하며, 기존 LLM보다 5배 이상 빠릅니다.
타 최고 수준 모델 대비 절반 미만의 가격으로 최첨단 모델 품질을 제공하여 비용을 크게 절감합니다.
특정 JSON 스키마, 템플릿 및 의미론적 제약을 준수하도록 출력을 미세하게 제어할 수 있어 안정적인 애플리케이션 구축이 가능합니다.
언어를 오디오, 이미지, 비디오와 같은 다른 양식과 원활하게 결합하는 멀티모달 AI를 위한 통합 패러다임을 제공합니다.
OpenAI API 호환성을 통해 최소한의 코드 변경으로 기존 LLM 통합을 대체할 수 있습니다.
AWS Bedrock 및 Azure Foundry와 같은 주요 클라우드 제공업체를 통한 엔터프라이즈급 배포 옵션과 프라이빗 배포 및 파인튜닝을 지원합니다.
실시간 음성 상호작용, 즉각적인 코드 완성, 번개처럼 빠른 AI 에이전트와 같은 초저지연 사용 사례에 최적화되었습니다.
Mercury 2 의 사용 사례
실시간 AI 코딩 어시스턴트를 구축하는 개발자는 즉각적인 자동 완성 및 리팩토링을 위해 Mercury 2를 사용하여 방해되는 지연 없이 프로그래머가 몰입 상태를 유지할 수 있습니다.
고객 지원 팀은 초반응형 음성 에이전트를 배포하여 자연스러운 실시간 대화로 문의와 번역을 인간과 같은 속도로 처리할 수 있습니다.
콘텐츠 제작자와 마케터는 빠른 창의적 코파일럿을 활용하여 슬로건을 브레인스토밍하고, 광고 문구를 다듬으며, 반복적이고 빠른 수정을 통해 편집 콘텐츠를 생성할 수 있습니다.
데이터 분석가와 연구원은 대규모 조직 지식 베이스에서 빠른 의미론적 검색을 수행하여 관련 정보와 통찰력을 즉시 발견할 수 있습니다.
제품 관리자와 전략가는 이 모델을 사용하여 디자인 비평을 시뮬레이션하고, 심층 분석으로 기술을 비교하며, 점진적 개선을 통해 스타트업 아이디어를 발전시킬 수 있습니다.
게임 스튜디오는 몰입감 있는 음성 기반 NPC 상호작용과 플레이어 입력에 즉시 반응하는 동적 내러티브 생성을 구현할 수 있습니다.
내부 워크플로우를 위해 대용량 저지연 AI가 필요한 기업은 문서 요약 및 데이터 추출과 같은 작업을 위한 확장 가능하고 비용 효율적인 병렬 처리의 혜택을 받을 수 있습니다.
Mercury 2 의 가격
Mercury 2
Input $0.25 per 1M tokens, Output $0.75 per 1M tokens
가장 빠른 추론 dLLM입니다. 높은 성능과 속도가 필요한 복잡한 애플리케이션에 이상적입니다.
Mercury Edit
Input $0.25 per 1M tokens, Output $0.75 per 1M tokens