Compare AI. Decide smarter.
회원가입하고 지금 바로 모델을 비교해보세요. 나만의 AI 에이전트를 구축할 수 있습니다.
응답, 속도, 비용을 한 화면에서 비교해보세요.
| 실제 API 호출 | 모든 요청은 백엔드를 통해 API 키로 라우팅됩니다. 벤더 가용성은 서버 설정에 따라 달라집니다. |
|---|---|
| 동일 조건 비교 | 병렬 비교는 동일한 프롬프트, 시스템 지시사항, 파라미터를 모든 모델에 동시에 전송합니다. |
| 투명한 결과 | 성능 데이터는 공개 벤치마크 기반입니다. 실제 결과는 프롬프트와 컨텍스트 길이에 따라 달라질 수 있습니다. |
일하게 만드는 운영 구조.
엄선된 AI 모델 성능 비교, 연결 상태, 벤치마크 참조를 하나의 흐름으로 묶는 것이 핵심 방향입니다.
AI를 똑똑한 팀처럼일하게 만드는 운영 구조.
단일 모델에 의존하지 않고 Draft · Critic · Decision · RAG 역할을 나누어, 4단계 검증 흐름으로 품질과 비용을 함께 관리합니다.
분석 → 검색 → 비판 → 수정
모델 강점 기준 배치
역할 분리로 차단
에이전트 추론 파이프라인
단순 질의응답을 넘어, 검증을 자연스럽게 포함하는 운영 흐름.
Analyze
문제 정의와 성공 조건을 먼저 고정합니다. 입력이 부족하면 추정하지 않고 명시합니다.
Retrieve
RAG 데이터 기반으로 내부 문서·데이터를 신뢰 가능한 근거로 수집합니다.
Critique
과장·모순·누락을 AI가 스스로 점검합니다. 자기검증이 첫 번째 안전장치입니다.
Revise
비판 결과를 반영해 정확한 답안으로 보정합니다. 변경 이력을 함께 기록합니다.
모델별 역할 배치
모델 성격에 맞춰 역할을 분리하면 품질 일관성과 비용 효율을 함께 관리할 수 있습니다.
| 모델 | 추론 스타일 | 강점 | 관찰 포인트 | 추천 역할 |
|---|---|---|---|---|
| GPT-5.4 · Claude 4.6 OpusOpenAI · Anthropic | 대규모 추론과 고난도 의사결정 정리에 강함 | 복합 전략 판단, 트레이드오프 최적화 | 안정성 | 최종 검토 / 전략 정리 |
| Gemini 3.1 Pro · Claude 4.6 OpusGoogle · Anthropic | 설명 가능성이 높고 검증 문장 품질 우수 | 과장·금칙어·가이드 위반 탐지 | 설명성 | Critic 에이전트 / 정책 감사 |
| Gemini Flash · Claude Sonnet · GPT miniGoogle · Anthropic · OpenAI | 긴 문맥, 멀티소스 검색 결합에 강함 | 시장 데이터, 트렌드, 문서 탐색 | 탐색력 | RAG / 데이터 공급 에이전트 |
| DeepSeek V3.2 · Gemini Flash LiteDeepSeek · Google | 가성비 중심 생성, 빠른 대량 초안 작성 | 초안 생산, A/B 카피 대량 생성 | 속도/비용 | Draft 에이전트 / 초안 브루트포스 |
오케스트레이션 보드
초안 → 비판 → 결정 → 근거 연동 핸드오프를 운영 단위로 시각화합니다.
DeepSeek V3.2 · Gemini Flash
속도 중심. 카피 후보군을 빠르게 생성
제품 핵심 가치(USP) 기반 3가지 톤 변형
→ draft_copy.json45자 제한, 행동 유도 문구(CTA) 포함
→ draft_subcopy.jsonGemini 3.1 Pro · Claude 4.6 Opus
근거 검증. 과장·표현 리스크·브랜드 위반 탐지
확정·보장·최고 등 과장 표현 자동 탐지 및 플래그
→ critique_report.json금칙어·톤 가이드 위반 항목 추출
→ brand_violations.jsonGPT-5.4 · Claude 4.6 Opus
비판 결과 반영 후 최종안 선정 및 근거 설명
CTR 가능성, 리스크, 비용 종합 평가 후 최종 문구 선정
→ final_decision.json최종 선택 및 제외된 문구의 논리적 근거 기록
→ decision_rationale.mdGemini Flash · Claude Sonnet · GPT mini
시장 데이터와 내부 문서를 함께 연결
구글 트렌드·경쟁 키워드 데이터 자동 갱신
→ trend_context.json제품 FAQ, 가격 정책, 법무 문구 매칭
→ rag_evidence.json파인튜닝 vs 구조
판단력은 구조에서 나오고, 파인튜닝은 맥락 적응을 담당합니다.
- 브랜드 톤·금칙어·용어집을 일관되게 학습
- 자주 쓰는 카피 포맷과 문장 스타일 고정
- 업무 도메인 표현 비용 절감
- 근거 검색·자기검증·수정 루프를 일관되게 유지
- 모델별 역할 분리로 환각 전파 차단
- 최종 결과에 대한 변경 이력 기록
이 구조는 Compare와 Benchmark에서 라우팅 품질을 검증하는 기준으로 사용합니다.
직접 채워 넣는
AI 운영 기록실.
직접 문구를 넣는 공간
AHTTY의 현재 진행 상황, 새 실험 결과, 사용자에게 보여주고 싶은 안내문을 이 카드에 바로 추가하세요.
최신 모델 뉴스
새 모델 출시, 가격 변경, 벤치마크 업데이트, 한국어 성능 메모를 쌓아두는 영역입니다.
QLoRA 튜닝 문서
데이터셋 구성, 학습 파라미터, 실패 케이스, 튜닝 결과를 사용자가 직접 정리하는 공간입니다.
작업 로그와 리서치
Codex, OpenClaw, 모델 비교 실험, 사내 프롬프트 제작 기록을 연결하는 허브입니다.
브라우저 임시 편집 메모
공개 문구로 확정하기 전, 모델 뉴스나 튜닝 문서 초안을 이곳에서 먼저 정리할 수 있습니다. 저장 내용은 이 브라우저의 로컬 저장소에만 남습니다.
| 모델 | 제공사 | 지연시간 | 토큰 | 상태 |
|---|---|---|---|---|
| 비교를 실행하면 이 테이블이 채워집니다. | ||||
AHTTY와 함께하고
완벽한 에이전트를 빌드해보세요
계정 생성 시 이용약관에 동의하게 됩니다.
- 기본적인 사용량
- 2개 모델 비교
- 기본 사이트 접근
- 사용량 추적
- 5개 모델 동시 비교
- 고급 모델 접근
- 더 많은 사용량 제공
- AHTTY Chrome 및 safary 확장 프로그램 접근
- AHTTY app PRO
- 프롬프트 템플릿
- 벤치마크 기반 추천
- Pro의 모든 기능
- 공유 프롬프트
- AHTTY app Ultra
- 사용량 관리
- 최대 사용량
- Benchmark / Compare 운영 실험
구독 신청은 [email protected]으로 문의해 주세요.