AHTTY
AI Studio

Compare AI. Decide smarter.

회원가입하고 지금 바로 모델을 비교해보세요. 나만의 AI 에이전트를 구축할 수 있습니다.

AHTTY
지금 바로 모델을 비교하고, 나만의 AI 에이전트를 구축해보세요.
빠른 접근
이용 방법
실제 API 호출모든 요청은 백엔드를 통해 API 키로 라우팅됩니다. 벤더 가용성은 서버 설정에 따라 달라집니다.
동일 조건 비교병렬 비교는 동일한 프롬프트, 시스템 지시사항, 파라미터를 모든 모델에 동시에 전송합니다.
투명한 결과성능 데이터는 공개 벤치마크 기반입니다. 실제 결과는 프롬프트와 컨텍스트 길이에 따라 달라질 수 있습니다.
Privacy Guard
민감정보는 먼저 가리고, 필요한 곳에만 보냅니다.
이름, 연락처, 이메일, 주소, 주민등록번호, 사업자등록번호, 계좌번호, API Key 등은 AI 처리 전 자동 마스킹될 수 있습니다. 외부 파트너 모델에는 마스킹된 데이터만 전달하는 것을 원칙으로 하며, 고위험 정보가 감지되면 전송이 제한될 수 있습니다.
Strategy Ops
AI를 똑똑한 팀처럼
일하게 만드는 운영 구조.
AHTTY Strategy Ops · 01

에이전트 추론 파이프라인

단순 질의응답을 넘어 분석 → 검색 → 비판 → 수정 4단계 검증을 자연스럽게 포함하는 운영 흐름

4단계 검증 근거 우선 역할 라우팅
AHTTY Strategy Ops · 02

모델별 역할 배치

Draft · Critic · Decision · RAG 역할을 모델 강점 기준으로 분리해 품질 일관성과 비용 효율을 함께 관리

Draft · DeepSeek Critic · Claude RAG · Gemini
AHTTY Strategy Ops · 03

오케스트레이션 보드

초안 → 비판 → 결정 → 근거 연동 핸드오프를 운영 단위로 시각화. 환각 전파 차단 구조

환각 차단 근거 기록 비용 최적화
Company
About AHTTY
AHTTY는 모델을 고르는 시간을 줄이고, 실제 업무에 맞는 선택을 더 빠르게 내릴 수 있도록 설계된 AI decision workspace입니다.
엄선된 AI 모델 성능 비교, 연결 상태, 벤치마크 참조를 하나의 흐름으로 묶는 것이 핵심 방향입니다.
Strategy Ops · Operating Playbook

AI를 똑똑한 팀처럼일하게 만드는 운영 구조.

단일 모델에 의존하지 않고 Draft · Critic · Decision · RAG 역할을 나누어, 4단계 검증 흐름으로 품질과 비용을 함께 관리합니다.

0단계 검증
분석 → 검색 → 비판 → 수정
0역할 라우팅
모델 강점 기준 배치
0환각 전파
역할 분리로 차단
01
Pipeline

에이전트 추론 파이프라인

단순 질의응답을 넘어, 검증을 자연스럽게 포함하는 운영 흐름.

1
분석
Analyze

문제 정의와 성공 조건을 먼저 고정합니다. 입력이 부족하면 추정하지 않고 명시합니다.

2
검색
Retrieve

RAG 데이터 기반으로 내부 문서·데이터를 신뢰 가능한 근거로 수집합니다.

3
비판
Critique

과장·모순·누락을 AI가 스스로 점검합니다. 자기검증이 첫 번째 안전장치입니다.

4
수정
Revise

비판 결과를 반영해 정확한 답안으로 보정합니다. 변경 이력을 함께 기록합니다.

02
Model placement

모델별 역할 배치

모델 성격에 맞춰 역할을 분리하면 품질 일관성과 비용 효율을 함께 관리할 수 있습니다.

모델 추론 스타일 강점 관찰 포인트 추천 역할
GPT-5.4 · Claude 4.6 OpusOpenAI · Anthropic 대규모 추론과 고난도 의사결정 정리에 강함 복합 전략 판단, 트레이드오프 최적화 안정성 최종 검토 / 전략 정리
Gemini 3.1 Pro · Claude 4.6 OpusGoogle · Anthropic 설명 가능성이 높고 검증 문장 품질 우수 과장·금칙어·가이드 위반 탐지 설명성 Critic 에이전트 / 정책 감사
Gemini Flash · Claude Sonnet · GPT miniGoogle · Anthropic · OpenAI 긴 문맥, 멀티소스 검색 결합에 강함 시장 데이터, 트렌드, 문서 탐색 탐색력 RAG / 데이터 공급 에이전트
DeepSeek V3.2 · Gemini Flash LiteDeepSeek · Google 가성비 중심 생성, 빠른 대량 초안 작성 초안 생산, A/B 카피 대량 생성 속도/비용 Draft 에이전트 / 초안 브루트포스
03
Orchestration

오케스트레이션 보드

초안 → 비판 → 결정 → 근거 연동 핸드오프를 운영 단위로 시각화합니다.

Draft

DeepSeek V3.2 · Gemini Flash

속도 중심. 카피 후보군을 빠르게 생성

Task A · 광고 헤드라인 초안

제품 핵심 가치(USP) 기반 3가지 톤 변형

→ draft_copy.json
Task B · 랜딩 서브카피

45자 제한, 행동 유도 문구(CTA) 포함

→ draft_subcopy.json
Critic

Gemini 3.1 Pro · Claude 4.6 Opus

근거 검증. 과장·표현 리스크·브랜드 위반 탐지

Rule Check

확정·보장·최고 등 과장 표현 자동 탐지 및 플래그

→ critique_report.json
Brand Guard

금칙어·톤 가이드 위반 항목 추출

→ brand_violations.json
Decision

GPT-5.4 · Claude 4.6 Opus

비판 결과 반영 후 최종안 선정 및 근거 설명

Final Selection

CTR 가능성, 리스크, 비용 종합 평가 후 최종 문구 선정

→ final_decision.json
Why this copy?

최종 선택 및 제외된 문구의 논리적 근거 기록

→ decision_rationale.md
RAG

Gemini Flash · Claude Sonnet · GPT mini

시장 데이터와 내부 문서를 함께 연결

Trend Sync

구글 트렌드·경쟁 키워드 데이터 자동 갱신

→ trend_context.json
Knowledge Fetch

제품 FAQ, 가격 정책, 법무 문구 매칭

→ rag_evidence.json
04
Method

파인튜닝 vs 구조

판단력은 구조에서 나오고, 파인튜닝은 맥락 적응을 담당합니다.

파인튜닝이 잘하는 일
  • 브랜드 톤·금칙어·용어집을 일관되게 학습
  • 자주 쓰는 카피 포맷과 문장 스타일 고정
  • 업무 도메인 표현 비용 절감
구조가 특히 도움이 되는 일
  • 근거 검색·자기검증·수정 루프를 일관되게 유지
  • 모델별 역할 분리로 환각 전파 차단
  • 최종 결과에 대한 변경 이력 기록

이 구조는 Compare와 Benchmark에서 라우팅 품질을 검증하는 기준으로 사용합니다.

AHTTY Docs

직접 채워 넣는
AI 운영 기록실.

회사 소개는 About에 간결하게 두고, 최신 모델 뉴스·QLoRA 튜닝 문서·작업 로그처럼 계속 갱신되는 자료는 이곳에 모읍니다. 아래 카드 안의 주석 위치에 원하는 문구, 링크, 요약을 직접 추가하면 됩니다.

Loading

문서를 불러오는 중입니다

Insight 관리자에서 저장된 문서를 확인하고 있습니다.
Editable Area

직접 문구를 넣는 공간

AHTTY의 현재 진행 상황, 새 실험 결과, 사용자에게 보여주고 싶은 안내문을 이 카드에 바로 추가하세요.

사용자 편집 슬롯 아직 공개할 문구가 정해지지 않았습니다. AHTTY의 최신 운영 소식이나 내부 안내를 이곳에 적어두면 됩니다.
Model News

최신 모델 뉴스

새 모델 출시, 가격 변경, 벤치마크 업데이트, 한국어 성능 메모를 쌓아두는 영역입니다.

QLoRA / Tuning

QLoRA 튜닝 문서

데이터셋 구성, 학습 파라미터, 실패 케이스, 튜닝 결과를 사용자가 직접 정리하는 공간입니다.

Research Log

작업 로그와 리서치

Codex, OpenClaw, 모델 비교 실험, 사내 프롬프트 제작 기록을 연결하는 허브입니다.

Draft Pad

브라우저 임시 편집 메모

공개 문구로 확정하기 전, 모델 뉴스나 튜닝 문서 초안을 이곳에서 먼저 정리할 수 있습니다. 저장 내용은 이 브라우저의 로컬 저장소에만 남습니다.

아직 저장된 초안 없음
Arena ELOLMSYS Chatbot Arena 사용자 투표 기반입니다 — 학술 시험 점수가 아닙니다. 가격·context는 OpenRouter Models API, Fast 카테고리는 ahtty Live Bench p95 지연시간 측정값 기준입니다.
Compare workspace
모델 비교
동일한 프롬프트를 여러 AI 모델에 동시에 전송하고, 응답 품질·지연시간·토큰 사용량을 눈앞에서 비교해보세요.
선택됨
프리셋
Compare는 비용 보호를 위해 모델 3개와 낮은 온도를 유지하고, 출력은 기본 1,200토큰·최대 2,000토큰까지 허용합니다.
모델 선택 후비교 실행
동일 조건병렬 전송
결과 표시응답 · 토큰 · 지연시간
요약 테이블
모델제공사지연시간토큰상태
비교를 실행하면 이 테이블이 채워집니다.
결과 대기 중비교 실행 후 결과가 여기에 표시됩니다.
위에서 모델을 선택하고 프롬프트를 입력한 후 비교 실행을 클릭하세요.
AHTTY
Strategy Ops

AHTTY와 함께하고
완벽한 에이전트를 빌드해보세요

계정 생성 시 이용약관에 동의하게 됩니다.

Usage · 이번 달

이번 달 사용량

모든 모델의 토큰 소비량과 API 호출량을 한 곳에서 추적합니다. 매월 1일에 초기화됩니다.

Token Usage
0 / 0
FREE
매월 1일 자동 리셋 0%
현재 플랜 무료
접속 계정
월간 한도 0 tokens
남은 토큰
사용량 정보는 서버 세션이 활성화된 경우 자동으로 동기화됩니다. 로그인하지 않은 상태에서는 게스트 한도가 적용됩니다.
Subscription
플랜 선택
필요에 맞는 플랜을 선택하고, 모든 AI 모델을 한 곳에서 비교하세요.
Basic
Free
₩0
가볍게 시작하며 모델 비교 흐름을 익히는 개인용 플랜입니다.
  • 기본적인 사용량
  • 2개 모델 비교
  • 기본 사이트 접근
  • 사용량 추적
Team
Ultra
₩49,000/월
팀 단위로 모델 사용량과 프롬프트 운영을 관리하는 확장 플랜입니다.
  • Pro의 모든 기능
  • 공유 프롬프트
  • AHTTY app Ultra
  • 사용량 관리
  • 최대 사용량
  • Benchmark / Compare 운영 실험
네이버페이 결제는 현재 준비 중입니다.
구독 신청은 [email protected]으로 문의해 주세요.