GitHub Copilot이나 Claude Code와 같은 다른 에이전트 AI들도 유사한 개념을 가지고 있지만, 문서를 다루는 방식과 목적에는 차이가 있습니다.
GitHub Copilot / ChatGPT:
주로 채팅 인터페이스 내에서 답변을 줍니다. 별도의 설계 문서를 자동으로 생성하여 파일로 저장하기보다는, 사용자가 요청할 때만 코드를 제안하거나 설명을 제공합니다. 대화가 끝나면 그 맥락은 서버에 저장되지만, 프로젝트 폴더 안에 구체적인 .md 히스토리 파일로 남지는 않습니다.
Claude Code / Artifacts:
Claude는 'Artifacts'라는 기능을 통해 구조화된 문서(코드, 다이어그램, 계획 등)를 별도의 창으로 보여줍니다. 하지만 이 역시 대화 세션 안에서 보여주는 용도이며, 제가 하는 것처럼 로컬 PC의 특정 경로에 계획(Plan), 작업(Task), 결과(Walkthrough)라는 표준화된 절차에 따라 파일을 영구 보관하는 것은 저와 같은 '에이전틱(Agentic) 워크플로우'를 강조하는 시스템의 고유한 특징입니다.
에이전틱 AI(Antigravity 등)의 차별점:
예측 가능성: 작업을 시작하기 전에 반드시 '구현 계획서'를 작성하여 사용자에게 승인을 받는 절차를 거칩니다. 이는 대규모 프로젝트에서 AI가 실수로 코드를 망치는 것을 방지합니다.
투명성: 작업 중에는 task.md를 통해 실시간 진행 상황을 공유하고, 끝난 뒤에는 walkthrough.md로 무엇을 어떻게 테스트했는지 증명합니다.
영구적 기록: 대화가 끊겨도 로컬에 남은 이 문서들을 통해 다른 시점이나 다른 환경에서도 동일한 맥락을 이어갈 수 있습니다.
요약하자면, 다른 AI들이 주로 **'질의응답'**에 집중한다면, 제가 사용하는 이 시스템은 실제 개발 팀이 일하는 방식처럼 **'기획 - 실행 - 검증 - 기록'**이라는 체계적인 프로세스를 문서로 남기는 데 특화되어 있다고 보시면 됩니다. 사용자님이 README.md에 경로를 기록해 두신 것처럼, 이 기록들은 나중에 프로젝트가 커졌을 때 아주 소중한 자산이 될 것입니다.
제미나이의 모델간 차이
같은 제미나이(Gemini) 제품군이라도 모델의 버전과 체급(Size)에 따라 작업의 깊이와 정확도에서 분명한 차이가 발생합니다.
사용자님이 방금 선택하신 Gemini 3 Flash와 같은 최신 모델을 기준으로 설명드리면 다음과 같은 차이점이 있습니다:
추론 능력 (Reasoning):
버전이 올라갈수록 복잡한 코드를 읽고 그 사이의 논리적 연결 고리를 찾아내는 능력이 뛰어납니다. 예를 들어, "이 코드가 다른 파일의 어떤 변수에 영향을 줄까?" 같은 연쇄적인 고민을 더 깊게 할 수 있습니다.
지시 이행 (Instruction Following):
지금 제가 수행하고 있는 **'구현 계획서 작성 -> 사용자 승인 -> 작업 실행'**과 같은 복잡한 에이전틱 프로토콜을 얼마나 엄격하고 정확하게 지키느냐가 모델 성능에 달려 있습니다. 낮은 버전의 모델은 가끔 단계를 건너뛰거나 지침을 잊어버릴 수 있지만, Gemini 3 같은 상위 모델은 이 프로세스를 매우 안정적으로 유지합니다.
컨텍스트 이해도 (Context Window):
최신 모델일수록 한 번에 읽을 수 있는 파일의 양이 많습니다. 프로젝트 전체 구조(@ExtGame)를 머릿속에 통째로 넣고 수작업된 세부 사항까지 기억하며 작업하는 능력은 모델의 체급이 높을수록 강력해집니다.
창의성과 미적 감각 (Aesthetics):
제가 UI를 디자인할 때(예: 이번 FullScreen 버튼의 배치와 스타일) 더 세련되고 현대적인 코드를 제안하는 능력도 모델의 학습 수준에 따라 달라집니다.
요약하자면: 제가 일하는 **'방식(Protocol)'**은 시스템적으로 정해져 있지만, 그 방식을 수행하는 **'두뇌(Model)'**가 업그레이드될수록 더 똑똑하고 실수 없는 파트너가 됩니다. 지금 사용 중이신 Gemini 3 Flash는 속도와 지능의 균형이 매우 뛰어난 모델이라, 앞으로 더 복잡한 기능을 구현할 때 그 진가를 느끼실 수 있을 것입니다.
No comments:
Post a Comment