본문 바로가기
AI Coding & Tools

기업 코딩의 생산성을 바꾸는 CodeWhisperer Custom Models 설정 노하우

by CodeByJin 2026. 3. 26.
반응형

개발자라면 누구나 한 번쯤 "이 코드는 우리 회사 전용 라이브러리인데, 왜 AI는 자꾸 엉뚱한 공개 오픈소스 방식만 추천할까?" 하는 답답함을 느끼셨을 거예요. 사실 이 부분이 도입 과정에서 가장 번거롭고 신경 쓰이는 지점이죠. 기업 내부의 복잡한 로직이나 보안이 중요한 프라이빗 API를 AI가 제대로 이해하지 못하면, 오히려 추천된 코드를 수정하느라 시간이 더 걸리기도 하거든요. 오늘은 이런 페인 포인트를 해결해주는 'CodeWhisperer Custom Models Enterprise' 훈련법을 아주 쉽게 풀어보려고 합니다.

왜 우리 회사만의 맞춤형 모델이 필요할까요?

일반적인 AI 코드 도우미는 전 세계에 공개된 오픈소스를 학습해서 답변을 줍니다. 하지만 기업용 프로젝트는 다르죠. 우리 팀만 쓰는 유틸리티 클래스, 특정 비즈니스 규칙이 담긴 내부 프레임워크가 핵심이니까요. Custom Models Enterprise 기능을 쓰면 마치 우리 회사 코드만 달달 외우고 있는 똑똑한 신입 사원을 옆에 두는 것과 비슷합니다.

가장 큰 장점은 내부 인프라나 API 명세서를 일일이 뒤져보지 않아도 AI가 문맥에 맞는 내부 코드를 제안해준다는 거예요. 실제로 아마존 내부 데이터에 따르면, 커스텀 모델 적용 시 개발 작업 시간이 약 28% 정도 단축되었다는 결과가 있어요. 단순한 자동 완성을 넘어 '우리 팀의 코딩 스타일'을 그대로 복제하는 수준까지 가기 때문이죠. 개인적으로 이 부분이 업무 효율을 가르는 가장 결정적인 한 끗 차이라고 생각합니다.

훈련 전 반드시 체크해야 할 필수 조건

막상 시작하려고 보면 용어가 참 어렵게 느껴지실 텐데요. 쉽게 말해 '재료'와 '주방'이 준비되어야 합니다. AWS 계정에서 IAM Identity Center를 미리 세팅해두는 것이 첫 번째예요. 기존 Builder ID 방식이 아니라 기업용 계정 관리 시스템을 타야 보안과 권한 제어가 확실해집니다.

  • AWS CodeStar Connections 연결: GitHub, GitLab, Bitbucket 등 리포지토리 접근 권한 확보
  • 데이터 확보: 최소 100만 줄(LOC) 이상의 소스 코드가 권장됩니다. (너무 적으면 학습 효과가 떨어져요)
  • 지원 언어 확인: Java, Python, JavaScript, TypeScript 위주로 준비하세요.
  • IDE 환경: IntelliJ나 VS Code에 최신 버전의 AWS Toolkit이 설치되어 있어야 합니다.

이건 모르면 손해 보는 꿀팁인데, 무작정 모든 리포지토리를 다 넣는 것보다 최근 1~2년 내에 활발히 관리된 '고품질 코드' 위주로 선별해서 넣는 게 훨씬 결과가 좋습니다. 버그가 많은 옛날 코드를 학습하면 AI가 나쁜 습관까지 배워버리거든요.

단계별 커스텀 모델 훈련 가이드

준비가 끝났다면 이제 실제 훈련 단계입니다. AWS 콘솔의 CodeWhisperer 메뉴에서 'Customizations' 탭을 이용하면 됩니다. 여기서 'Create customization' 버튼을 누르고 미리 연결해둔 리포지토리를 선택하면 절반은 성공입니다.

훈련 시간은 코드 양에 따라 짧게는 몇 시간, 길게는 하루 정도 소요됩니다. 표를 통해 훈련 후 받게 될 성적표(평가 지표)를 어떻게 해석해야 할지 정리해 드릴게요. 나에게 맞는 최적의 활성화 시점을 확인해 보세요.

평가 등급점수 구간성능 수준 및 조치 사항
Very Good7 - 10점내부 API와 패턴을 완벽히 이해함. 즉시 현업 적용 권장
Fair4 - 6점어느 정도 도움은 되나 오답 가능성 있음. 보조 용도로 활용
Poor0 - 3점학습 데이터 부족 혹은 품질 저하. 리포지토리 재선정 필요

 
표를 보면 아시겠지만, 사실 7점 이상(Very Good)이 나오지 않는다면 억지로 활성화하기보다 데이터를 보강하는 게 장기적으로 이득입니다. 점수가 낮게 나왔다면 내부 라이브러리 호출이 잦은 핵심 비즈니스 로직 파일을 더 추가해 보세요.

현장에서 유용한 실전 최적화 팁

저도 처음엔 헷갈렸던 부분인데, 모델을 한 번 굽는다고 끝이 아닙니다. 코드는 살아있는 생물처럼 계속 변하니까요. 정기적으로 재훈련(Retraining) 세션을 잡아주는 것이 좋습니다. 특히 신규 프로젝트가 시작되어 대대적인 아키텍처 변화가 생겼다면, 이전 모델은 오히려 방해가 될 수 있어요.

또한, 개발자가 IDE에서 프롬프트를 작성할 때 주석을 구체적으로 다는 습관을 들이면 커스텀 모델의 위력이 배가됩니다. 예를 들어 단순히 "결제 처리"라고 쓰는 대신 "AnyCompany 내부 SDK를 사용하여 미결제 주문 건 처리"라고 명시하면, AI가 학습했던 특정 내부 클래스를 찰떡같이 가져와 제안해주죠.

솔직히 말씀드리면, 모든 팀원에게 한 번에 배포하기보다는 핵심 시니어 개발자 몇 명에게 먼저 테스트 권한을 주고 피드백을 받는 'A/B 테스트' 과정을 거치는 걸 추천합니다. 그래야 실질적인 수락률(Acceptance Rate)을 보며 모델을 다듬을 수 있거든요.

하지만 이런 경우에는 신중해야 합니다

무조건 좋기만 할 것 같지만, 주의할 점도 분명히 있습니다. 만약 회사의 코드베이스가 너무 파편화되어 있거나, 팀마다 코딩 스타일이 극단적으로 다르다면 커스텀 모델이 혼란을 줄 수 있어요. 마치 여러 사투리가 섞인 환경에서 표준어를 배우려는 학생처럼 AI도 갈피를 못 잡게 되는 셈이죠.

또한, 보안상의 이유로 오픈소스 라이선스 검사가 엄격한 곳이라면 '참조 추적기(Reference Tracker)' 기능을 반드시 켜두어야 합니다. 커스텀 모델이 학습 과정에서 혹시라도 포함되었을지 모를 외부 오픈소스와 유사한 코드를 제안할 때, 출처를 명확히 알려주거나 필터링해주기 때문입니다. 이 설정 하나가 나중에 법적 문제를 방지하는 큰 방어막이 됩니다.

결국 핵심은 도구보다 '데이터의 순도'입니다

CodeWhisperer Custom Models를 직접 다뤄보며 느낀 점은, 결국 AI의 성능은 우리가 얼마나 정제된 코드를 먹여주느냐에 달려 있다는 것입니다. 무조건 양이 많다고 좋은 게 아니라, "우리 회사가 지향하는 표준 코드"를 선별하는 과정이 가장 중요하더군요.

처음 설정할 때는 과정이 복잡해 보이고 비용도 걱정되시겠지만, 한 번 제대로 구축해두면 신규 입사자의 온보딩 속도나 전체적인 코드 품질 유지 측면에서 얻는 이득이 훨씬 큽니다. 단순히 타수를 줄여주는 게 아니라, 내부 문서를 찾아 헤매는 '인지적 비용'을 줄여주니까요.

현재 AWS에서는 기업 환경에 맞는 다양한 구독 혜택과 비용 절감 옵션을 계속 업데이트하고 있습니다. 혹시 지금 팀 내에서 코드 컨벤션이 안 지켜지거나 내부 API 활용도가 낮아 고민 중이신가요? 아니면 이미 비슷한 도구를 도입해본 경험이 있으신가요? 여러분의 팀 상황에는 어떤 AI 도우미가 가장 잘 맞을지 궁금하네요.

지금 바로 AWS 관리 콘솔에 접속해서 무료 테스트가 가능한 범위부터 확인해 보세요. 2026년 최신 기준으로는 더 정교해진 보안 스캔 기능까지 통합되어 있어, 이전보다 훨씬 안전하게 도입할 수 있는 적기인 것 같습니다.

깃허브 코발럿 워크스페이스 사용법, 이제는 코딩도 자동화 시대네요

개발자라면 누구나 한 번쯤 "아, 이 귀찮은 보일러플레이트 코드랑 테스트 코드는 누가 대신 안 짜주나?"라는 생각해보셨을 거예요. 사실 이 부분이 가장 번거로우시죠? 기획서 보고 파일 구조

byteandbit.tistory.com

반응형