
키미 클로 역시 완벽한 무결점의 시스템은 아니며, 장시간의 실제 워크플로우에 투입되었을 때 드러나는 고질적인 약점들이 존재한다. 레딧 등 커뮤니티의 장기 사용자 후기를 분석해 보면, 24시간 이상 연속으로 에이전트를 가동하고 사용자 권한이나 읽기 전용 API 키 등 방대한 개인 컨텍스트를 주입했을 때 심각한 기억 상실 현상이 발생한다는 지적이 공통으로 제기된다. 256K라는 방대한 컨텍스트 윈도우를 지니고 있음에도 불구하고, 복잡한 대화가 길어지면 이전에 지시했던 핵심 가이드라인이나 중요한 변수들을 잊어버리고, 심지어 가장 높은 논리 수준을 요구하는 xhigh 사고 모드(Thinking mode)에서도 전혀 예상치 못한 엉뚱한 결과물을 도출하는 일관성(Consistency) 저하 문제가 나타난다. QMD와 같은 시맨틱 검색(Semantic search) 도구를 연동하여 기억력을 보완하려는 시도가 있으나, 여전히 기업의 핵심적인 메이저 업무를 전적으로 맡기기에는 신뢰성이 부족하다는 평가가 주를 이룬다. 또한 키미 클로의 가장 큰 자랑인 에이전트 스웜 기술 역시 양날의 검으로 작용할 때가 있다. 단순한 작업이 아닌 고도로 복잡하고 얽힌 아키텍처 작업을 지시했을 때, 시스템이 지나치게 많은 하위 에이전트를 무분별하게 생성하다가 에이전트 간의 작업 라우팅과 의존성 관리에서 충돌이 발생하여 전체 프로세스가 끔찍하게 실패(Failed horrifically)하는 현상이 심심치 않게 보고된다. 파일 전송이나 시스템 간의 복잡한 연동이 필요한 어려운 과제에서는 아직 기술적 한계가 뚜렷하며, 이를 극복하기 위해 클로허브 생태계의 스킬들을 도입해 보아도 여전히 전반적인 다듬어짐(Polish)이 부족하여 실무 적용에 마찰이 발생한다. 더불어, 코딩 분야에서의 탁월한 성과와 달리 텍스트 생성의 언어적 뉘앙스나 창의적인 디자인 결과물 도출에 있어서는 오히려 제미나이나 클로드 라인업의 감각적인 처리 능력에 미치지 못한다는 일부의 평가도 존재한다. 투명성 측면에서도 K2.5 모델을 기반으로 훈련되었으나 에이전트 기능 자체는 클로즈드 소스(Closed source)로 운영되며, 안전성 평가나 외부 기관의 레드팀(Red-teaming) 검증을 거친 내부 문서가 공개되지 않아 예측할 수 없는 환각이나 시스템 오류에 대한 보호 장치(Guardrails)가 미비하다는 점은 엔터프라이즈 환경에서의 대규모 도입을 망설이게 하는 요소다. 따라서 개발자 친화적이고 깊이 있는 분석 능력을 제공하지만, 장기적인 메모리 관리와 에이전트 간의 조율 로직은 2026년 현재 여전히 해결해 나가야 할 숙제로 남아있다.
한국어






