AI 글쓰기 어색한 이유, 규칙이 아니라 모델 문제였다

AI에게 한국어 글을 맡기면 특유의 어색함이 반복된다. em-dash가 나오고, 가운데점이 붙고, ‘새고’ ‘눌린다’ ‘박는다’ 같은 번역투 표현이 자꾸 등장한다. 클로드 사용자들 사이에서는 ‘박는다’가 대표적인 AI 말투로 알려져 있다. 규칙을 적어둬도 잘 안 사라진다. AI 글쓰기 어색함의 원인은 규칙보다 모델 쪽에 있다.

이 문제를 한참 붙들었다. 규칙을 더 명확하게 적으면 나아질 줄 알았다. 줄여보고, 다시 다듬어봤다. 조금 나아지기는 했지만 어색함은 사라지지 않았다.

em-dash, 가운데점, ‘새고’. AI 글쓰기 어색함에는 반복되는 패턴이 있다

어떤 단어와 기호가 문제인가

AI가 한국어로 글을 쓰면 특유의 기호와 어휘가 반복된다. 대표적인 게 em-dash와 가운데점이고, ‘~가 새고’ ‘~에 눌린다’처럼 자연스럽지 않은 동사도 자주 나온다. 한국어 문서에서는 잘 쓰지 않는 것들이다.

직접 목록을 만들어보면 꽤 길어진다. 그리고 같은 단어가 반복해서 나오는 걸 보면 모델이 특정 표현을 선호한다는 게 느껴진다.

AI 글쓰기 어색함이 글에서 특히 눈에 띄는 이유

평소 대화에서는 어색한 문장이 나와도 크게 거슬리지 않는다. 맥락이 있으니 어색한 표현이 지나쳐도 눈에 덜 띈다.

반면 글에서는 다르다. 독자는 문장 하나하나를 읽는다. 같은 표현이 한 번만 나와도 신경 쓰인다. 대화와 글의 맥락이 그 차이를 만든다.

규칙으로 막으려고 할 수 있는 건 다 해봤다

CLAUDE.md에 금지라고 적었는데도 나왔다

규칙 파일(CLAUDE.md)에 ’em-dash 금지’, ‘가운데점 사용 금지’를 명시했다. 처음엔 줄어드는 것 같았다. 그런데 계속 쓰다 보면 다시 나오기 시작한다.

코드 규칙은 다르다. ‘함수 하나에 역할 하나’처럼 구체적으로 적으면 대체로 따른다. 그런데 글쓰기 금지 규칙은 결국 다시 등장한다.

줄이고 명확하게 해봤는데 결과는 비슷했다

규칙이 너무 많아서 그런 건 아닐까 싶었다. 그래서 규칙을 줄이고, 남은 것들을 최대한 명확하게 다듬었다. 어색함이 조금 줄기는 했다. 하지만 근본적으로는 같았다.

결정적인 단서가 하나 더 있다. 규칙이 거의 없는 일반 대화에서도 같은 표현이 나왔다. AI 글쓰기 어색함의 원인이 규칙이 아니라는 걸 그때 확인했다.

범인은 모델이다

em-dash와 가운데점은 영어에서 온다

em-dash는 영어 문어체에서 자주 쓰는 기호다. 가운데점도 영어 텍스트에 드물지 않다. 반면 한국어 문서에서는 두 기호 모두 흔하지 않다.

모델이 영어 데이터로 많이 학습했다면, 글을 생성할 때 그 패턴이 그대로 나온다. 규칙으로 금지한다고 해서 학습된 경향이 바뀌지는 않는다. AI의 트랜스포머는 다음 토큰을 확률적으로 예측하는 구조라, 규칙보다 학습 데이터의 패턴을 먼저 따른다.

오푸스는 코딩 최적화 모델이다

오푸스의 대표 지표는 코딩 벤치마크 점수다. 에이전트 코딩, 복잡한 추론, 장시간 자율 작업에 강점이 있다(출처). 한국어 글쓰기는 그 최적화의 핵심 대상이 아니다.

내 체감으로는 버전이 올라갈수록 한국어 글쓰기가 더 어색해졌다. 코딩 성능을 높이는 방향으로 모델이 발전하면서 글의 자연스러움은 상대적으로 우선순위가 낮아진 것 같다.

클로드와 대화할 때도 ‘새고’, ‘눌린다’가 나왔다

어색함이 모델에서 온다는 걸 가장 직관적으로 보여주는 증거가 있다. 글쓰기 시스템을 기획하면서 나눈 대화에서 클로드가 ‘새고’, ‘눌린다’, ‘단단하다/무르다’ 같은 표현을 직접 썼다. 규칙도 없고 글을 쓰는 상황도 아니었다.

결국 막는 게 안 된다는 이야기다. 어색함의 원인이 규칙이 아니라 모델 자체라는 걸 그 대화가 보여줬다.

막지 말고 쓰고 나서 잡아낸다

어색 어휘 리스트가 하는 일

어색한 표현이 나올 때마다 따로 기록해둔다. 그러면 다음번에 같은 단어가 나왔을 때 바로 잡아낼 수 있다. 목록이 길어질수록 검수 속도가 빨라진다.

누적 횟수도 함께 적어두면 어떤 표현이 자주 반복되는지 패턴이 보인다. 같은 단어가 반복해서 올라오면 특히 신경 쓰게 된다.

검수를 따로 두면 뭐가 달라지나

생성과 검수를 같은 단계에서 처리하려고 하면 둘 다 엉성해진다. 예컨대 모델에게 쓰면서 동시에 고치도록 시키면 글이 어색해지거나 규칙 때문에 문장이 뻣뻣해진다.

쓰는 단계와 검수 단계를 분리하면 각자의 역할이 명확해진다. 어색 어휘 리스트를 들고 검수 패스를 따로 돌리는 게 지금 쓰는 방식이다.

AI로 계속 쓸 거라면 검수 루틴을 만들어라

모델이 어색한 한국어를 쓰는 건 규칙으로 해결되지 않는다. 코딩과 달리, 글쓰기는 금지 규칙을 적어둬도 비슷한 표현이 계속 나온다.

어색함의 원인을 모델 쪽에서 찾고 나면 접근이 달라진다. 막으려고 힘 쏟는 대신, 나온 걸 잡아내는 쪽으로 에너지를 옮기게 된다. AI 글쓰기 어색함을 줄이는 현실적인 방법이 어색 어휘 리스트와 검수 패스다.