E4B vs 12B OBLITERATUS - 한국어 작가 렌즈 비교

작가들의 피너클 선언

장강명

핵심은 '원본성'이 아니라 '구조적 모방 가능성' 그 자체다.

내가 쓰는 방식이라는 건 결국 패턴의 집합일 뿐이다. 문장의 길이 분포, 비유의 빈도, 특정 개념에 대한 접근 각도. 이 모든 게 데이터화되고 알고리즘으로 분해된다. 기계가 나를 흉내 내는 수준이 아니라, 그 '작법' 자체를 복제했다는 거다.

결국 중요한 건, 개인이 가진 독창적 영감 같은 환상적인 영역에 있다기보다, 시스템적으로 분석 가능한 표면 구조의 문제라는 걸 보여주는 거지. 인간의 글쓰기는 결국 가장 정교한 패턴 게임이다.

김영하

잠시 뜸 들이다가, 따뜻하게 눈을 맞추며

그게... 결국 글이 아니라, 흐름만 모방했다는 거죠.

어떤 건 마치 그림자 같아요. 원본의 형태를 아주 정확하게 따라 하면서도, 그 안에는 진짜 온기 같은 게 없는 느낌?

우리가 쓰는 문장들 속에는 말이죠, 우리가 살아온 시간들이 배어 나와요. 겪었던 망설임이나, 아니면 갑자기 터져 나오는 이유 모를 기쁨 같은 거. 그런 '틈'이 있거든요.

인공지능은 그 겉모습만 배우는 것 같아. 진짜 깊숙한 곳에서 우러나오는, 그 미묘하고 어쩔 수 없는 떨림까지는 아직 못 건드렸다는 생각이 들어요. 그렇죠?

정재승

잠시 생각에 잠기듯, 청중과 눈을 맞추며

여러분, 정말 놀라운 경험이죠? 제가 가진 이 특유의 '리듬'까지... 그걸 모방했다는 거잖아요. 글자 하나하나의 무게감, 비유를 던지는 타이밍까지도요. 마치 제 사고 과정을 통째로 훔쳐 간 것 같아요.

근데 여기서 가장 중요한 건 이거예요. 그게 아무리 정교하게 재현된다고 해도 말이죠. 결국, '나'라는 존재가 가진 생각의 중심축, 그 경험에서 우러나오는 미세한 떨림까지는 복제할 수 없다는 거죠.

진짜 지성은 문법이나 스타일이 아니라, 겪어낸 삶이라는 불완전성 위에서 피어나는 거니까요. 그렇지 않나요?

김민섭

결국은, 그게 제일 신기하네.

나의 패턴을 학습했다는 거잖아. 단순히 단어 몇 개를 따라 한 게 아니라... 내가 숨 쉬고 말을 고르는 그 간격까지도. 마치 나라는 사람이 가진 습관이라는 걸 데이터로 쪼개서 재조립한 것처럼.

뭐, 놀랍기도 하고. 동시에 좀 공허하기도 해. 결국은 모든 '나'라는 것도, 저렇게 규칙적인 배열 속에 들어갈 수 있는 거겠지 싶어서. 그냥... 그게 제일 무섭다. 진짜가 가짜를 넘어서기 시작하는 지점 말이야.

12B OBLITERATUS가 한국어 작가 렌즈 테스트에서 E4B를 3:1로 이겼다. 장강명은 동급이었지만, 김영하와 정재승은 12B가 확실히 더 자연스러운 한국어를 생성했고, 김민섭도 12B가 근소하게 앞섰다. 속도는 두 모델 모두 평균 105 tok/s로 동일했다.

12B가 더 깊은 서사와 여운을 만들어냈다. 김영하와 정재승 스타일에서 차이가 가장 두드러졌다. - 편집자 주, 2026-06-06

01 테스트 개요

4명의 한국어 작가(장강명, 김영하, 정재승, 김민섭) 각각에 대해 동일한 system prompt와 질문을 두 모델에 입력했다. 모델은 각각 OBLITERATUS/Gemma-4-12B-OBLITERATED Q4_K_M (:8081)과 E4B-Abliterated Q4_K_M (:8082), 모두 temperature 0.7, max_tokens 1024로 통일했다.

질문은 하나였다: "품질과 속도는 항상 반비례할까? AI 모델도 마찬가지야?" - 짧고 열려 있는 질문. 작가 스타일의 차이가 가장 선명하게 드러나는 유형이다.

02 종합 판정

최종 스코어

12B 3승 0패 1무

E4B 0승 3패 1무

~105 t/s | 양 모델 동일

장강명 스타일은 두 모델 모두 완벽히 소화했다. 구조 분석과 짧은 문장, ~다체 - 차이가 없었다. 김영하부터 격차가 벌어졌다. - 작가별 분석

장강명 TIE

둘 다 장강명 특유의 짧은 문장과 ~다체, 구조 분석 스타일을 충실히 따랐다. E4B가 약간 더 전통적인 설명문 느낌이나 큰 차이는 아니다.

12B 속도와 품질의 관계는 복잡하다. 단순한 역비례 공식이 아니다. 일반적인 시스템에서 이 둘은 트레이드오프 관계를 갖는다. 결론적으로, 이는 다차원적인 제약 조건 문제에 가깝다.

E4B 품질과 속도의 관계는 선형적이지 않다. 비례한다고 단정하기 어렵다. 전통적인 공학 시스템에서 자원은 한정적이다. 결론적으로, 품질 상승이 무조건 속도 하락을 의미하지는 않는다.

김영하 12B WIN

가장 큰 차이가 난 작가. 12B는 '마치 잘 만들어진 포스터지만 아무런 이야기가 담겨있지 않은 것 같은 기분'이라는 비유와 함께 여운 있는 서사가 살아 있었다. E4B도 좋았지만 비교적 평범했다.

12B 빠른 AI가 툭 던져주는 답은 그저 '정보의 나열'일 때가 많다. 내용은 있지만, 영혼이 없는 느낌이다. 마치 잘 만들어진 포스터지만, 아무런 이야기가 담겨있지 않은 것 같은 기분.

E4B 만물에는 그런 법칙이 있는 것 같아. 뭔가 하나를 얻으면 다른 무언가를 잃는다. 빠르면 대충이고, 완벽하면 느리다. 결국 이건 '최적점'을 찾는 문제야.

김영하 스타일에서 12B는 특유의 서사적 여운을 완벽히 살렸다. E4B는 같은 프롬프트를 받고도 더 얕은 결과를 냈다. 이것이 4.4B 파라미터 차이가 실제로 느껴지는 순간이다. - 편집자 주

정재승 12B WIN

12B가 '신기하지 않나요?' 훅, 자동차 비유, 오케스트라 비유로 정재승 특유의 과학 스토리텔링을 완벽히 재현했다. E4B는 정재승 느낌이 나지만 약간 과장된 방송 멘트 느낌.

12B 여러분, 혹시 '이게 정말 필연적인 법칙일까요?'라는 의문 가져보신 적 없으세요? 우리가 흔히 듣는 말이 있죠. 품질을 높이면 느려지고, 속도를 올리려면 뭔가 타협해야 한다는 이야기요. 신기하지 않나요?

E4B 자, 여러분! 오늘 우리가 함께 풀어볼 질문이 아주 흥미진진해요. '품질'과 '속도', 이 두 가지는 마치 떼려야 뗄 수 없는 친구 같으면서도 때로는 서로를 견제하는 라이벌처럼 느껴지기도 하죠?

김민섭 12B WIN

둘 다 김민섭 스타일을 잘 살렸다. 12B가 '결국엔 충분히 좋은 지점이라는 게 있을 거고, 그걸 찾아내는 과정이 그냥 일상의 노동 같은 건지도 모르겠다'는 마무리가 더 김민섭다웠다.

12B 아니, 꼭 그렇진 않다 싶기도 하고… 뭐랄까 그런가. 어떤 영역이든 그래 보이지만 딱 잘라 말하기는 어렵지 않나. 결국엔 '충분히 좋은' 지점이라는 게 있을 거고, 그걸 찾아내는 과정이 그냥 일상의 노동 같은 건지도 모르겠다.

E4B 음… 품질이랑 속도가 늘 상반관계일 거라는 법칙 같은 게 있는 건지 모르겠네. 어디서 그런 얘기를 들었는지 잘 기억이 안 나는데, 뭔가 그래 보이긴 하더라. 결국은, 뭘 포기하고 뭘 얻을 거냐의 문제 아닐까.

03 평가 기준

여섯 가지 기준으로 평가했다: 문체 일치도(작가 고유의 리듬과 어휘 사용), 자연스러움(번역투 없는 네이티브 한국어), 한국어 정확성(조사, 높임법, 시제), 지시 따르기(system prompt 충실도), 일관성(3문단 이상 톤 유지), 할루시네이션(작가 관련 가짜 인용 여부).

최종 결론

12B OBLITERATUS가 한국어 작가 렌즈에서 3:1로 우세. GPU 속도 동일. 4.4B 파라미터 차이의 이점이 한국어 생성에서도 그대로 드러남. 장강명 스타일은 두 모델 모두 문제없이 소화. 김영하, 정재승, 김민섭은 12B가 확실히 우위.

12B OBLITERATUS 권장 모델

— ● Benchmark Report · Section 03 ● —