DeepSeek V4의 출시는 작년의 열풍을 재현하지 못했습니다. 사실, 6개월 전에 출시된 Claude Sonnet 4.5와 비교했을 때, 그 성능은 대략 비슷한 수준이지만, 그 격차는 6개월보다 훨씬 더 큽니다. Sonnet 4.5는 반년 전만 해도 2류로 여겨졌기 때문입니다. 하지만 소셜 미디어 게시글에서는 중국의 대형 모델이 점점 더 아름다운 벤치마크 데이터를 생산하고 있으며, "단 6개월 차이" 또는 "사실상 따라잡았다"는 주장이 곳곳에서 들려옵니다.
중국과 미국 간의 AI 격차에 대한 실제 상황은 어떨까요?
4월 22일, "Into Asia" 팟캐스트에서 베이징 대학교 AI 조교수인 Zhang Chi가 자신이 보는 현실을 솔직하게 이야기했습니다. Zhang Chi는 현재 베이징 대학교 조교수이며, 최근 ByteDance의 핵심 대형 모델 팀(Seed LLM)에서 사임했습니다.
실제로 대형 기술 회사의 최전선에서 일한 연구개발 전문가로서, 그가 현재 국내 AI에 대해 내린 평가는 상당히 날카롭습니다.
"저는 중국 모델이 따라잡고 있다는 견해에 동의하지 않습니다. 저는 우리가 여전히 한참 뒤쳐져 있으며, 이 격차는 더 벌어지고 있을 수 있다고 생각합니다."
▸ 거짓된 번영: 모두가 '시험 교육'에 몰두하지만, 실제 전투는 부족하다
외부에서 보면, 각 기술 대기업의 모델은 다양한 벤치마크에서 치열한 경쟁을 벌이며 점수가 계속해서 최고치를 경신하고 있습니다. 그러나 내부적으로 이것은 대규모 모델을 위한 거대한 '입시 위주 교육'에 불과합니다.
Zhang Chi는 인터뷰에서 ByteDance 내부(그리고 다른 대형 기술 회사들도 비슷할 것이라고 추측)의 업무 분위기는 실제로 비교적 '느긋한' 편(점심 시간 2시간, 실제 근무 시간 하루 약 9시간)이지만, 모든 사람이 암묵적인 KPI 압력, 즉 벤치마크 최적화(Bench-maxing) 에 직면해 있다고 밝혔습니다.
리더들은 특정 리더보드에서 모델 점수를 예의주시합니다. 담당 모듈의 점수가 선두 미국 모델의 점수와 일치하지 않으면 성과 평가가 매우 나빠질 것입니다.
결과: 서류상 데이터는 극도로 화려하지만, 복잡한 실제 애플리케이션에 적용하면 경험은 실망스럽습니다.
▸ 컴퓨팅 및 인프라의 격차: 타사는 3개월, 우리는 아마도 반년
하드웨어 병목 현상은 오래된 이야기이지만, 그로 인한 연쇄 반응은 우리가 생각하는 것보다 더 깊습니다.
현재 국내 대기업이 핵심 모델을 훈련하는 데 사용하는 상당 부분은 여전히 수출 금지 전에 비축한 NVIDIA 칩 또는 규정을 준수하는 H20 특별판입니다. 다행히 DeepSeek V4부터는 Huawei Ascend 그래픽 카드로 완전히 전환되어 국내 훈련 생태계가 개선될 것으로 예상됩니다.
하지만 컴퓨팅 파워의 격차는 이미 '반복 속도'에 직접적으로 반영되고 있습니다.
Zhang Chi는 업계 소문을 언급했습니다. Google은 이제 대규모 언어 모델의 사전 훈련 및 사후 훈련 전체 과정을 완료하는 데 3개월밖에 걸리지 않을 수도 있다는 것입니다. 국내 대기업의 경우, 컴퓨팅 파워 규모와 인프라의 제약으로 인해 이 주기가 최대 반년까지 걸릴 수 있습니다.
더욱 은밀한 것은 인프라(Infra) 의 격차입니다. Google에서 인턴 생활을 했던 Zhang Chi는 그곳의 기본 인프라가 너무 잘 구축되어 있어 연구자들이 기본 아키텍처에 대해 걱정할 필요 없이 매끄러운 그래픽 인터페이스에서 코드만 작성하면 된다고 한탄했습니다. 국내 기술 대기업에서는 훈련이 자주 중단되거나 오류가 발생합니다. 이러한 마찰 비용은 눈에 띄지 않게 따라잡는 속도를 늦추고 있습니다.
▸ "사용자들은 모두 미국 모델을 사용하고 있는데, 우리는 개선할 데이터를 어디서 얻을까?"
컴퓨팅 파워가 중국 AI에 드리운 첫 번째 칼날이라면, Zhang Chi의 관점에서 두 번째 칼날, 그리고 현재 가장 해결하기 어려운 칼날은 '데이터 플라이휠'의 단절입니다.
그는 인터뷰에서 매우 날카로운 통찰력을 제시했습니다. 선두 미국 모델은 극복하기 매우 어려운 긍정적인 순환 고리를 구축했습니다. GPT와 Claude는 막대한 글로벌 사용자 기반을 보유하고 있습니다. 이 사용자들은 실제 업무에서 모델을 사용하고 결과에 '좋아요' 또는 '싫어요'를 표시합니다. 이 고품질 피드백은 실제 시나리오를 위한 가장 귀중한 훈련 데이터를 구성합니다.
대조적으로, 기본 성능의 객관적인 격차로 인해 AI 지원이 가장 필요한 고부가가치 사용자, 즉 프로그래머와 하드코어 연구자들이 대거 '이탈' 하고 있습니다.
"저는 이제 주로 Claude Code와 Cursor를 사용하여 프로그래밍합니다."라고 Zhang Chi는 솔직하게 말했습니다. "박사 과정 학생을 많이 고용할 필요성을 느끼지 못할 정도입니다. Claude Code와 Cursor를 완전히 제 학생처럼 대할 수 있습니다. 그들을 지도하고 제가 원하는 것을 하도록 지시할 수 있습니다. 하지만 저는 갈등합니다. 우리 세대가 새로운 인력을 훈련시키지 않으면, 제가 나이가 들었을 때 누가 연구를 계속할까요?"
중국 최고 AI 과학자의 이러한 일상적인 선택은 냉혹한 현실을 반영합니다. 국내 모델에 피드백 데이터를 제공해야 할 중국 최고의 개발자들이 모두 미국 모델을 사용하여 생산성을 높이고 있을 때, 중국의 대규모 언어 모델 회사들은 프로그래밍 및 추론 능력을 최적화하기 위한 고품질 상호 작용 데이터를 어디서 얻을 수 있을까요?
▸ 지름길의 대가: '증류된' 지능에는 영혼이 없다
인프라를 다듬을 시간이 없고 KPI를 따라잡아야 하는 긴박한 압박에 직면했을 때, 국내 대기업들은 어떻게 할까요?
정답은 한 단어입니다: 증류(Distillation).
지능이 높은 모델을 훈련시키는 가장 하드코어한 방법은 매우 전문적인 업계 전문가를 고용하여 고품질 추론 데이터를 한 땀 한 땀 작성하는 것입니다. 이는 비용이 많이 들고 시간도 오래 걸립니다.
하지만 지름길이 있습니다: GPT, Claude 또는 Gemini에 직접 물어보는 것입니다. 정답과 추론 과정을 얻은 후, 이를 복사하여 자체 모델에 공급합니다. 이것이 AI 업계에서 '증류'라고 알려진 방법으로, 본질적으로 우등생의 숙제를 베끼는 것입니다.
Zhang Chi는 우리가 '증류' 기술에서는 이미 세계적 수준일 수 있지만, 장기적으로 이것이 진정한 우위로 이어지지 않을 수 있다고 인정했습니다. 숙제를 베끼면 낙제에서 합격으로, 또는 80점까지 빠르게 올릴 수 있지만, 베끼는 것으로는 진정한 우등생이 될 수 없습니다.
왜냐하면 여러분은 자신만의 깊은 데이터 파이프라인이 부족하기 때문입니다. 외국 모델이 자율적으로 진화하기 시작하면, '지름길'은 오히려 우리의 독창적인 능력을 묶는 족쇄가 됩니다.
▸ 남은 유일한 자신감: 하드웨어와 '체화된 AI'의 꿈
순수 대규모 언어 모델의 추격 가능성에 대해 강한 비관론을 가지고 있음에도 불구하고, Zhang Chi는 여전히 중국 AI 생태계의 몇 가지 구조적 이점을 지적했습니다.
그의 관점에서 이점은 제조업에 있습니다. 그는 최근 대중의 논란을 불러일으킨 Unitree를 언급하며, 중국이 하드웨어 본체와 모터 모션 제어 분야에서 글로벌 경쟁력을 가지고 있다고 믿습니다. 현재 뜨거운 '체화된 AI'에 대해 Zhang Chi의 견해는, 언어 모델이 (물체 잡기와 같은) 비교적 간단한 작업을 수행하는 데만 사용된다면, 기존 중국 대형 모델의 성능으로 '충분히 좋다'는 것입니다.
하지만 그는 또한 냉정한 평가를 내렸습니다. 현재 대다수의 로봇 제조업체는 여전히 '모션 제어' 단계에 갇혀 있으며, 로봇의 두뇌에 진정한 지능을 탑재하지 못했습니다. 복잡한 추론과 일반화된 '정교한 조작'이 관련되면, 우리는 대규모 언어 모델이 현재 직면한 것과 동일한 한계에 부딪힐 가능성이 높습니다.
▸ 미래?
제한된 칩, 취약한 데이터 파이프라인, 뒤처진 인프라, 사용자 피드백 루프 부족, 증류에 대한 과도한 의존—이러한 문제들이 결합되어 단일 기술적 돌파구로 해결될 수 없습니다. 다행히 DeepSeek V4는 국산 그래픽 카드에 완전히 적응했습니다. 전반적인 성능은 다소 뒤처지지만, 생태계가 완성되고 증류에 의존하지 않게 되면 따라잡을 희망은 여전히 있습니다.
원본 팟캐스트 링크: [https://www.buzzsprout.com/2546300/episodes/19057945-a-year-inside-bytedance-s-ai-lab](https://www.buzzsprout.com/2546300/episodes/19057945-a-year-inside-bytedance-s-ai-lab)





