터보퀀트(TurboQuant)란?
- 구글 리서치, 딥마인드, 뉴욕대, 그리고 KAIST 한인수 교수가 참여한 공동연구팀이 개발한 차세대 양자화 알고리즘이다. 3월 24일(현지시간) 구글 리서치 블로그를 통해 논문이 공개되었다.
- LLM이 대화 문맥을 기억하기 위해 사용하는 'KV 캐시' 메모리를 압축하는 기술로, 같은 작업을 하면서도 메모리 사용량을 6분의 1로 줄이고 속도를 크게 높일 수 있다는 것이 구글의 설명이다.
- 기존 양자화 기술이 압축 과정에서 추가 오버헤드가 발생하는 한계를 갖고 있었는데, 터보퀀트는 폴라퀀트(PolarQuant)와 QJL이라는 이중 구조를 통해 이 문제를 수학적으로 제거했다고 주장
시장 충격
- 터보퀀트 공개 이후 삼성전자, SK하이닉스, 한미반도체의 시가총액이 이틀 사이 109조 원 넘게 사라졌다.
- G-News 미국에서도 마이크론이 3.4%, 샌디스크가 3.5% 하락 Mt하는 등 메모리 반도체주가 일제히 약세를 보였고, 일각에서는 이를 '구글판 딥시크 모멘트'로 불리기도 한다.
업계 반응: "과도한 우려"가 우세
- 대체로 전문가들 사이에서는 낙폭이 과하다는 시각이 지배적이다.
- 터보퀀트는 AI 학습이 아닌 서비스(추론) 단계의 효율을 높이는 기술이므로 고성능 GPU 수요와는 결이 다르다는 지적이 있고,
- 글로벌 AI 메모리 수요 자체가 기하급수적으로 늘어나고 있어, 메모리 사용량을 6분의 1로 압축하더라도 팽창하는 절대적 수요를 얼마나 상쇄할 수 있을지 불투명하다 분석도 있다.
- 효율성이 높아지면 역설적으로 AI 총수요가 증가하는 '제번스 역설'이 작용할 가능성도 제기된다.
향후 전망
- 다음 달 브라질에서 열리는 구글 행사에서 터보퀀트의 구체적 자료가 나올 것으로 예상되며, 오픈소스 커뮤니티에서는 발표 24시간 만에 주요 AI 라이브러리에 이식을 시작하는 등 기술적 관심이 빠르게 확산되고 있다.
- 구글이 피지컬 AI나 로보틱스 분야에서 터보퀀트를 발전시킬 가능성도 거론되는 중.
- 요약하면, 기술 자체는 메모리 효율 면에서 혁신적이지만 아직 논문 단계이고, 실제 상용화까지는 시간이 필요하하며, 시장 반응은 단기 차익실현 명분으로 작용한 측면이 크다는 해석이 우세하다고 보는 입장.