AI 시대의 기본 단위가
바뀌었습니다:
토큰이 싸질수록
총비용이 폭등하는 이유
컴퓨터 시대의 기본 단위는 비트였어요. AI 시대의 기본 단위는 토큰입니다. 이 전환이 투자자에게 어떤 의미인지, 제본스의 역설로 풀어볼게요.
AI가 언어를 이해하는 방법, 그리고 토큰이 기본 단위가 된 이유
LLM이 인간의 문장을 그대로 이해하지 못한다는 사실, 알고 계셨나요? 이게 토큰 경제가 작동하는 근본 원리예요.
LLM(Large Language Model)이란 방대한 텍스트 데이터를 학습해 인간의 언어를 이해하고 생성하는 AI의 핵심 엔진이에요. 그런데 이 모델은 인간의 문장을 그대로 이해하지 못합니다. 그래서 등장한 개념이 토큰화(Tokenization)예요. 자연어 문장을 AI가 처리할 수 있도록 형태소나 접두사 단위로 잘게 쪼개 숫자 배열로 변환하는 과정이에요.
처음 이 개념을 접했을 때 "왜 굳이 쪼개야 하지?"라는 의문이 들었어요. 그런데 이유가 분명했습니다. 인간의 언어 조합은 사실상 무한대에 가깝거든요. 그걸 통째로 학습하면 컴퓨팅 비용이 감당이 안 됩니다. 잘게 분해해서 패턴을 학습하면 훨씬 적은 연산으로 언어 규칙을 추론할 수 있어요. 이게 토큰 경제가 작동하는 근본 원리입니다.
"연봉 50만 달러짜리 엔지니어가 매년 25만 달러어치의 토큰을 소비하지 않으면 위기다."
토큰이 싸질수록 총비용이 폭등하는 이유: 제본스의 역설
처음엔 "설마 AI 시장에도 그대로 적용되겠어?"라는 생각이 들었어요. 그런데 숫자를 보니 반박이 불가능했습니다.
제본스의 역설(Jevons' Paradox)이란 기술 발전으로 자원의 효율이 올라가 단가가 낮아지면, 오히려 그 자원의 총 소비량이 폭발적으로 늘어나는 현상이에요. 19세기 경제학자 윌리엄 제본스가 석탄 기계 효율 개선 후 영국의 석탄 총소비량이 되레 급증한 사실을 보고 정리한 법칙이에요.
이게 무서운 이유는 소프트웨어 효율화도 같은 방향으로 작동하기 때문이에요. MOE(Mixture of Experts) 구조는 질문의 성격에 맞는 전문 파라미터만 선택적으로 깨워 연산해요. 수학 문제엔 수학 전문 뉴런만, 언어 처리엔 언어 전문 뉴런만 씁니다. 여기에 모델 양자화(Model Quantization) 기술이 더해지면서 토큰 단가는 계속 낮아지지만, 제본스의 역설에 의해 총 소비량은 그보다 훨씬 빠르게 늘어나는 구조가 굳어지고 있어요.
토큰 단가가 내려가면 AI 관련 주식이 조정받을 것이라고 보는 시각도 있어요. 하지만 제본스의 역설이 현실화되는 구조에서는 단가 하락이 곧 수요 폭발로 이어집니다. 그 폭발한 수요를 물리적으로 감당하려면 HBM과 저전력 반도체, 차세대 패키징 기술이 필수예요.
개념이 아닌 출하량(Q)에 투자해야 한다는 원칙이 여기서 나옵니다.
- 에이전틱 AI의 실제 상용화 건수를 추적하세요. 금융·의료·제조 현장에서 에이전트 AI가 정규 서비스로 탑재된 사례가 늘고 있는지가 수요 폭발의 선행 지표예요
- 엔비디아 블랙웰 분기별 TPS 성능 향상 수치를 공시 자료에서 직접 확인하세요. 전작 대비 토큰 처리 속도 향상이 실제 수요 증가로 연결되는 속도가 핵심이에요→ blogs.nvidia.com
토큰 경제에서 돈의 흐름을 읽는 법
개념이 아닌 출하량(Q)에 투자해야 합니다. 이게 이 주제를 파고들수록 명확해진 원칙이에요.
제본스의 역설이 현실화되는 구조에서 폭발한 수요를 물리적으로 감당하려면 HBM(High Bandwidth Memory)과 저전력 반도체, 차세대 패키징 기술이 필수입니다. HBM이란 기존 DRAM보다 데이터 전송 속도가 수십 배 빠른 고성능 메모리로, AI 추론 연산의 병목을 해소하는 핵심 부품이에요.
AI가 수조 개의 토큰을 소비하고도 결과물의 품질이 기대에 못 미칠 경우, 기업들의 ROI 의구심이 커지면서 투자 동결로 이어질 수 있어요. 골드만삭스도 이 회의론을 공개 리포트로 제기했습니다.
또한 알고리즘 효율화가 예상보다 빠르게 진행되면 하드웨어 증설 필요성이 줄어드는 시나리오도 배제할 수 없어요. 제본스의 역설이 작동하더라도 그 속도가 예측대로 유지되는지는 계속 확인해야 합니다.
제가 실제로 체크하는 3가지 포인트
토큰 경제의 흐름을 숫자로 추적하는 방법이에요. 개념이 아닌 수치로 판단하는 게 핵심입니다.
- 엔비디아 블랙웰 TPS 공식 수치를 직접 확인하세요. 전작 대비 65배 토큰 출력량 증가가 실제 수주로 연결되는 속도가 핵심이에요→ blogs.nvidia.com
- 골드만삭스 AI 투자 효율성 회의론 리포트를 직접 읽어보세요. 반론의 근거를 이해해야 리스크 시나리오를 준비할 수 있어요→ goldmansachs.com/intelligence
- SK하이닉스·삼성전자 HBM 수주 잔고를 분기별로 추적하세요. 토큰 소비량 폭발의 직접 수혜가 장부에 반영되는 속도를 확인하는 기준이에요
토큰이 쏟아지는 소리가 데이터센터 가동 소리입니다
오랫동안 투자해오면서 패러다임 전환의 초입에서 가장 중요한 건 그 시대의 기본 단위를 먼저 이해하는 거라고 느꼈어요. 인터넷 시대에 클릭이 돈이 됐고, 모바일 시대에 다운로드가 돈이 됐습니다. AI 시대엔 토큰이 돈이에요.
토큰 단가가 내려갈수록 총 소비량이 폭발하는 제본스의 역설이 현실화되고 있어요. 이 구조에서 돈을 버는 곳은 개념을 설명하는 AI가 아니라, 그 AI가 쏟아내는 토큰을 물리적으로 처리하는 HBM·패키징·전력 관리 인프라입니다.
"토큰이 쏟아지는 소리가 곧 데이터센터 가동 소리"라는 표현이 과장처럼 들렸는데, 숫자를 보고 나니 꽤 정확한 묘사라는 걸 인정할 수밖에 없었어요. 이 흐름이 보이기 시작하면, 투자의 방향도 보입니다.