현재 시험 단계에 있는 것으로 전해진 이번 7nm급 신형 칩은 중국 내 생산 전환을 의미하며, CUDA 호환성을 유지한 채 엔비디아의 중국 전용 GPU와 경쟁하는 것을 목표로 하고 있다.

알리바바가 추론 작업을 위해 설계된 새로운 AI 칩을 개발 중인 것으로 전해졌다. 해당 칩은 현재 시험 단계에 있으며, 중국 내에서 생산될 예정이라고 보도됐다.
알리바바는 아직 공정 노드, 전력 효율, 성능 벤치마크 등 구체적인 사양을 공개하지 않았다. 다만 29일 월스트리트저널(WSJ) 보도에 따르면, 이전에 특정 애플리케이션과 워크로드에 맞춰 제작된 칩과 달리, 이번 신제품은 추론 작업을 처리할 수 있는 범용성을 갖출 예정이다.
이번 결정은 알리바바 반도체 전략의 중대한 전환점이기도 하다. 지금까지 알리바바는 대만 TSMC에서 칩을 위탁 생산해왔지만, 앞으로는 자국 내 생산을 추진한다는 것이다. 다만 실제로 어떤 기업이 이를 생산할지는 아직 불확실하다. 현재 중국 내에서 7nm AI 칩을 제조할 수 있는 업체는 SMIC뿐이지만, 이미 화웨이, 비런(Biren), 캄브리콘(Cambricon) 등 경쟁사 물량으로 포화 상태다.
알리바바는 해당 사안에 대한 코멘트 요청에 즉각적인 답변을 내놓지 않았다.
컨설팅 업체 EIIR트렌드앤파리크(EIIRTrend & Pareekh) 컨설팅의 CEO 파리크 자인는 “알리바바의 기존 한광 800 칩(12nm)은 엔비디아 대비 추론 처리량이 40~60% 뒤처졌다”며 “이번 신형 칩은 7nm급으로, 한광 800보다 더 다양한 워크로드에 대응할 수 있도록 설계됐고, 엔비디아의 H800/H20과 경쟁할 수 있을 것으로 예상된다. 다만 플래그십 모델인 H100이나 블랙웰 시리즈에는 못 미친다. 새로운 칩은 추천 시스템이나 언어 처리 같은 추론 워크로드에 최적화된 다목적 제품이 될 것”이라고 설명했다.
반도체 전문 분석 업체 팹이코노믹스(Fab Economics)의 CEO 데니시 파루키는 “알리바바는 칩 수준에서 물리적 한계를 수학적 접근으로 극복할 수 있다”며 “예를 들어 화웨이 클라우드 매트릭스 384 시스템은 엔비디아 블랙웰 B200 대비 성능이 3분의 1에 불과한 어센드 910C 칩을 시스템당 5배 더 투입해, 오히려 시스템 전체 성능에서는 엔비디아 GB200 NVL72보다 50% 높은 PFLOP 성능을 낸다”고 설명했다.
전문가들은 이번 알리바바의 AI 칩이 화웨이 어센드 910B 및 910C의 한계를 보완할 수 있을 것으로 보고 있다. 신형 칩은 엔비디아 CUDA와 파이토치(PyTorch) 생태계와 호환될 것으로 예상되기 때문이다.
카운터포인트리서치의 부사장 닐 샤는 “엔비디아의 지배력은 하드웨어에만 있는 것이 아니라, 특히 CUDA 중심의 강력한 소프트웨어 생태계에 있다”며 “완전한 호환성 계층이 구축된다면 개발자들은 새로운 파편화된 소프트웨어 스택(화웨이 마인드스포어(MindSpore), 바이두 패들패들(PaddlePaddle) 등)을 학습하는 부담 없이 기존 코드를 손쉽게 이식할 수 있다. 맞춤형 칩의 소프트웨어 개발과 최적화는 주요 병목으로 꼽힌다”고 전했다.
지정학적 압력과 전략
알리바바는 오랫동안 엔비디아 AI 칩을 사용해왔지만, 최근 몇 년간 강화된 미국의 수출 규제가 알리바바로 하여금 자국 내 반도체 전략을 가속화하도록 만들었다.
2022년 10월, 미국은 첨단 반도체의 대중국 수출을 제한했다. 이에 엔비디아와 AMD는 수출 규제를 준수할 수 있도록 성능을 축소한 GPU를 내놨지만, 이후 이들 제품마저도 라이선스 장벽에 부딪혔다.
올해 4월, 도널드 트럼프 당시 행정부는 엔비디아에 H20 프로세서를 중국에 판매할 수 있는 수출 라이선스를 승인했다. 그러나 석 달도 채 지나지 않아 미국 정부는 희토류 핵심 광물 협정의 일환으로 H20 AI 칩의 대중국 판매를 재개한다고 발표했다. 이후 중국 CAC(China’s Cyberspace Administration)는 H20 칩에 잠재적으로 탑재된 추적 및 원격 차단 기능과 관련한 중대한 보안 문제를 이유로 엔비디아 관계자를 소환했다.
팹이코노믹스의 파루키는 “2023년 조셉 차이 알리바바 회장은 첨단 컴퓨팅 칩에 대한 미국 수출 규제가 초래한 불확실성 때문에 알리바바 클라우드 사업부 분할을 중단했다고 언급했다”라며 “그는 네트워크화된 대규모 클라우드 컴퓨팅 서비스에 대한 AI 기반 수요를 토대로 한 지속 가능한 성장 모델 구축에 집중했다. 알리바바의 신형 AI 칩은 이러한 성장 모델의 결과물이며, 미국 제재에 대응하기 위한 것”이라고 설명했다.
중국의 AI 반도체 경쟁
알리바바의 신형 AI 추론 칩 개발은 중국이 자급적 반도체 생태계를 구축하는 과정에서 또 하나의 이정표로 평가된다. 현재 화웨이와 바이두 역시 미국 기업 의존도를 줄이기 위해 독자 AI 칩 개발을 추진 중이다.
EIIR트랜드의 자인은 “알리바바의 투자와 화웨이, 바이두의 노력이 맞물리며 중국 AI 칩 생태계가 빠르게 성장하고 있다”며 “보다 경쟁력 있는 국산 칩이 늘어날수록 중국 기업들은 AWS, 애저 같은 글로벌 클라우드 의존도를 낮추고, 데이터도 중국 규제 틀 안에 둘 수 있다”라고 전했다.
알리바바의 신형 AI 칩은 우선 사내 데이터센터에서 활용될 가능성이 크다. 이후 생산이 본격화되면 일본, 한국, 동남아, 중동, 남미 등 알리바바 클라우드가 진출해 있는 해외 시장에서도 사용돼 서방 클라우드 의존도를 줄일 수 있을 것으로 보인다.
알리바바의 장기적인 목표는 CUDA 호환 칩을 확보하는 것이지만, 현재로서는 엔비디아와 협상에서 지렛대를 확보하기 위한 전술적 움직임일 수 있다. 카운터포인트리서치의 샤는 “중국이 엔비디아 H20 칩 공급 부족에 직면한 상황에서, 알리바바가 미국 수출 규제에 맞춘 중국 전용 칩을 내놓는다는 것은 실질적인 자국 대안을 생산할 수 있다는 신호”라며 “이는 결국 엔비디아 제품의 가격과 공급에도 영향을 미칠 수 있다”고 분석했다.
dl-ciokorea@foundryco.com