메인 콘텐츠로 건너뛰기
ARM logo
ARMNASDAQ긍정AI/기술

2025년 11월 Arm의 놓치지 말아야 할 혁신 7가지

arm
중요도

AI 요약

ARM은 2025년 11월 AI 및 컴퓨팅 분야에서 혁신을 주도하며 모바일, 그래픽, 자동차, 클라우드 전반에 걸쳐 발전을 이끌고 있습니다.

특히 온디바이스 AI 성능 향상을 위한 ExecuTorch와 Stability AI 협력, LLM 평가를 위한 AI Chat 앱 출시, 그리고 가상 FAE 도입은 ARM의 기술 리더십을 강화하며 관련 시장에서의 성장 기대감을 높이고 있습니다.

핵심 포인트

  • ARM은 2025년 11월 AI 및 컴퓨팅 분야에서 혁신을 주도하며 모바일, 그래픽, 자동차, 클라우드 전반에 걸쳐 발전을 이끌고 있습니다.
  • 특히 온디바이스 AI 성능 향상을 위한 ExecuTorch와 Stability AI 협력, LLM 평가를 위한 AI Chat 앱 출시, 그리고 가상 FAE 도입은 ARM의 기술 리더십을 강화하며 관련 시장에서의 성장 기대감을 높이고 있습니다.

긍정 / 부정 요인

긍정 요인

  • AI 및 컴퓨팅 분야 혁신 주도
  • 온디바이스 AI 성능 향상
  • LLM 평가를 위한 AI Chat 앱 출시
  • 가상 FAE 도입으로 IP 탐색 효율 증대
  • ARM 기반 기술 생태계 확장

기사 전문

Arm, AI 혁신 중심에서 2025년 11월 기술 발전 주도 인공지능(AI)과 첨단 컴퓨팅 분야의 혁신이 2025년 11월에도 가속화되었으며, Arm은 이러한 모멘텀의 중심에 있었습니다. 일상 기기에서 대규모 언어 모델(LLM)을 구동하는 새로운 방식부터 차세대 성능을 형성하는 심층적인 아키텍처 인사이트까지, Arm과 그 생태계가 모바일, 그래픽, 자동차, 클라우드 전반의 발전을 어떻게 이끌고 있는지 보여주었습니다. AI 워크플로우 전반의 CPU 재구상 검색 증강 생성(RAG)은 AI 워크플로우의 두 가지 핵심 부분, 즉 지식 기반에서 관련 정보를 검색하고 LLM을 사용하여 응답을 생성하는 것을 결합합니다. 현대 시스템에서 이 워크플로우는 데이터 검색, 필터링 및 오케스트레이션을 처리하는 CPU와 모델 추론을 관리하는 GPU 모두에 의존합니다. Odin Shen, Principal Solutions Architect는 Arm 기반 Grace GPU와 Blackwell CPU를 페어링한 NVIDIA DGX Spark 플랫폼에서 이 하이브리드 워크플로우를 탐구했습니다. Shen은 Grace가 검색 및 파이프라인 제어를 어떻게 관리하고 Blackwell이 모델 실행을 처리하는지, 이 모든 것이 불필요한 데이터 이동을 줄이는 통합 메모리 아키텍처의 지원을 받는다고 설명했습니다. ExecuTorch와 Stability AI를 통한 온디바이스 오디오 생성 2025년 10월 PyTorch Conference에서 Gian Marco Iodice, Principal Software Engineer는 사용자가 ExecuTorch로 구동되는 Stability AI의 Stable Audio Open Small 모델을 사용하여 완전히 온디바이스에서 오디오를 생성하는 방법을 시연했습니다. Arm 기반 Android 기기에서 완전히 실행되는 이 데모는 ExecuTorch가 클라우드 연결 없이도 효율적인 오프라인 생성 AI 워크로드를 기기에서 직접 가능하게 한다는 것을 보여줍니다. 이 애플리케이션은 텍스트 프롬프트를 고품질 44kHz 오디오로 변환하여 엣지 AI 및 대규모 창의성을 위한 Arm CPU의 성능과 유연성을 강조합니다. AI Chat을 통한 Android 및 ChromeOS에서의 LLM 탐색 LLM은 점점 더 클라우드 연결에 의존하기보다는 기기에서 직접 실행되어 더 빠른 응답, 강화된 개인 정보 보호 및 예측 가능한 성능을 제공합니다. 이는 모든 처리가 로컬에 유지되기 때문입니다. 종종 문제는 복잡한 환경이나 종속성을 설정하지 않고 실제 하드웨어에서 다양한 모델을 평가할 수 있는 간단한 방법을 찾는 것입니다. Arm은 사용자가 Android 및 ChromeOS 기기에서 직접 여러 LLM을 탐색하고 평가할 수 있는 경량 앱인 AI Chat을 출시했습니다. Han Yin, Staff AI Technology Engineer는 AI Chat이 온디바이스 테스트를 더 많은 사용자에게 접근 가능하게 하고 다양한 Arm 기반 기기에서 작동하는 명확하고 일관된 환경을 제공하여 LLM 성능 평가의 마찰을 제거한다고 설명했습니다. 이 앱은 기기의 하드웨어를 감지하고 적합한 모델을 추천하며 초당 토큰 수 및 첫 토큰까지의 시간과 같은 실시간 성능 메트릭을 표시할 수 있습니다. Arm Virtual FAE 소개 팀이 새로운 칩 또는 제품에 대한 IP를 평가할 때 명확한 설명, 비교 및 지침이 필요한 경우가 많습니다. 이는 일반적으로 사양을 해석하고 기술 질문에 답변하며 절충점을 설명하는 현장 응용 엔지니어(FAE)와 대화하는 것을 포함합니다. Matt Rowley, Senior Product Manager는 Arm IP Explorer에 직접 내장된 AI 기반 어시스턴트인 Virtual FAE를 소개합니다. 이를 통해 칩 설계자, 엔지니어 및 제품 팀은 Arm IP를 탐색하는 더 빠르고 직관적인 방법을 얻을 수 있으며, 사용자는 엣지 장치, 자동차 플랫폼 또는 고성능 컴퓨팅 시스템을 설계하든 목표에 맞는 IP에 대한 즉각적인 명확성을 얻을 수 있습니다. Arm CPU AI 가속의 다음 단계 현대 AI 워크로드는 신경망, 이미지 처리 및 신호 분석의 핵심 수학적 빌딩 블록인 행렬 연산에 크게 의존합니다. 전통적으로 이러한 연산은 GPU 또는 전용 가속기로 처리되지만 CPU도 중요한 역할을 합니다. 증가하는 온디바이스 AI 수요에 발맞추기 위해 CPU는 행렬 연산을 더 빠르고 효율적이며 소프트웨어에서 사용하기 쉽게 만드는 내장 기능이 필요합니다. Arm Scalable Matrix Extension 2 (SME2)는 CPU에서 직접 AI 및 고성능 컴퓨팅을 가속하도록 설계된 Arm의 고급 행렬 처리 확장입니다. Zenon (Zhilong) Xiu, Senior Principal Applications Engineer는 SME2가 어떻게 작동하는지, 왜 설계 선택이 중요한지, 그리고 어디에서 가장 큰 성능 이점을 제공하는지 설명하는 새로운 기술 분석을 발표했습니다. Xiu는 또한 LUT(룩업 테이블) 개선, 확장된 벡터 처리 및 개발자가 실제 워크로드에서 예상해야 하는 실제적인 차이점을 다룹니다. 자동차 컴퓨팅의 미래에 대한 명확한 전망 소프트웨어 정의 차량(SDV)은 핵심 차량 기능을 소프트웨어로 전환하여 시간이 지남에 따라 업데이트, 개선 및 확장할 수 있습니다. AI가 인식, 의사 결정 및 인포테인먼트에서 중심이 됨에 따라 업계는 이제 실시간 AI 추론, 센서 융합 및 예측 행동이 차량이 세상에 반응하는 방식을 형성하는 AI 정의 차량(AIDV)으로 이동하고 있습니다. Prakash Mohapatra, Senior Product Manager는 AIDV가 컴퓨팅 플랫폼에 요구하는 것에 대해 더 깊고 구조화된 시각을 제공합니다. 이 분석은 AIDV가 확장 가능한 이기종 컴퓨팅을 필요로 하는 이유, 도메인 및 구역 아키텍처가 워크로드 분산을 어떻게 변경하는지, 그리고 설계가 고려해야 하는 안전 및 실시간 제약 조건을 설명합니다. Vulkan Subpasses 이해 Vulkan은 개발자에게 렌더링 워크로드의 예약 및 실행에 대한 더 많은 제어를 제공하도록 설계된 저수준 그래픽 API입니다. 서브패스라는 기능은 단일 렌더 패스 내에서 여러 렌더링 작업을 결합할 수 있도록 합니다. 최적의 사용 시 서브패스는 메모리 대역폭을 줄이고 타일링 효율성을 개선하며 모바일 GPU의 성능을 향상시킬 수 있습니다. 그러나 잘못된 상황에서 사용하면 불필요한 복잡성을 도입하거나 파이프라인을 중단시키거나 렌더링 흐름의 명확성을 줄일 수 있습니다. Peter Harris, Distinguished Engineer는 서브패스가 어떻게 작동하는지뿐만 아니라 개발자가 언제 사용해야 하고 언제 사용하지 않아야 하는지에 대한 실용적이고 실제적인 설명을 제공합니다. 이 지침은 실제 성능 절충점을 분석하고 최적의 사용 예시를 보여주며 서브패스가 이점을 제공하지 않거나 성능을 저하시키는 시나리오를 강조하여 표준 API 설명서를 넘어섭니다.

관련 기사