스마트폰이 디지털 뇌의 일부만 사용하여 복잡한 논리를 처리합니다

기술 2026년 4월 6일 오후 12:02

최신 모바일 인공지능은 디지털 구조의 극히 일부만 선택적으로 사용합니다. 이를 통해 에너지 소모를 획기적으로 줄이면서도 클라우드 수준의 고난도 추론을 수행합니다.

구글의 '젬마 4' 모델은 '전문가 혼합(MoE)' 구조를 통해 스마트폰에서도 GPT-4급의 성능을 발휘합니다. 이 시스템은 모든 데이터를 전체 신경망에 통과시키지 않습니다. 대신 작업을 8개의 전문 분야로 나누어 전송하며, 전체 20억 개의 매개변수 중 토큰당 3억 7,500만 개만 활성화합니다. 이 전략은 연산량을 75%나 줄여주어 아이폰 16의 신경망 처리 장치가 초당 40개의 토큰을 처리하는 속도를 유지하게 합니다.

앱에서 계속 읽기

단락 1개 더 · 그리고 2문제 퀴즈

앱에서 열기

X에서 공유 WhatsApp

스마트폰이 디지털 뇌의 일부만 사용하여 복잡한 논리를 처리합니다

관련 사실

매일 지식 다운로드