스마트폰이 디지털 뇌의 일부만 사용하여 복잡한 논리를 처리합니다
최신 모바일 인공지능은 디지털 구조의 극히 일부만 선택적으로 사용합니다. 이를 통해 에너지 소모를 획기적으로 줄이면서도 클라우드 수준의 고난도 추론을 수행합니다.
구글의 '젬마 4' 모델은 '전문가 혼합(MoE)' 구조를 통해 스마트폰에서도 GPT-4급의 성능을 발휘합니다. 이 시스템은 모든 데이터를 전체 신경망에 통과시키지 않습니다. 대신 작업을 8개의 전문 분야로 나누어 전송하며, 전체 20억 개의 매개변수 중 토큰당 3억 7,500만 개만 활성화합니다. 이 전략은 연산량을 75%나 줄여주어 아이폰 16의 신경망 처리 장치가 초당 40개의 토큰을 처리하는 속도를 유지하게 합니다.
앱에서 계속 읽기
단락 1개 더 · 그리고 2문제 퀴즈