メディアテックがMeta Llama 2大規模言語モデルを活用 生成AIを直接エッジデバイスで展開
J230823Y5 2023年10月号(J290)
大手IC設計ファブレスメーカーであるメディアテック(聯発科技)は2023年8月23日に、Metaの次世代大規模言語モデルであるLlama 2及び最先端のAIプロセシングユニット(APU)と完全なAI開発プラットフォームであるNeuroPilot AI Platformをともに活用することで、完全なエッジコンピューティングエコシステムを構築し、スマートフォン、自動車、スマートホーム、IoT等のエッジデバイス用 AI アプリケーションの開発を加速すると発表した。Llama 2モデルを活用して開発したAIアプリケーションは2023年末に最新のフラッグシップ製品に搭載する予定である。
メディアテック無線通信事業部総経理徐敬全は、デジタルトランスフォーメーションにおける顕著なトレンドの一つとして、生成 AI が急速に普及しており、メディアテックはMetaとの提携によって、これまでよりはるかに優れたAI機能をエッジデバイスにもらたすことができると述べてた。
現在、生成 AIの処理はほとんどがクラウドコンピューティングを介して実行されており、メディアテックが生成 AIを直接エッジデバイスで展開すれば、開発者及びユーザーが直接オンデバイスLlama 2モデルを実行することが可能になる。これにより、性能の向上、プライバシー保護の強化、セキュリティと信頼性の向上、遅延の低減、オフラインコンピューティングの実現、コストの削減など多数のメリットがもたらされる。
メディアテックが2023年末に発表する予定の次世代フラッグシップチップセットは、Llama 2 モデルに対応するために最適化されたソフトウェアスタック(NeuroPilot)に加え、Transformerバックボーンアクセラレーションを支援アップグレードしたAIプロセシングユニットを搭載し、実装時の面積と DRAM 帯域幅の使用を削減し、大規模言語モデル及び生成 AIの機能を一段と強化し、開発者がエキサイティングな新しい AI アプリケーションを作成し、エッジアプリケーションの実装と拡張を加速できるようにする。(2023年8月)