Arm เปิดตัว CPU Armv9 รุ่นใหม่และ GPU Immortalis สำหรับ SoC ของโทรศัพท์มือถือ รวมถึงซอฟต์แวร์ Kleidi AI ที่ถูกปรับให้เหมาะสมกับ CPU Arm ตั้งแต่สถาปัตยกรรม Armv7 ถึง Armv9
Armv9.2 CPU cores ใหม่ประกอบด้วย core Cortex-X925 “Blackhawk” ที่มีการปรับปรุงประสิทธิภาพ CPU และ AI, Cortex-A725 พร้อมประสิทธิภาพการทำงานที่ดีขึ้น และเวอร์ชันที่อัพเดทของ Cortex-A520 ที่ให้ประสิทธิภาพ (efficiency) เพิ่มขึ้นถึง 15% นอกจากนี้ ยังมีการเปิดตัว GPU ใหม่สามตัว ได้แก่ Immortalis-G925 GPU สูงสุด 14 คอร์ ซึ่งส่งผลให้มีประสิทธิภาพกราฟิก 3D เพิ่มขึ้นถึง 37% เมื่อเทียบกับ Immortalis-G720 ที่มี 12 คอร์ที่เปิดตัวเมื่อปีที่แล้ว, Mali-G725 ที่มี 6 ถึง 9 คอร์ สำหรับโทรศัพท์มือถือระดับพรีเมียม และ Mali-G625 GPU 1 ถึง 5 คอร์สำหรับสำหรับสมาร์ทวอทช์และอุปกรณ์มือถือระดับเริ่มต้น
Arm Cortex-X925
Arm Cortex-X925 ในด้านประสิทธิภาพจะมีความเร็ว single-thread เพิ่มขึ้น 36% จากการทดสอบ Geekbench 6.2 เทียบกับสมาร์ทโฟน Android ระดับพรีเมียมที่ใช้ Cortex-X4 และประสิทธิภาพด้าน AI สูงขึ้นประมาณ 41% โดยใช้เวลาในการเริ่มต้นแรกของโทเค็นใน tiny-LLama (ไตรมาสที่ 4), Cortex-X925 core ถูกนำไปใช้บนแพลตฟอร์ม FPGA ด้วยการกำหนดค่าต่อไปนี้: Cortex-X925 @ 3.8 GHz พร้อม L2 cache 2MB, L3 16MB, SLC 32MB, DSU @ 2 GHz, และหน่วยความจำ LPDDR5x-8533
ประสิทธิภาพของ AI ได้รับการปรับปรุงให้ดีขึ้น 46%โดยใช้โทเค็น time-to-first สำหรับ Phi3 และ Arm ยังกล่าวว่า X925 SoC สามารถส่งผลให้เวลาเริ่มต้นแอปพลิเคชันเร็วขึ้น 33% เมื่อเปรียบเทียบกับเฉลี่ยของห้าอันดับแอปพลิเคชันยอดนิยม (ใน Android) และการท่องเว็บเร็วขึ้น 60% วัดโดยการวัดประสิทธิภาพของเบราว์เซอร์ Speedometer 2.1 ภาพสไลด์ที่ Arm แชร์กล่าวถึงการ กล่าวถึงการรองรับระบบปฏิบัติการ Android, Linux และ Windows ดังนั้นจึงไม่เพียงแต่ใช้ในสมาร์ทโฟนเท่านั้น แต่ยังรวมถึงมือถือและ AI PC ด้วย
Arm Cortex-X925 core ได้รับการปรับให้เหมาะสมสำหรับกระบวนการผลิต 3 นาโนเมตร สามารถดูรายละเอียดทางเทคนิคเพิ่มเติมเกี่ยวกับคอร์ใหม่บนเว็บไซต์ของนักพัฒนา
Arm Cortex-A725 และการปรับปรุง Cortex-A520 core
Cortex-A725 ปรับปรุงประสิทธิภาพ performance และ efficiency ให้ดียิ่งขึ้นเมื่อเทียบกับ Cortex-A720 core และ Cortex-A78 core, โดย Cortex-A725 core จะประหยัดพลังงานสูงสุด 35 % เมื่อเทียบกับ Cortex-A720 ประหยัดพลังงานกว่า 25% และการปรับปรุง L3 traffic 20% ประสิทธิภาพของ efficiency ถูกกำหนดให้เป็นอัตราส่วนระหว่างการปรับปรุงในด้านประสิทธิภาพ (Performance) และการปรับปรุงในด้านพลังงาน (Power), ประสิทธิภาพสูงสุดของ Cortex-A725 ได้รับการวัดบนชิปทดสอบขนาด 3 นาโนเมตรที่มีแคช 64KB K1 และแคช L3 ขนาด 8MB และเปรียบเทียบกับชิป Cortex-A720 ขนาด 4 นาโนเมตร นอกจากโหนดกระบวนผลิตที่แตกต่างกันแล้ว Arm ยังอ้างว่าการปรับปรุงประสิทธิภาพส่วนใหญ่มาจากสถาปัตยกรรมไมโครของ Cortex-A725
Cortex-A520 ได้รับการปรับปรุงด้วยการนำไปใช้ใหม่และกระบวนการผลิตขนาด 3 นาโนเมตร ซึ่งส่งผลให้ประสิทธิภาพดีขึ้นถึง 15% เมื่อเทียบกับ Cortex-A520 ใน TCS23
GPU Immortalis-G925, Mali-G725 และ Mali-G625
เช่นเดียวกับ CPU รุ่น Arm Cortex-X925, GPU รุ่น Immortalis-G925 มีการปรับปรุงประสิทธิภาพอย่างมากเมื่อเทียบกับรุ่นก่อนหน้านี้ Immortalis-G720 โดยมีประสิทธิภาพกราฟิกที่ดีขึ้น 37%, AI inference ที่เร็วขึ้น 34% (ทดสอบในโหมด fp16), และการประมวลผลภาพแบบ ray tracing ที่เร็วขึ้น 52% Arm กล่าวเพิ่มเติมว่า GPU Immortalis-G925 มีประสิทธิภาพดีขึ้น 46% บนมือถือเมื่อเทียบกับ Immortalis-G720 ตัวอย่างเช่น Genshin Impact ที่มีการเปรับปรุงพิ่มขึ้น 49% และ Roblox ที่เร็วขึ้น 46% และบริษัทยังได้ทดสอบ Call of Duty Mobile, Diablo Immortal, วันมะรืนนี้, Fortnite และ PUBG Mobile โดยมีการปรับปรุงตั้งแต่ 29 ถึง 72% นอกจากนี้ยังมีข้อมูลว่าประสิทธิภาพการใช้พลังงานดีขึ้นโดยเฉลี่ย 30% ในเกมชั้นนำ
Arm ไม่ได้ขยายความรายละเอียดเกี่ยวกับ GPU Mali-G725 และ Mali-G625 โดยคาดว่ารุ่นเหล่านี้เป็นรุ่นย่อยของ Immortalis-G925 ที่มีจำนวนคอร์น้อยกว่าและไม่มีความสามารถในการประมวลผล ray tracing ซึ่งถูกปรับให้เหมาะสมสำหรับอุปกรณ์ระดับกลางและระดับเริ่มต้น
ซอฟต์แวร์ AI Kleidi
Arm Kleidi เป็นชุดซอฟต์แวร์ไลบรารีและชุมชนนักพัฒนาที่ออกแบบมาเพื่อเร่งการพัฒนา AI ไลบรารีของ Arm Kleidi รองรับเฟรมเวิร์ก AI ยอดนิยมและถูกปรับให้เหมาะสมสำหรับ CPU ของ Arm ตั้งแต่สถาปัตยกรรม Armv7 ที่ใช้ Advanced Single Instruction Multiple Data (SIMD) Extension สำหรับงานด้าน machine learning (ML) workload จนถึงสถาปัตยกรรม Armv9 ใหม่ที่มีฟีเจอร์ขั้นสูงมากขึ้นเพื่อรองรับงานด้าน generative AI workloads บน CPU ของ Arm
Kleidi ประกอบด้วยสองโครงการหลักในขณะนี้: KleidiAI สำหรับ neural networks และ inference engines และ KleidiCV สำหรับไลบรารี OpenCV computer vision
KleidiAI คือชุด AI kernel ที่ปรับให้เหมาะสมขั้นสูงซึ่งทำงานผ่าน MediaPipe (ผ่าน XNNPACK), LLAMA.cpp, PyTorch (ผ่าน ExecuTorch) และ TensorFlow Lite (ผ่าน XNNPACK) Arm กล่าวว่า KleidiAI สามารถเร่งเวลาในการสร้างโทเค็นแรกสำหรับ Llama 3 ของ Meta และ Phi-3 LLMs ของ Microsoft โดยใช้ llama.cpp ได้ถึง 190% บน CPU Arm Cortex-X925 รุ่นใหม่ เมื่อเทียบกับการใช้งานอ้างอิงตาม llama.cpp กำลังถูกรวมเข้ากับ Unity Sentis ซึ่งเป็น AI inference engine บนอุปกรณ์สำหรับนักพัฒนาเกมอีกด้วย
KleidiCV ถูกพัฒนาโดยความร่วมมือกับ OpenCV เพื่อปรับให้เหมาะสมกับอัลกอริทึม computer vision มากกว่า 2,500 รายการในไลบรารีโอเพ่นซอร์สยอดนิยม การใช้งานที่ปรับให้เหมาะสมด้วย NEON/SVE2 ให้ประสิทธิภาพเพิ่มขึ้นโดยเฉลี่ย 75%, Android builds ก็กำลังถูกส่งไปยัง Maven Central repository ของคอมโพเนนต์และไลบรารีซอฟต์แวร์โอเพ่นซอร์สสำหรับการพัฒนา Java ด้วย
สามารถดูรายละเอียดเพิ่มเติมเกี่ยวกับ Kleidi ในประกาศ
IP block และซอฟต์แวร์ใหม่ทั้งหมดนี้เป็นส่วนหนึ่งของ Arm Compute Subsystems สำหรับไคลเอ็นต์ (Arm CSS for Client) ที่จะถูกผนวกรวมเข้าไปใน SoC สำหรับ AI PC, สมาร์ทโฟน, อุปกรณ์สำหรับผู้บริโภค และอื่นๆ คาดว่าเราน่าจะต้องรอจนถึงอย่างน้อยปี 2025 ก่อนที่อุปกรณ์แรกที่ใช้ Arm Cortex-X925 หรือ Cortex-A725 จะออกสู่ตลาด
แปลจากบทความภาษาอังกฤษ : Arm unveils Cortex-X925 and Cortex-A725 CPUs, Immortalis-G925 GPU, Kleidi AI software
บรรณาธิการข่าวและบทความภาษาไทย CNX Software ได้มีความสนใจในด้านเทคโนโลยี โดยเฉพาะ Smart Home และ IoT