CEVA, Inc. kündigte NeuPro-M an, die neueste Generation seiner Prozessorarchitektur für künstliche Intelligenz und maschinelles Lernen (AI/ML), die auf Inferenz-Workloads ausgelegt ist. NeuPro-M ist eine in sich geschlossene heterogene Architektur, die sich aus mehreren spezialisierten Co-Prozessoren und konfigurierbaren Hardware-Beschleunigern zusammensetzt, die nahtlos und gleichzeitig verschiedene Workloads von Deep Neural Networks verarbeiten und die Leistung im Vergleich zu ihrem Vorgänger um das 5-15-fache steigern. Als Branchenneuheit unterstützt NeuPro-M sowohl System-on-Chip (SoC) als auch Heterogeneous SoC (HSoC) Skalierbarkeit, um bis zu 1.200 TOPS zu erreichen, und bietet optional robusten Secure Boot und End-to-End-Datenschutz. Zur Veranschaulichung seiner Spitzenleistung erreicht ein einzelner NPM11-Kern bei der Verarbeitung eines neuronalen Faltungsnetzwerks ResNet50 eine 5-fache Leistungssteigerung und eine 6-fache Reduzierung der Speicherbandbreite im Vergleich zu seinem Vorgänger, was zu einer außergewöhnlichen Energieeffizienz von bis zu 24 TOPS pro Watt führt. Aufbauend auf dem Erfolg seiner Vorgänger ist NeuPro-M in der Lage, alle bekannten neuronalen Netzwerkarchitekturen zu verarbeiten und bietet darüber hinaus eine integrierte native Unterstützung für Netzwerke der nächsten Generation wie Transformatoren, 3D-Faltung, Self-Attention und alle Arten von rekurrenten neuronalen Netzwerken. NeuPro-M wurde für die Verarbeitung von mehr als 250 neuronalen Netzen, mehr als 450 KI-Kerneln und mehr als 50 Algorithmen optimiert. Die eingebettete Vektorverarbeitungseinheit (VPU) sorgt für eine zukunftssichere softwarebasierte Unterstützung neuer neuronaler Netztopologien und neuer Fortschritte bei KI-Workloads. Darüber hinaus kann das CDNN-Offline-Komprimierungstool die FPS/Watt-Leistung des NeuPro-M bei gängigen Benchmarks um das 5- bis 10-fache steigern, und das bei sehr geringen Auswirkungen auf die Genauigkeit.