Phison Electronics kündigte seinen Auftritt auf der GTC an Stand 119 an und demonstriert dort, wie eine mehrstufige Speicherarchitektur größere Modelle und Inferenz mit langem Kontext auf NVIDIA-gestützten lokalen KI-Plattformen unterstützt. Die Branche sieht sich mit zunehmenden Speicherbeschränkungen konfrontiert, während die Nachfrage nach KI-fähigen Plattformen weiter stark ansteigt. Das Fine-Tuning und die Inferenz auf proprietären Daten erfordern massive Rechen- und Speicherressourcen, was Unternehmen vor Investitionsherausforderungen stellt. Diese steigenden Lösungskosten und Engpässe im Workflow verzögern die Markteinführung umsatzgenerierender Innovationen.

Um diese Herausforderung zu bewältigen, führte Phison die aiDAPTIV-Technologie für lokale und Edge-KI-Anwendungsfälle ein. Durch die Nutzung von Pascari-SSDs als neue KI-Speicherstufe erweitert und verwaltet die aiDAPTIV-Technologie den KI-Arbeitsspeicher intelligent über GPU-Speicher, System-RAM und Flash hinweg. aiDAPTIV wendet diese Prinzipien der mehrstufigen Speicherarchitektur auf lokale KI-Systeme an, während die NVIDIA-KI-Infrastruktur die GPU-Speicherkapazitäten zur Unterstützung von Inferenz-Workloads in Rechenzentrumsumgebungen vorantreibt.

Basierend auf High-Endurance-Flash, der für kontinuierliches Paging und Kontext-Retention optimiert ist, unterstützt aiDAPTIV speicherintensive Inferenz- und Fine-Tuning-Workloads unter festen Hardwarekonfigurationen. Die Flash-basierte aiDAPTIV-Speicherstufe ermöglicht es Unternehmen, diese sich entwickelnden Workloads auf lokalen Systemen zu unterstützen, während gleichzeitig der Datenschutz gewahrt und die langfristige Infrastruktureffizienz verbessert wird. Auf der NVIDIA GTC 2026 präsentiert Phison Demonstrationen von Partner-Notebooks, Workstations und Systemen, die von NVIDIA GB10 Grace Blackwell-Prozessoren sowie NVIDIA GeForce RTX 50-Serien und NVIDIA RTX PRO 6000 Blackwell Max-Q Workstation Edition-GPUs angetrieben werden.

Die Demonstrationen zeigen Inferenz mit langem Kontext, agentische KI-Workflows unter Nutzung von KV-Cache-Wiederverwendung sowie speicherintensives Fine-Tuning bei groß angelegten Modellen. Dabei wird verdeutlicht, wie aiDAPTIV den effektiven Speicher über GPU-Speicher, System-RAM und Flash erweitert, um Workloads zu unterstützen, die andernfalls die verfügbare Systemkapazität überschreiten würden.