Das von Jim Keller geführte Chip Company Tenstorrent hat seinen Wormhole-Prozessor der nächsten Generation für KI-Workloads veröffentlicht, die erwartet, eine gute Leistung zu einem erschwinglichen Preis zu bieten.Das Unternehmen bietet derzeit zwei zusätzliche PCIe-Karten an, mit denen ein oder zwei Wurmlochprozessoren sowie TT-Loudbox- und TT-FaceBox-Workstations für Softwareentwickler aufgenommen werden können. Alle heutigen Ankündigungen richten sich an Entwickler, nicht an diejenigen, die Wurmloch -Boards für kommerzielle Workloads verwenden.
„Es ist immer erfreulich, mehr unserer Produkte in die Hände von Entwicklern zu bringen. Die Befreiung von Entwicklungssystemen mit unseren Wormhole ™ -Karten kann Entwicklern helfen, Multi-Chip-KI-Software zu skalieren und zu entwickeln“, sagte Jim Keller, CEO von Tenstorrent.Zusätzlich zu diesem Start freuen wir uns, die Fortschritte zu sehen, die wir mit dem Band und dem Einschalten unseres Produkts Blackhole der zweiten Generation erzielen. “

Jeder Wurmlochprozessor enthält 72 Tensix-Kerne (von denen fünf RISC-V-Kerne in verschiedenen Datenformaten unterstützen) und 108 MB SRAM und liefert 262 FP8 Tflops bei 1 GHz mit einer thermischen Konstruktionskraft von 160 W. Die Single-Chip-Wurmloch-N150-Karte ist mit 12 GB GDDR6-Videospeicher ausgestattet und verfügt über eine Bandbreite von 288 GB/s.
Wurmlochprozessoren bieten eine flexible Skalierbarkeit, um die unterschiedlichen Bedürfnisse von Arbeitsbelastungen zu erfüllen. In einem Standard -Workstation -Setup mit vier Wurmloch -N300 -Karten können die Prozessoren zu einer einzigen Einheit kombiniert werden, die in der Software als einheitliches, breites Tensix -Kernnetzwerk angezeigt wird. Mit dieser Konfiguration kann der Beschleuniger dieselbe Arbeitsbelastung, die gleichzeitig zwischen vier Entwicklern aufgeteilt oder bis zu acht verschiedene KI -Modelle gleichzeitig ausführen. Eine wichtige Merkmal dieser Skalierbarkeit ist, dass sie lokal ohne Virtualisierung ausgeführt werden kann. In einer Rechenzentrumsumgebung verwenden Wurmlochprozessoren PCIe zur Expansion innerhalb der Maschine oder Ethernet für die externe Erweiterung.
In Bezug auf die Leistung erreichte Tenstorrents Single-Chip-Wurmloch-N150-Karte von Tenstorrent (72 Tensix Cores, 1 GHz-Frequenz, 108 MB SRAM, 12 GB GDDR6, 288 GB/S-Bandbreite) 262 FP8 Tlops bei 160W, während das Dual-Chip-Frequenz-Frequenz-Frequenz-N300-Board (128 TENSIX CONES, 1 GHZ WORMOLL N300) (128 TENSEL, TENSIX CORES, 1 GHZ, 192 MB SRAM) (128 TENSEL, TENSIX CORES, 1 GHZ, 192 MB SRAM, N300-Board, 1 GHZ, 192 MB SR, N300-Board (128 TENSE), 1 GHZ-N300-Board, 1 Ghz, 192 MB SR. 24 GB GDDR6, 576 GB/s Bandbreite) liefert bis zu 466 FP8 Tflops bei 300 W.
Um 300 W 466 FP8 TFLOPs in den Kontext zu bringen, vergleichen wir es mit dem, was der KI -Marktführer Nvidia in dieser thermischen Designkraft anbietet. Der A100 von NVIDIA unterstützt FP8 nicht, unterstützt jedoch INT8 mit einer Spitzenleistung von 624 Tops (1.248 Tops, wenn sie spärlich). Im Vergleich dazu unterstützt der H100 von NVIDIA FP8 und erreicht eine Spitzenleistung von 1.670 TFLOPs bei 300 W (3.341 TFLOPs bei spärlich), was sich deutlich von Tenstorrents Wurmloch N300 unterscheidet.
Es gibt jedoch ein großes Problem. Das Wurmloch von Tenstorrent N150 kostet 999 US -Dollar, während der 300 N für 1.399 US -Dollar verkauft. Im Vergleich dazu kostet eine einzelne NVIDIA H100 -Grafikkarte je nach Menge 30.000 US -Dollar. Natürlich wissen wir nicht, ob vier oder acht Wurmlochprozessoren tatsächlich die Leistung eines einzelnen H300 liefern können, aber ihre TDPs sind 600 W bzw. 1200 W.
Zusätzlich zu den Karten bietet Tenstorrent vorgefertigte Workstations für Entwickler an, darunter 4 N300-Karten in der erschwinglicheren Xeon-basierten TT-Loudbox mit aktiver Kühlung und die fortschrittliche TT-Quietbox mit Xiaolong) Flüssigkühlungsfunktion).
Postzeit: Jul-29-2024