Swoboda oferowana przez wielordzeniową architekturę Larrabee ma rozpocząć nową erę innowacji. Została ona zaprojektowana we współpracy z najlepszymi na świecie ekspertami od grafiki 3D.
Pierwsze implementacje architektury Larrabee będą przeznaczone do kart graficznych oraz zastosowań multimedialnych i umożliwią uruchamianie istniejących gier oraz programów.
Architektura Larrabee ma zapewnić znacznie większą elastyczność i programowalność w porównaniu z architekturami GPU. W Larabee jednostki renderujące DirectX i OpenGL mogą być w pełni programowalnymi potokami graficznymi. Ponadto natywny model programowania Larrabee umożliwi tworzenie szerokiej gamy aplikacji równoległych.
Rdzeń procesora Larrabee wywodzi się z konstrukcji Intel Pentium (wykonującej polecenia po kolei i synchronizującej pamięć podręczną) z ważnymi ulepszeniami, takimi jak jednostka przetwarzania wektorowego (VPU), rozszerzone 64-bitowe instrukcje i wielowątkowość.
Oto szczegóły architektury Larrabee:
- Wiele rdzeni x86 uzupełnionych szeroką jednostką przetwarzania wektorowego
- Stałe bloki logiczne zapewniające dużo wyższy współczynnik wydajności na wat i znacznie zwiększające elastyczność i programowalność architektury.
- Spójna pamięć podręczna drugiego poziomu, która zapewnia efektywną komunikację wewnątrz procesora i szybki lokalny dostęp do danych przez poszczególne rdzenie.
- Szeregowanie zadań wykonywane w całości na poziomie oprogramowania, a nie przez stałe obwody logiczne.
- Natywny model programowania obsługujący szeroką gamę aplikacji równoległych, które używają nietypowych struktur danych.
- Architektura Larrabee ma potok wywodzący się z procesora Pentium, który używa krótkiego potoku wykonawczego z całkowicie spójną pamięcią podręczną. Larrabee dodaje do tego ważne ulepszenia, takie jak wielowątkowość, rozszerzenia 64-bitowe oraz zaawansowane pobieranie wstępne.
- Architektura rozszerza zbiór instrukcji x86, dodając szerokie operacje wektorowe i kilka wyspecjalizowanych instrukcji skalarnych.
- Każdy rdzeń w architekturze Larrabee ma szybki dostęp do swojej 256-kilobajtowej części spójnej pamięci podręcznej L2.
- Architektura Larrabee przydziela każdemu rdzeniowi 32 KB na pamięć podręczną instrukcji i 32 KB na pamięć podręczną danych.
- Architektura Larrabee obsługuje 4 wątki wykonawcze na rdzeń, z oddzielnymi zestawami rejestrów dla każdego wątku.
- Architektura Larrabee uzyskuje wysoką gęstość obliczeniową dzięki 3-argumentowej, 16-bajtowej jednostce przetwarzania wektorowego (VPU), która wykonuje instrukcje na liczbach całkowitych, zmiennopozycyjnych o pojedynczej precyzji i zmiennopozycyjnych o podwójnej precyzji.
- Szeregowanie zadań w architekturze Larrabee jest wykonywane przez oprogramowanie, a nie przez stałe obwody logiczne.
- Architektura Larrabee używa 1024-bitowej, dwukierunkowej sieci pierścieniowej (tzn. 512 bity w każdym kierunku), aby zmniejszyć opóźnienia komunikacji między agentami.
- Architektura Larrabee w pełni obsługuje standardy IEEE dla pojedynczej i podwójnej precyzji operacji zmiennopozycyjnych. Wsparcie dla tych norm jest warunkiem wstępnym dla wielu rodzajów zadań, w tym aplikacji finansowych.