Een team van Davis University in Californië heeft een processor ontwikkeld met 1000* kernen en 621 miljoen transistors. De verwerkingssnelheid bedraagt 1,78 triljoen instructies per seconde. 

In tegenstelling tot een aantal andere initiatieven met zo’n 300 processors is de KiloCore-chip gefabriceerd en werkt hij. De processor werd gemaakt door IBM (wie anders…) in hun 32-nm PD-SOI CMOS technologie. 

De gebruikte basisarchitectuur is MIMD (multiple instruction/multiple data). Iedere kern heeft een zevenlaags instructiepijplijn en werkt met een instructieset bestaande uit 72 single-cycle-instructies. De KiloCore onderscheidt zich van GPU-klasse processors doordat deze geen ‘algoritmespecifieke’ instructies heeft. De extreem hoge verwerkingssnelheid wordt gehaald bij een kloksnelheid van niet meer dan 1,78 GHz bij 1,1 V. Bij 0,84 V en 1 GHz verbruikt dit monster 13,1 W, terwijl een maximaal  vermogensrendement van  5.8 pJ/Op wordt vermeld voor 0,56 V en 115 MHz.

Elke kern wordt individueel gevoed en als er een niets te doen heeft kan het verbruik ervan worden teruggebracht tot alleen lekstroom. In tegenstelling tot bij een cache-architectuur kan iedere kern instructies en data opslaan in hiërarchisch geordende locaties; lokaal geheugen, één of meer nabijgelegen processors, onafhankelijke on-chip-geheugenmodules of buiten de chip gelegen geheugen. 
De gebruikte ‘wormgat’-routering houdt onder andere in dat berichten van een aangrenzende of dichtbij gelegen kern via een circuit-geschakeld netwerk worden gerouteerd en berichten van verder weg gelegen kernen via een packet-geschakeld netwerk. Wat voor uitdaging dit voor programmeurs betekent is nog onbekend. Iedere kern heeft communicatiebuffers voor alle vier de windrichtingen en een vijfde kanaal voor host-processorverkeer; de maximum snelheid is 45,5 Gb/s per router en 9,1 Gb/s per poort bij 1,1 V.

* Pietluttig detail: K betekent volgens mijn redactiewoordenboek kilo = 1024. Zeker, k staat ook voor kilo, maar betekent 1000 bij 'ouderwetse' dingen zoals kHz.