4x sneller rekenen aan Big data met programmeertaal Milk
op
Het probleem bij ‘Big data’ is voornamelijk dat de voor een proces benodigde data ‘sparse’ is. De benodigde hoeveelheid data is klein ten opzichte van en verdeeld over een grote dataset. Geheugenbeheer in huidige processoren is gebaseerd op ‘lokaliteit’: wanneer een programma data van een bepaalde geheugenlocatie opvraagt, gaat het geheugenbeheer ervan uit dat het de naburige data ook nodig heeft en verwerkt deze ook. Dat is bij big data-processing vaak niet het geval omdat de data erg verspreid is over de dataset.
Door een paar extra regels in de programmacode toe te voegen, kan Milk’s compiler het geheugenbeheer optimaliseren. Wanneer een processorkern data nodig heeft, voegt hij het data-adres toe aan een lijst die gedeeld wordt met andere kernen. Als de lijst lang genoeg is, worden de adressen die dicht bij elkaar liggen gegroepeerd en herverdeeld over de kernen. Zo vragen deze alleen data op die ook daadwerkelijk nodig is, wat de efficiëntie aanzienlijk verhoogt.
Meer info: http://news.mit.edu/2016/faster-parallel-computing-big-data-0913.

Discussie (0 opmerking(en))