sparsom matrice multiplikation: det distribuerede blokkomprimerede sparsomme rækkebibliotek
effektiv parallel multiplikation af sparsomme matricer er nøglen til at muliggøre mange store beregninger. Denne artikel præsenterer dbcsr–biblioteket (distribueret Blokkomprimeret sparsom række) til skalerbar sparsom multiplikation af matricer og dets anvendelse i CP2K-programmet til lineær skalering af kvantekemiske beregninger. Biblioteket kombinerer flere tilgange til at implementere sparsom matricsmultiplikation på en måde, der fungerer godt og påviseligt skalerbar. Parallel kommunikation har veldefinerede grænser. Datavolumen falder med O(1 / P) med stigende procestællinger P, og hver proces kommunikerer med højst o (P) andre. Lokal sparsom matrice-multiplikation håndteres effektivt ved hjælp af en kombination af teknikker: blokering af elementer sammen på en applikationsrelevant måde, et autotuning-bibliotek til små matrice-multiplikationer, cache-uvidende rekursiv multiplikation og multithreading. Derudover øger on-the-fly-filtrering ikke kun sparsity, men undgår også at udføre beregninger, der falder under filtreringstærsklen. Vi demonstrerer og analyserer udførelsen af dbcsr-biblioteket og dets forskellige skaleringsadfærd.