TeraFLOPS (TFLOPS) är en enhet som anger hur många biljoner be­räk­ning­ar med flyttal en dator kan utföra på en sekund. Värdet fungerar som ett mått på pre­stan­dan hos pro­ces­so­rer, särskilt GPU:er och su­per­da­to­rer. TFLOPS är särskilt relevant för ap­pli­ka­tio­ner som in­vol­ve­rar mycket be­räk­ning­ar, såsom ar­ti­fi­ci­ell in­tel­li­gens, ve­ten­skap­li­ga si­mu­le­ring­ar och ma­ski­nin­lär­ning.

Vad är FLOPS och vad används de till?

FLOPS står för floatingpoint ope­ra­tionsper second(flyt­ta­lo­pe­ra­tio­ner per sekund) och är en enhet för be­räk­nings­kraft. En flyt­ta­lo­pe­ra­tion är en ma­te­ma­tisk beräkning som in­vol­ve­rar decimaler. De är särskilt viktiga för be­räk­nings­in­ten­si­va ap­pli­ka­tio­ner som kräver hög precision.

FLOPS används främst för ve­ten­skap­li­ga be­räk­ning­ar, si­mu­le­ring­ar, ar­ti­fi­ci­ell in­tel­li­gens, ma­ski­nin­lär­ning och gra­fikap­pli­ka­tio­ner. De spelar en central roll inom olika områden, såsom medicinsk bild­be­hand­ling och fysiska si­mu­le­ring­ar. De är också viktiga inom fi­nans­värl­den, till exempel när det gäller analys av mark­nads­da­ta. Inom spel­in­du­strin används FLOPS för att bestämma gra­fik­pre­stan­dan hos moderna GPU:er. Med en ständigt ökande FLOPS-kapacitet kan moderna datorer leverera allt mer re­a­lis­tis­ka fysiska effekter och högupp­löst grafik.

FLOPS mäts van­ligt­vis med hjälp av spe­ci­al­ut­veck­la­de bench­mark­test som fast­stäl­ler antalet flyt­tal­so­pe­ra­tio­ner per sekund. Vanliga bench­mark­test är LINPACK, som främst används för su­per­da­to­rer, och FP32/FP64, som mäter GPU:ers be­räk­nings­kraft. Under testerna utförs komplexa ma­te­ma­tis­ka be­räk­ning­ar för att fast­stäl­la hur många ope­ra­tio­ner per sekund ett system kan hantera. Till­ver­kar­na anger ofta te­o­re­tis­ka FLOPS-värden baserade på datorns ar­ki­tek­tur. I verk­lig­he­ten kan dock tillämp­ning­ar­na variera beroende på ar­bets­be­last­ning och ef­fek­ti­vi­tet.

Hur många FLOPS finns det i en teraFLOPS?

En teraFLOPS motsvarar en biljon (1 000 000 000 000 eller1012) flyt­tal­so­pe­ra­tio­ner per sekund. Det innebär att en processor med 1 TFLOPS kan utföra en biljon ma­te­ma­tis­ka ope­ra­tio­ner med flyt­tals­num­mer per sekund.

Som jäm­fö­rel­se skulle en dator med endast 1 FLOPS behöva 31 000 år för att utföra en biljon flyt­tal­so­pe­ra­tio­ner. Datorer som arbetar i TFLOPS är alltså kraft­ful­la system som klarar moderna ap­pli­ka­tio­ner i realtid.

Vilka andra FLOPS-enheter finns och hur omvandlas de till TFLOPS?

Det finns många FLOPS-enheter, som skiljer sig åt i hur många ope­ra­tio­ner per sekund de avser.

Enhet FLOPS-värde Om­vand­ling till TFLOPS
KiloFLOPS 103 FLOPS (1 000) 10-9 TFLOPS
MegaFLOPS 106 FLOPS (1 miljon) 10-6 TFLOPS
GigaFLOPS 109 FLOPS (1 miljard) 10-3 TFLOPS
TeraFLOPS 1012 FLOPS (1 biljon) 1 TFLOP
PetaFLOPS 1015 FLOPS (1 kvad­ril­jon) 103 TFLOPS
ExaFLOPS 1018 FLOPS (1 kvin­til­li­on) 106 TFLOPS

Su­per­da­to­rers prestanda mäts i petaFLOPS och till och med exaFLOPS, medan avan­ce­ra­de gra­fik­kort van­ligt­vis mäts i teraFLOPS.

Hur många FLOPS når moderna datorer och GPU:er?

GPU:er och moderna datorer inom hög­pre­ste­ran­de da­ta­be­hand­ling har uppnått im­po­ne­ran­de FLOPS-värden. NVIDIA H100, en av de mest kraft­ful­la GPU:erna för AI och da­ta­cen­ter, uppnår upp till 989 teraFLOPS för FP32 Tensor Core-be­räk­ning­ar. Det gör den idealisk för stora neurala nätverk och si­mu­le­ring­ar.

NVIDIA A30, en GPU som är optimerad för da­ta­cen­ter, når 10 TFLOPS och är särskilt lämplig för AI-träning och in­fe­ren­ser. Som jäm­fö­rel­se kan den spe­l­o­ri­en­te­ra­de NVIDIA RTX 4090 över­kloc­kas till över 100 TFLOPS och möjliggör mycket re­a­lis­tisk grafik.

Su­per­da­to­rer är ännu kraft­ful­la­re: Su­per­da­torn Frontier har över­skri­dit 1 exaFLOPS-gränsen och används för mycket komplexa ve­ten­skap­li­ga si­mu­le­ring­ar. Andra kraft­ful­la su­per­da­to­rer som används inom forskning, såsom den japanska datorn Fugaku, arbetar också inom detta intervall.

Gå till huvudmeny