Durch hardwareseitiges Multithreading (auch: Mehrfädigkeit) können bestimmte Prozessoren mit nur einem vollständigen Prozessor-Kern mehrere Programme quasi gleichzeitig bearbeiten. Ein solcher Prozessor wird multithreaded genannt.
Der Wechsel zwischen den Programmen erfolgt im Gegensatz zum Programm- bzw. Threadwechsel eines Betriebssystems hier durch die Hardware in sehr schneller Folge und ohne zusätzliche Prozessorzyklen. Hierzu besitzt jeder „Faden“ (Thread) einen eigenen Registersatz, einschließlich Stackpointer und Programcounter. Ein mehrfädiger Prozessor ist somit logisch und in der Hardware-Komplexität zwischen einem einfachen Prozessor und einem Multicore-Prozessor anzusiedeln.
Inhaltsverzeichnis |
Der Nutzen von Multithreading (Mehrfädigkeit) ist eine bessere Auslastung der Ressourcen der CPU.
Zwar wird in modernen Prozessoren, welche alle eine Pipeline haben, beispielsweise durch Out-of-order execution schon versucht die Auslastung zu steigern, dennoch haben Untersuchungen ergeben, dass viele Teilwerke der Pipeline durch bspw. simultanes Multithreading zusätzlich noch besser ausgelastet werden können. Ein Grund dafür sind Pipeline-Hazards, die die Pipeline kurz anhalten können (engl. to stall).
Mehrfädige Prozessoren bearbeiten deshalb mehrere Threads quasi-gleichzeitig. Dies kann in verschiedenen Varianten erfolgen:
Im PC-Bereich werden momentan (2005) zweifädige Prozessoren verwendet, die mit zwei parallelen Pipelines arbeiten (siehe Simultaneous Multithreading und Hyper-Threading). Diese werden vom Betriebssystem ähnlich wie zwei separate Prozessor-Kerne eines symmetrischen Multiprozessorsystems behandelt.
In Anwendungen im Bereich eingebetteter Systeme bieten mehrfädige Prozessoren neben dem reinen Leistungsgewinn zusätzliche Möglichkeiten durch explizite Verwendung der Mehrfädigkeit. Solche Prozessoren bieten programmierbare Algorithmen zur Steuerung der einzelnen Programm-Fäden (hier „Context“ genannt). So kann beispielsweise ein Context deterministisch einen gewissen Anteil der Takte und damit der Prozessor-Leistung belegen. Die Contexts können auch durch eine Prioritätensteuerung um die Rechenzeit konkurrieren.
Die einzelnen Contexts können durch entsprechende Befehle in einen Wartezustand versetzt und durch Hardware-Ereignisse aufgeweckt werden. Hierdurch sind sehr schnelle Reaktionen des Systems möglich, da (im Gegensatz zum klassischen Hardware-Interrupt) keinerlei Overhead beim Context-Wechsel notwendig ist.
Contexts, die nur einen geringen Teil der Clock-Zyklen belegen, können dauerhaft zyklisch laufen, ohne die Leistung des Systems merklich zu beeinflussen und z.B. zum Erzeugen oder Entschlüsseln schneller Signale eingesetzt werden.
Somit kann durch den Einsatz von mehrfädigen Prozessoren durch nur geringen Aufwand im Prozessor-Chip auf dezidierte Hardware oder zusätzliche Prozessoren bzw. digitale Signalprozessoren verzichtet werden.
Da in diesen Anwendungen deutlich mehr als zwei Fäden sinnvoll sind, werden in mehrfädigen eingebetteten Prozessoren nicht mehrere Pipelines implementiert, sondern die erste Stufe der Pipeline entscheidet über den als nächsten auszuführenden Context.
Beispiele für mehrfädige Prozessoren für eingebettete Anwendung: