Was sind CPU, GPU, TPU, DPU, QPU, NPU, ASIC und FPGA?

In digitalen Geräten wie Computern, Smartphones, Tablets, Fernsehern, Kameras, Videospielkonsolen, Spielzeug und dergleichen mehr stecken die unterschiedlichsten Bauteile. Unter dem großen Überbegriff „Chip“ kann man dabei weitere verschiedene Unterkategorien aufmachen. Eine davon sind die Prozessoren. Ein Prozessor ist dafür da, Berechnungen anzustellen respektive Daten auf bestimmte Art zu verarbeiten und die ermittelten Ergebnisse auszugeben. Als integrierte Schaltkreise kommen Prozessoren in verschiedener Form einzeln oder als Teil eines Einzelchip-Systems (SoC) zum Einsatz. Im Folgenden findet ihr heraus, welche Spezialaufgaben dabei CPU, GPU, TPU, DPU, QPU, NPU, ASIC und FPGA haben.

Mac-Tipp: Große Dateien finden und löschen mit Daisy Disk (Werbung)

Prozessoren für verschiedene oder einzelne Aufgaben: Was sind CPU, GPU, TPU, DPU, QPU, NPU, ASIC und FPGA? Hier findet ihr Infos zu Aufgaben und Anwendung der Chips und Systeme. Zudem erfahrt ihr, was ein SoC ist.

Kapitel in diesem Beitrag:

1 Hauptprozessor: Was ist eine CPU?
2 Spezialprozessor: Was ist ein ASIC?
3 Speziell, aber flexibel: Was ist ein FPGA?
4 Die Grafikeinheit: Was ist eine GPU?
5 Anwendung von KI: Was ist eine NPU?
6 Maschinelles Lernen: Was ist eine TPU?
7 Datenverarbeitung: Was ist eine DPU?
8 Quantencomputer: Was ist eine QPU?
9 Mehrere Einheiten in einem: Was ist ein SoC?
10 Meine Tipps & Tricks rund um Technik & Apple
11 Ähnliche Beiträge

Hauptprozessor: Was ist eine CPU?

Die CPU (Central Processing Unit) ist der zentrale Prozessor oder die zentrale Recheneinheit eines Computersystems. Sie ist in vielen Computern, Servern und anderen alltäglichen Geräten die Hauptkomponente, die für die Ausführung von Befehlen und die Verarbeitung von Daten verantwortlich ist. Die CPU interpretiert Daten und führt Befehle aus, die von Softwareanwendungen und dem Betriebssystem gegeben werden.

Die wichtigsten Funktionen einer CPU umfassen:

Befehlsausführung: Die CPU führt Befehle aus, die in Maschinensprache geschrieben sind, wobei jede Anweisung eine bestimmte Aktion darstellt.
Datenverarbeitung: Die CPU kann arithmetische und logische Operationen auf Werte und Daten durchführen. Dies umfasst Addition, Subtraktion, Multiplikation, Division und Vergleichsoperationen.
Steuerung: Die CPU steuert den Datenfluss innerhalb des Computersystems. Sie gibt den Takt für die Ausführung von Befehlen vor und synchronisiert den Ablauf von Operationen.

Moderne CPUs bestehen aus mehreren Kernen, was es ihnen ermöglicht, mehrere Aufgaben parallel zu verarbeiten (Multicore-Architektur). Die Leistung einer Computer-CPU wurde früher oft in Megahertz (MHz) und heute eher in Gigahertz (GHz) angegeben, was die Anzahl der Zyklen pro Sekunde darstellt. Weitere Leistungsfaktoren, die bei der CPU-Wahl beachtet werden müssen, sind die Architektur (x86, RISC-V oder ARM), die Cache-Größe und die Anzahl der Threads.

Spezialprozessor: Was ist ein ASIC?

ASIC steht für „Application-Specific Integrated Circuit“ (Anwendungsspezifische Integrierte Schaltung). Dieser Prozessor wird speziell für eine bestimmte Anwendung oder Aufgabe entwickelt und eingesetzt. Im Gegensatz zu allgemeinen Prozessoren wie CPUs (Central Processing Units) oder GPUs (Graphics Processing Units), die für eine Vielzahl von Anwendungen geeignet sind, sind ASICs darauf ausgelegt, eine spezifische Funktion äußerst effizient auszuführen. Sie sind nur für deren Berechnungen bzw. Algorithmen gemacht. Verbaut sind ASICs etwa in USB-Ladegeräten und Netzwerk-Switches.

Einige Merkmale von ASICs sind:

Spezifität: ASICs werden für eine bestimmte Aufgabe oder Anwendung maßgeschneidert. Dies ermöglicht eine hohe Effizienz und Leistungsfähigkeit in Bezug auf diese spezielle Funktion, macht sie jedoch weniger flexibel im Vergleich zu allgemeinen Prozessoren.
Effizienz: Da ASICs auf eine bestimmte Aufgabe zugeschnitten sind, können sie diese Aufgabe oft viel effizienter und schneller ausführen als allgemeine Prozessoren. Das ist besonders wichtig in Bereichen, in denen Geschwindigkeit und Energieeffizienz entscheidend sind.
Anwendungen: ASICs werden in verschiedenen Bereichen eingesetzt, darunter Telekommunikation, Netzwerkausrüstung, Mining von Krypto-Währungen (z. B. ASIC-Miner für Bitcoin), eingebettete Systeme, und viele andere spezialisierte Anwendungen.
Entwicklungskosten: Die Entwicklung von ASICs kann teuer und zeitintensiv sein, da sie spezifisch für eine bestimmte Anwendung angepasst werden müssen. Dies macht ASICs besonders sinnvoll für Anwendungen, in denen hohe Stückzahlen produziert werden und die Kosten über den Massenverkauf amortisiert werden können.

ASICs sind nicht so flexibel wie CPUs oder GPUs, aber wenn es um spezialisierte und rechenintensive Aufgaben geht, können sie eine überlegene Leistung bieten. Will man eine spezielle Prozessorstruktur, diese aber individuell auf verschiedene Anwendungen hin nutzen, dann sollt man sich für ein FPGA entscheiden.

Speziell, aber flexibel: Was ist ein FPGA?

FPGA steht für „Field-Programmable Gate Array“ (feldprogrammierbare Gatteranordnung). Dieser Prozessor im Gegensatz zu ASICs programmierbar. Das bedeutet, dass ein FPGA nach der Herstellung vom User konfiguriert werden kann. Zum Beispiel kommen diese Art von Prozessoren in modernen Retro-Gaming-Lösungen vor, welche verschiedene Konsolen imitieren sollen. So kann der FPGA die Struktur alter Hardware transportieren, ist aber nicht auf die Simulation eines bestimmten Geräts festgelegt, sondern kann bspw. je nach eingesetztem Spiel als SNES, Sega Genesis, Sega Saturn o. ä. dienen. FPGAs stehen in Form und Funktion, grob gesagt, zwischen CPUs und ASICs.

Einige Merkmale von FPGAs sind:

Programmierbarkeit: FPGAs sind flexibel und können nach Bedarf programmiert werden. Dies ermöglicht es, die Funktionalität der Schaltung nach der Herstellung anzupassen. Das ist besonders nützlich, wenn sich die Anforderungen ändern oder wenn Prototypen entwickelt werden.
Gatter und Verbindungen: FPGAs bestehen aus einer Matrix von programmierbaren Logikblöcken (Gates) und Routing-Ressourcen. Diese Blöcke können in unterschiedlicher Weise miteinander verbunden werden, um komplexe digitale Schaltungen zu erstellen.
Anwendungen: FPGAs werden in einer Vielzahl von Anwendungen eingesetzt, darunter Signalverarbeitung, drahtlose Kommunikation, Bildverarbeitung, Automobilindustrie, Netzwerke und viele andere. Sie sind besonders nützlich in Bereichen, in denen Anpassbarkeit, Leistung und parallele Verarbeitung wichtig sind.
Entwicklungszeit: Im Vergleich zu ASICs haben FPGAs kürzere Entwicklungszeiten, da sie bereits nach der Herstellung programmierbar sind und keine spezielle Anpassung für eine bestimmte Anwendung erfordern.

Obwohl FPGAs nicht so effizient wie ASICs für eine spezielle Anwendung sein können, bieten sie den Vorteil der Programmierbarkeit und Flexibilität, was sie zu einer geeigneten Wahl für verschiedene Entwicklungs- und Prototyping-Szenarien macht. Developer können ihre eigene digitale Logik erstellen und anpassen, um spezifische Funktionen zu implementieren, ohne physische Schaltkreise neu entwerfen zu müssen.

Die Grafikeinheit: Was ist eine GPU?

Eine GPU (Graphics Processing Unit) ist eine spezialisierte Art von Prozessor, die hauptsächlich für die Verarbeitung von Grafik- und Bilddaten in einem Computer verantwortlich ist. Im Gegensatz zur CPU, die allgemeine Zwecke erfüllt, ist die GPU darauf ausgelegt, große Mengen von Daten parallel zu verarbeiten. Ursprünglich wurden GPUs in Form von „Grafikkarten“ hauptsächlich für die Darstellung von 3D-Grafiken in Videospielen und Anwendungen für Computergrafiken entwickelt, aber sie haben sich im Laufe der Zeit zu leistungsstarken Beschleunigern für eine breite Palette von rechenintensiven Aufgaben entwickelt.

Die wichtigsten Merkmale und Funktionen einer GPU umfassen:

Parallelverarbeitung: Im Gegensatz zur sequenziellen Verarbeitung von Daten durch eine CPU kann eine GPU viele Operationen gleichzeitig (parallel) ausführen. Dies ist besonders vorteilhaft für Aufgaben, bei denen große Datenmengen gleichzeitig verarbeitet werden müssen, wie zum Beispiel in der Bild- und Videobearbeitung oder bei wissenschaftlichen Berechnungen.
Shader: GPUs verwenden spezielle Programme, sogenannte Shader, um komplexe grafische Effekte zu erzeugen. Diese Shader können für verschiedene Zwecke angepasst werden, einschließlich der Simulation von Licht und Schatten, der Darstellung von Texturen sowie anderen visuellen Effekten und Animationen.
CUDA und OpenCL: Viele moderne GPUs unterstützen Frameworks wie CUDA (Compute Unified Device Architecture) von NVIDIA oder OpenCL (Open Computing Language), die es Developern ermöglichen, die Rechenleistung der GPU für allgemeine Zwecke zu nutzen. Dies ermöglicht die Beschleunigung von Anwendungen, die über reine Grafikverarbeitung hinausgehen, wie zum Beispiel wissenschaftliche Simulationen, maschinelles Lernen und Mining von Kryptowährung.

Insgesamt bieten GPUs eine leistungsstarke Lösung für rechenintensive Anwendungen, die von der parallelen Verarbeitung großer Datenmengen profitieren können. Im folgenden Video seht ihr eine vereinfachte Modelldarstellung der Bildverarbeitung durch eine CPU (langsam und in Einzelschritten) und eine GPU (schnell und per Gesamtbilderstellung). Die vereinfachte Darstellung sollte die Gegenüberstellung verständlich machen:

Anwendung von KI: Was ist eine NPU?

Die Abkürzung NPU steht für „Neural Processing Unit“ (Neuronale Verarbeitungseinheit). Eine NPU ist eine spezialisierte Hardwarekomponente, die darauf ausgerichtet ist, Aufgaben im Zusammenhang mit künstlicher Intelligenz (KI) und maschinellem Lernen zu beschleunigen, insbesondere solche, die neuronale Netzwerke involvieren.

Hier sind einige wichtige Merkmale von NPUs:

Neuronale Netzwerke: NPUs sind darauf ausgelegt, die speziellen Anforderungen von neuronalen Netzwerken zu erfüllen, die in vielen KI-Anwendungen wie Bilderkennung, Spracherkennung, maschinelles Übersetzen und anderen komplexen Mustererkennungsaufgaben verwendet werden.
Parallelverarbeitung: Neuronale Netzwerke erfordern intensive Berechnungen, insbesondere Matrixoperationen und lineare Algebra. NPUs sind so konzipiert, dass sie diese Berechnungen effizient parallel verarbeiten können, was zu einer beschleunigten Ausführung von KI-Modellen führt.
Beschleunigung von Inferenzen: NPUs sind oft darauf spezialisiert, Inferenzoperationen (das Anwenden eines trainierten Modells auf neue Daten) zu beschleunigen. Ein Beispiel hierfür wäre die „Neural Engine“ in SoC-Modellen von Apple, etwa dem A-Chip im iPhone oder dem M-Chip im Mac.
Energieeffizienz: Da künstliche Intelligenz in verschiedenen Anwendungen wie Smartphones, IoT-Geräten und anderen eingebetteten Systemen eingesetzt wird, ist die Energieeffizienz von NPUs oft ein wichtiges Merkmal, um den Stromverbrauch zu minimieren. Aber auch in Desktop-Computern mit Netzanschluss können sie effizient eingesetzt werden, um den Stromverbrauch von KI-Anwendungen zu senken.

NPUs sind ein Beispiel für spezialisierte Hardware, die entwickelt wurde, um den wachsenden Bedarf an Rechenleistung für KI-Anwendungen zu decken. Sie können in verschiedenen Geräten eingesetzt werden, von Cloud-Servern über Edge-Geräte bis hin zu Endverbraucherprodukten, um die Ausführung von KI-Algorithmen zu optimieren. Ein Beispiel ist die „Neural Engine“ von Apple.

Maschinelles Lernen: Was ist eine TPU?

TPU steht für „Tensor Processing Unit“. Es handelt sich um eine speziell entwickelte Hardware von Google für maschinelles Lernen und Tensor-basierte Berechnungen. TPU ist darauf ausgerichtet, TensorFlow-Aufgaben, die ein weit verbreitetes Open-Source-Framework für maschinelles Lernen sind, besonders effizient durchzuführen.

Einige Merkmale von TPUs sind:

Tensor-basiert: TPUs sind speziell für die Verarbeitung von Tensoren optimiert. Tensoren sind multidimensionale Datenstrukturen, die in vielen maschinellen Lernanwendungen verwendet werden, insbesondere in neuronalen Netzwerken.
Effizienz: TPUs sind darauf ausgelegt, Berechnungen für maschinelles Lernen effizienter durchzuführen als herkömmliche CPUs oder GPUs. Dies liegt daran, dass sie bestimmte Operationen, die in maschinellen Lernalgorithmen häufig vorkommen, besonders schnell und effizient ausführen können.
Google Cloud TPUs: Google bietet Cloud-TPUs an, die es Developern ermöglichen, die Rechenleistung von TPUs über die Google Cloud Platform zu nutzen. Dies ermöglicht es, anspruchsvolle maschinelle Lernmodelle in der Cloud auszuführen und so Kosten für lokal angewendete Spezial-Hardware zu sparen.
Anwendungen: TPUs werden in verschiedenen Anwendungen des maschinellen Lernens eingesetzt, darunter Bilderkennung, Sprachverarbeitung, Übersetzung und andere Aufgaben, die intensive Berechnungen mit neuronalen Netzwerken erfordern.

Es ist wichtig zu beachten, dass TPUs speziell für Tensor-basierte Berechnungen optimiert sind und ihre Stärken insbesondere bei Anwendungen im Bereich des maschinellen Lernens entfalten. Im Vergleich zu allgemeinen CPUs und GPUs können TPUs daher in diesen speziellen Anwendungsfällen eine höhere Leistung und Energieeffizienz bieten.

Datenverarbeitung: Was ist eine DPU?

Als DPU (Data Processing Unit) bezeichnet man im Allgemeinen eine Komponente oder Einheit in einem Computersystem, die für die Verarbeitung von (bestimmten) Daten zuständig ist. Es kann sich dabei um verschiedene Arten von Prozessoren oder spezialisierter Hardware handeln, die darauf ausgelegt ist, Daten in einer bestimmten Weise zu verarbeiten. Hier sind einige mögliche Interpretationen:

Allgemeine Datenverarbeitungseinheit: Der Begriff DPU kann einfach eine allgemeine Bezeichnung für eine Recheneinheit sein, die für die Verarbeitung von Daten in einem Computer oder einem anderen elektronischen System zuständig ist. Dies könnte eine CPU (Central Processing Unit) oder eine andere Art von Prozessor umfassen, der Befehle ausführt und Daten gemäß den Anweisungen von Softwareanwendungen verarbeitet.
Spezialisierte Datenverarbeitungseinheit: In einigen Fällen kann DPU auf eine spezialisierte Hardwareeinheit hinweisen, die für bestimmte Arten von Datenverarbeitungsaufgaben optimiert ist. Dies könnte beispielsweise eine Einheit sein, die für die Verarbeitung von Grafikdaten, Signalverarbeitung oder maschinelles Lernen entwickelt wurde. DPU kann also als Überbegriff für GPUs, NPUs, TPUs und dergleichen genutzt werden.
Netzwerk-Datenverarbeitungseinheit: In Netzwerken kann DPU auf eine Einheit hinweisen, die speziell für die Verarbeitung von Daten im Kontext von Netzwerkkommunikation optimiert ist. Dies könnte Funktionen wie das Routen von Datenpaketen, das Durchführen von Sicherheitsprüfungen oder das Verarbeiten von Netzwerkanalysen umfassen. In Netzwerken kann für die IT-Sicherheit zudem eine „Deep Packet Inspection Processing Unit“ eingesetzt werden, die Datenpakete inspiziert und ebenfalls mit „DPU“ abgekürzt wird.

Der genaue Kontext, in dem der Begriff verwendet wird, bestimmt, welche Art von Datenverarbeitung und welche Art von Prozessoreinheit gemeint sind. In der Regel bezieht sich DPU jedoch auf eine Hardwarekomponente, die auf die Verarbeitung von Daten in festgelegter Form spezialisiert ist.

Quantencomputer: Was ist eine QPU?

Die Abkürzung QPU steht für „Quantum Processing Unit“ (Quantenverarbeitungseinheit). Im Gegensatz zu klassischen Computern, die auf Bits basieren, die den Zustand 0 oder 1 annehmen können, verwenden Quantencomputer Qubits, die sich in einer Überlagerung von Zuständen befinden können. Das ermöglicht es Quantencomputern, spezifische Probleme, wie zum Beispiel bestimmte kryptographische Anwendungen oder komplexe Optimierungsprobleme, möglicherweise schneller zu lösen als herkömmliche Computer.

Ein paar wichtige Punkte zur QPU:

Quantenüberlagerung: Qubits können durch den Zustand der Quantenüberlagerung mehrere Zustände gleichzeitig repräsentieren. Dies eröffnet die Möglichkeit, bestimmte Berechnungen parallel durchzuführen.
Verschränkung: Qubits können miteinander verschränkt werden, sodass der Zustand eines Qubits mit dem Zustand eines anderen Qubits verbunden ist. Dies ermöglicht eine starke Korrelation zwischen den Qubits, was in bestimmten Anwendungen nützlich sein kann.
Quantenverschlüsselung: Quantencomputer könnten in der Lage sein, Quantenverschlüsselungssysteme zu brechen, aber sie könnten auch verwendet werden, um sichere Quantenkommunikation zu ermöglichen.
Erweiterung statt Ersatz für bestehende Hardware: Quantencomputer sind dafür gedacht, neue Bereiche des Computing zu erschließen. Neben Ver- und Entschlüsselung von Daten sind dabei auch komplexe Simulationen eine Nutzungsmöglichkeit. Quantencomputer sollen jedoch nicht die aktuelle Computertechnik als „Super-Version“ derselben ersetzen. Wer also auf einen buchstäblichen „Quantensprung“ für das Gaming-Setup hofft, wird leider enttäuscht.

Es ist wichtig zu beachten, dass Quantencomputer noch in der Entwicklungsphase sind und viele technische Herausforderungen zu überwinden sind, bevor sie für allgemeine Anwendungen nutzbar sind. Der Begriff QPU bezieht sich auf die spezielle Verarbeitungseinheit in einem Quantencomputer, die für die Ausführung quantenmechanischer Berechnungen verantwortlich ist. Unternehmen und Forschungseinrichtungen weltweit arbeiten intensiv an der Entwicklung von Quantencomputern und QPUs, um die Leistungsfähigkeit und Zuverlässigkeit dieser Technologie zu verbessern.

Mehrere Einheiten in einem: Was ist ein SoC?

Ein SoC steht für „System-on-a-Chip“ (System auf einem Chip). Es handelt sich um eine integrierte Schaltung, die mehrere Komponenten und Funktionen eines kompletten Computersystems auf einem einzigen Chip vereint – also mehrere integrierte Schaltkreise auf einer einzelnen Silizium-Platte. Diese Komponenten können Prozessoren, Speicher, Schnittstellen, Kommunikationsmodule und andere umfassen, die normalerweise einzeln aufgesteckt auf einer Hauptplatine (Motherboard oder Logicboard) eines traditionellen Computers zu finden sind.

Einige wichtige Merkmale eines SoC sind:

Integration: SoC integriert verschiedene Komponenten auf einem einzigen Chip, was Platz spart, den Datenaustausch beschleunigt und die Energieeffizienz verbessern kann.
Energieeffizienz: Durch die Integration von Komponenten auf einem Chip können Energieverluste durch die Kommunikation zwischen verschiedenen Chips minimiert werden.
Kompaktheit: SoCs sind oft in kompakten und kleinen Formfaktoren erhältlich, was sie ideal für den Einsatz in mobilen Geräten, IoT-Geräten (Internet der Dinge), Laptops, Mini-Computern und anderen platzbeschränkten Umgebungen macht.
Anwendungen: SoCs kommen in einer Vielzahl von Geräten zum Einsatz, darunter Smartphones, Tablets, eingebettete Systeme, IoT-Geräte, Smart TVs, etc. Durch ihre Energieeffizienz (und Apples Bemühungen seit 2020) werden sie vermehrt auch in Computern eingesetzt.
Vielseitigkeit: Da SoCs verschiedene Funktionen integrieren können, sind sie äußerst vielseitig und können für eine breite Palette von Anwendungen angepasst werden. Sie können für die Realisierung moderner Betriebssysteme und für diese entwickelte Apps sorgen.

Beispiele für SoCs sind bei Apple zu finden, von Mac, iPad und iPhone über Apple Watch und Apple TV hin zum Studio Display und zur Vision Pro. Neben der Grafik-Einheit (CPU) sind in einem M-Chip im Apple Mac u. a. auch eine Grafik-Einheit (GPU), die Neural Engine (NPU), die Media Engine (auf Video-Kodierung und -Dekodierung spezialisierte Einheit) und dergleichen mehr zu finden. Hier kommen also verschiedenste Prozessoren zum Einsatz, um verschiedenste Aufgaben so schnell und effizient wie möglich erledigen zu können.