Transformer
Ein Transformer-Modell ist eine Art von neuronalen Netzwerken, die speziell dafür entwickelt wurden, sequenzielle Daten wie Text, Sprache oder Zeitreihendaten zu verarbeiten. Im Gegensatz zu traditionellen Modellen wie RNNs und CNNs verwenden Transformer einen Attention-Mechanismus, um die Bedeutung der Elemente in der Eingabesequenz zu gewichten. Dadurch erzielen sie eine herausragende Leistung in Anwendungen wie NLP, Spracherkennung, Genomik und mehr.