Transformer
Model transformera to rodzaj sieci neuronowej zaprojektowanej specjalnie do obsługi danych sekwencyjnych, takich jak tekst, mowa czy dane szeregów czasowych. W przeciwieństwie do tradycyjnych modeli, takich jak RNN i CNN, transformatory wykorzystują mechanizm uwagi do ważenia istotności elementów w sekwencji wejściowej, co umożliwia osiąganie wysokiej wydajności w takich zastosowaniach jak NLP, rozpoznawanie mowy, genomika i wiele innych.