Matto

Backlinks

Attention
Large Language Model
Sequence Length
Sequence
Transformer Dataflow (types view)

Recent Notes

AGENTS
Feb 05, 2026
CLAUDE
Feb 05, 2026
About Me
Feb 03, 2026

❯

The thumb drive

❯

Transformer

Feb 03, 20261 min read

A neural network architecture built from (self-) attention layers plus position-wise feed-forward layers.

Often used as the backbone of modern LLMs.

machine-learning

Graph View

Created with Quartz v4.5.2 © 2026