← back

Scalable Physics-Inspired Transformers for Spin Glasses

📄 arXiv:2606.22984 · 📥 PDF · 2026-06-22 · cond-mat.stat-mech

Authors: Lu Zhong [arXiv · scholar] , Wenli Duan [arXiv · scholar] , Jing Liu [arXiv · scholar] , Pan Zhang [arXiv · scholar] , Ying Tang [arXiv · scholar]

🕰 Orloj analysis

7.9
Total score
8.5
Consistency
7.0
Quality
AD relevance

Tento článek představuje transformátor inspirovaný fyzikou pro efektivní vzorkování Boltzmannova rozdělení ve frustrovaných spinových sklech. Řeší problémy škálovatelnosti a vysokých výpočetních nákladů, dosahuje výrazného zrychlení a umožňuje simulace větších systémů než předchozí metody strojového učení.

💡 Práce přináší novou aplikaci transformátorů pro spinová skla, nabízí značné zrychlení výpočtů a škálovatelnost, což je cenné pro statistickou mechaniku a kombinatorickou optimalizaci.

Categories: MET-5 EMG-1 MET-4

✓ falsifiable, limit_reductions, modest_claims

⚠ interpretable_claim_vague, no_explicit_code_availability, no_explicit_error_bars_in_abstract

📄 Abstract

Efficient sampling of the Boltzmann distribution in frustrated spin glasses is central to statistical mechanics and combinatorial optimization. Despite advances in machine-learning-based approaches, two issues persist: limited understanding of why variational models fail to benefit from increased scale, unlike the monotonic scaling law of large language models; and high computational cost on large systems that negates advantages over classical sampling methods. Here, we develop a physics-inspired transformer with interpretable sparse attention and spin-tailored positional embeddings to address these challenges. By further leveraging FlashAttention for parallel ancestral sampling, it achieves up to two orders of magnitude speedup over vanilla variational autoregressive networks, enabling neural-network simulations of spin-glass systems to unprecedented sizes on a single GPU. It can resolve full probability distributions, free energies, and overlap statistics across temperatures, for Sherrington-Kirkpatrick and 2D or 3D Edwards-Anderson models, where existing machine-learning methods encounter limitations at certain temperatures. This framework thus establishes a scalable paradigm for frustrated spin-glass systems.

📄 arXiv abstract page 📥 PDF