Approximate Integration
Linearization and Approximation
Accuracy, limits, and approximation
Application of Linearization and Approximation
Bacterial Transformation
Linear Approximation in Frequency Domain
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
Yiwen Kang1,2, Dong Wang1,2
1Institute of Information Science, Beijing Jiaotong University, Beijing 100044, China.
本研究介绍了硬件效率高的方法,通过优化非线性运算符 (如Softmax和RMSNorm) 来加速变压器推断. 这些技术可以降低资源成本和延迟,同时保持大型语言模型 (LLM) 的模型准确性.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: