优惠 LLM-Microscope:探索Transformer解码器中的线性特性,尤其是像GPT、LLaMA、OPT、BLOOM等模型
2年前 (2024-05-22)AI
AIRI、Skoltech、SberAI、HSE 大学、莫斯科国立罗蒙诺索夫大学的研究人员发布论文,主题是探索Transformer解码器中的线性特性,尤其是像GPT、LLaMA、OPT、BLOOM等模型。Transformer模型在自然语言处理(NLP)领域取得了革命性的进展,但它们的内部工作机制仍然不完全清楚。这项... 阅读全文
优惠 如何减少Transformer模型中关键值(Key-Value,KV)缓存的大小
标签:Transformer模型
AI
2年前 (2024-05-22)AI
MIT的研究人员发布论文,主题是关于如何减少Transformer模型中关键值(Key-Value,KV)缓存的大小。Transformer模型是当前自然语言处理(NLP)领域非常流行的一种模型,它在处理大语言模型(LLMs)时,解码速度很快,但需要大量的内存来存储KV缓存,这在处理长序列和大批量数据时尤其成问题。 主... 阅读全文
优惠 腾讯云 AI 代码助手免费限时公测:自动补全、根据注释生成内容、解释代码等
标签:腾讯云 AI 代码助手
AI
2年前 (2024-05-22)AI
腾讯云宣布旗下 AI 代码助手现已开放免费限时公测,目前开发者、开发团队、企业客户可以通过腾讯云官网在线体验。AI 代码助手是腾讯云自研的一款编程提效辅助工具,以插件形式安装到编辑器(VSCode 或者 JetBrian 系列 IDE)中辅助编程。AI 代码助手可提供自动补全代码、根据注释生成代码、代码解释、生成测试代... 阅读全文
优惠 百川智能发布新一代大模型Baichuan 4及AI助手“百小应”
2年前 (2024-05-22)AI
今日,百川智能正式推出了最新一代基座大模型Baichuan 4。与前一代Baichuan 3相比,Baichuan 4在各项能力上均有显著提升,通用能力提升超过10%,数学和代码能力分别提升了14%和9%。在国内知名大模型评测机构SuperCLUE的评测中,Baichuan 4的模型能力位居国内第一。Baichuan ... 阅读全文













