情报 微软亚洲研究院开源然后移除了新 AI 模型WizardLM-2-7B
7小时前
微软亚洲研究院的中国研究人员周二发布了一个新的 AI 模型 WizardLM-2-7B,权重发布在 Hugging Face 平台上。但几小时后微软就将其从平台上移除。研究人员解释说,原因是他们意外错过了微软发布新模型前要求进行的安全测试步骤。一位知情人士表示,微软的 AI 政策要求,在发布任何 AI 模型前,必须首先... 阅读全文
优惠 新型神经网络架构TransformerFAM:为了解决大语言模型处理极长输入序列时的挑战而设计
标签:TransformerFAM
AI
18小时前AI
谷歌推出新型神经网络架构TransformerFAM,它是为了解决大语言模型(LLMs)处理极长输入序列时的挑战而设计的。例如,你有一个非常长的故事,需要一个能够记住故事中所有细节的超级大脑。传统的神经网络(比如Transformer)在处理这样的故事时会遇到麻烦,因为它们的记忆能力有限,而且处理起来非常慢。Trans... 阅读全文