优惠 新型高分辨率多模态感知模型Griffon v2:在提高大型视觉语言模型(LVLMs)在处理高分辨率图像时的性能,特别是在复杂和密集场景中对细粒度对象的识别和定位
标签:Griffon v2
AI
2年前 (2024-03-15)AI
来自中国科学院自动化研究所基础模型研究中心、中国科学院大学人工智能学院、鹏城实验室和武汉人工智能研究院的研究团队推出新型高分辨率多模态感知模型Griffon v2,这个模型旨在提高大型视觉语言模型(LVLMs)在处理高分辨率图像时的性能,特别是在复杂和密集场景中对细粒度对象的识别和定位。Griffon v2通过视觉和文... 阅读全文
优惠 新型分布式注意力框架BurstAttention:专门设计来处理极长序列的数据
标签:BurstAttention
AI
2年前 (2024-03-15)AI
这篇论文介绍了一个名为BurstAttention的新型分布式注意力框架,它专门设计来处理极长序列的数据。在大语言模型(LLMs)中,注意力模块是理解复杂文本和生成响应的关键部分,但是随着序列长度的增加,这些模块在计算时间和内存消耗上的复杂度也会呈二次方增长,这就成了一个挑战。BurstAttention通过在多个设备... 阅读全文
优惠 在线转录工具oTranscribe,帮您摆脱听写录音稿的痛苦!
标签:oTranscribe录音稿
工具
2年前 (2024-03-15)工具
oTranscribe 由《华尔街日报》数据记者 Elliot Bentley 开发的在线转录平台,所有代码都是开源的,转写时只是会从本地读取录音文件,不会将你的录音文件上传到云端,在满足记者使用习惯的同时,又充分保护了数据隐私。... 阅读全文
优惠 新型语言模型Quiet-STaR:能够自己“思考”以提高对文本的理解能力
标签:Quiet-STaR
AI
2年前 (2024-03-15)AI
来自斯坦福大学和Notbad AI的研究团队推出新型语言模型Quiet-STaR(Quiet Self-Taught Reasoner),它能够自己“思考”以提高对文本的理解能力。想象一下,当你在写作或说话时,有时会停下来思考一下,这是因为我们在大脑中构建了一种逻辑或推理过程,帮助我们更好地表达或解决问题。Quiet-... 阅读全文
















