优惠 字节跳动推出新型大语言模型video-SALMONN:专门设计用于增强视频理解能力,尤其是通过语音增强的音频-视觉模型
2年前 (2024-06-25)AI
字节跳动推出新型大语言模型video-SALMONN,它专门设计用于增强视频理解能力,尤其是通过语音增强的音频-视觉(av-LLM)模型。简单来说,video-SALMONN就像一个超级智能的“视频助手”,它不仅能“看”懂视频里的画面, ...... 阅读全文
优惠 拥有8亿参数的医疗语言模型Llama-3-Physician-8B-Instruct
2年前 (2024-06-25)AI
北京大学、香港科技大学和麻省理工学院-IBM Watson AI 实验室的研究人员推出Llama-3-Physician-8B-Instruct,这是一个拥有8亿参数的医疗语言模型。该模型是基于Llama 3构建的,并首先在RefinedWeb数据集中的高质量医 ...... 阅读全文
优惠 Google DeepMind推出新型策略WARP:用于通过人类反馈进行强化学习(RLHF)以对大语言模型进行对齐
2年前 (2024-06-25)AI
Google DeepMind推出新型策略WARP(Weight Averaged Rewarded Policies),用于通过人类反馈进行强化学习(RLHF)以对大型语言模型(LLMs)进行对齐。这种策略的目的是在使用人类偏好训练的奖励模型来优化语言模型时 ...... 阅读全文
优惠 以视觉为中心的方法设计!多模态大语言模型系列Cambrian-1
标签:Cambrian-1
AI
2年前 (2024-06-25)AI
纽约大学的研究人员推出多模态大语言模型系列Cambrian-1,这些模型采用以视觉为中心的方法设计。多模态大型语言模型结合了视觉和语言能力,旨在更好地理解和生成与图像和文本相关的信息。Cambrian-1的研究不仅达到了 ...... 阅读全文
优惠 D-MERIT数据集:信息检索(IR)模型的评估方法
标签:D-MERIT数据集
AI
2年前 (2024-06-25)AI
亚马逊研究院、巴伊兰大学和艾伦人工智能研究所推出D-MERIT数据集,关于信息检索(Information Retrieval,简称IR)模型的评估方法。信息检索模型的任务是在一个大型的文档集合中,根据用户提出的查询(query),找 ...... 阅读全文
优惠 评估基准BigCodeBench:用来测试大型编程语言模型在代码生成方面的能力
标签:BigCodeBench
AI
2年前 (2024-06-25)AI
评估基准BigCodeBench,它专门用来测试大型编程语言模型(LLMs)在代码生成方面的能力。这个基准通过设计具有多种功能调用和复杂指令的编程任务,来挑战和评估这些模型是否能够像人类开发者一样解决实际的编程问题。 ...... 阅读全文













