两行代码解决大语言模型对话局限!港中文贾佳亚团队联合MIT发布超长文本扩展技术 (两行代码解决电脑卡顿)
中途迷失、模型偷懒、上下文越长大模型越笨......如果体验过大语言模型产品,用户多少会对文本输入长度带来的限制有所感触,比如当想和大模型讨论一些稍长的内容,需要拆分输入,而前面输入的要点,很快就会被大模型忘记,这是典型的大语言模型对话缺陷!就像先天有注意力缺陷的儿童,难以专注看完一本新书,而缺陷的关键,在于模型缺乏长文本处理能力,这...。
连看好莱坞大片都学会了!贾佳亚团队用2token让大模型卷出新境界 (看看好莱坞大片)
家人们谁懂,连大模型都学会看好莱坞大片了,播放过亿的GTA6预告片大模型还看得津津有味,实在太卷了!而让LLM卷出新境界的办法简单到只有2token——将每一帧编码成2个词即可搞定,等等!这种大道至简的方法有种莫名的熟悉感,不错,又是出自香港中文大学贾佳亚团队,这是贾佳亚团队自8月提出主攻推理分割的LISA多模态大模型、10月发布的7...。
高分低能 一秒侦破大模型 贾佳亚团队联手剑桥清华等共推评测新范式 (高分低能儿)
贾佳亚团队全新评测基准MR,Ben发布,拒绝大模型,高分低能,随着人工智能领域经历GPT时刻,学术界和产业界共同发力,每月甚至每周都有新的模型问世,大模型产品之多可以说是让人眼花缭乱,为了筛选出真正业界领先的大模型产品,业内衍生出了错综复杂的各类大模型评测方式,大家都希望为大模型做出客观公正的评测,看看究竟哪家产品能力更强,但为了在行...。
VLM 模型 生图超级外挂!贾佳亚团队提出 Mini (m-v模型)
更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力,还能结合图像推理和生成,香港中文大学终身教授贾佳亚团队提出的这款多模态模型Mini,Gemini堪称绝绝子,相当于开源社区的GPT4,DALLE3的王炸组合!Mini,Gemini还提供了2B小杯到34B的超大杯,最强模型在多个指标上相比GoogleGeminiPro甚...。
解锁多模态大模型 大模型 港中文贾佳亚团队提出 LISA 推理分割 能力 (多模态界面)
当前的视觉识别系统都依赖人类用户明确指代目标物体或预先设定识别类别,进而进行识别,它们仍然只能处理简单明确的指令,如,橙子,,而无法解析相对隐式和复杂的指令,如在下图中指出,维生素C含量高的食物,而真正的智能感知系统应该根据用户指令推理其真实意图,例如,在指示机器人时,人们往往倾向于直接给一个指令,我想要看电视,,而不是分几个步...。