一次可输入多张图像,还能多轮对话!最新开源数据集,让AI聊天更接近现实
大模型对话能更接近现实了! 不仅可以最多输入20张图像,还能支持多达27轮对话。可处理文本+图像tokens最多18k。 这就是最新开源的超长多图多轮对话理解数据集MMDU(Multi-Turn Mu...
AI如何改变通信?对话联想懂的通信
刚刚,世界通信行业顶级大会——MWC上海站落下帷幕。 展会上,不仅5.5G(5G-A)标准正式亮相,AI也成为了通信领域新的热门话题。 与此同时,承载这些功能的终端丰富多样,从PC、汽车到新物种,已经...
炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言自由交流
很炸裂!讯飞星火大秀语音识别能力,现场掌声雷动—— 三个人同时说话,再加上背景音乐,如此强干扰的场景,大模型却表示都能听懂听清,还瞬间转化为文字,语音识别的“鸡尾酒会”难题不在话下~ ,时长00:23...
谷歌开源系模型第二代免费开放!27B媲美LLaMA3 70B,单H100或TPU主机可跑
谷歌开源模型Gemma 2开放了! 虽然前段时间Google I/O大会上,Gemma 2开源的消息就已经被放出,但谷歌还留了个小惊喜—— 除27B模型外,还有一个更轻的9B版本。 DeepMind创...
LeCun谢赛宁全新多模态大模型开源:1000张A100算力训出SOTA,“不是另一个GPT-4V”
刚刚,谢赛宁&Lecun团队官宣新成果—— 正式推出以视觉为中心的多模态大模型Cambrian-1! 模型名为“寒武纪”,谢赛宁本人激动表示: 就像在寒武纪大爆发中生物发展出更好的视力一样,我...
YOLO v10:毫秒级实时的端到端目标检测开源模型
YOLO v10:毫秒级实时的端到端目标检测开源模型

由清华大学多媒体智能组(THU-MIG)开发。 从输入图像到输出检测结果的整个过程全部由模型直接完成,消除了中间的人工干预或额外处理步骤。 YOLOv10 能够在极短的时间内处理输入的图像或视频帧,通…

Lecun断言LLM不会达到人类智能水平
Lecun断言LLM不会达到人类智能水平

据《金融时报》报道,图灵奖得主 Lecun 认为—— 自回归 LLM 不足以达到人类水平的智力(甚至猫水平的智力)。 他指出,这类大语言模型的缺陷在于缺乏对逻辑的理解,对物理世界的掌握有限,没有持久记…

Mac 版 ChatGPT 客户端能力首次展示
Mac 版 ChatGPT 客户端能力首次展示

在巴黎的 VivaTech 活动上,OpenA 法国团队展示了最新GPT 4o实时语音和视觉你能力 不过这次使用的 Mac 版客户端 展示了实时翻译能力以及通过视觉识别简笔画并观看地图进度导航引导。 …

Mistral发布7B模型0.3版本
Mistral发布7B模型0.3版本

抱抱脸上线了 Mistral-7B-v0.3 的基础版和指令微调版。 相比于Mistral-7B-v0.2,新版本更新如下: – 词汇量从 32000 扩展到 32768 – …

李彦宏欧洲谈AI:比起GPT-5,我更感兴趣超级应用
李彦宏欧洲谈AI:比起GPT-5,我更感兴趣超级应用

“欧洲AI春晚”主论坛现场,李彦宏最新亮相,作为大会唯一受邀中国企业家,再一次为中国AI“代言”。 这场正在法国巴黎举办的大会全称“欧洲科技创新展览会”(Viva Technology),是欧洲规模最…

OpenAI下架寡姐声音
OpenAI下架寡姐声音

OpenAI的新王炸GPT-4o还没全面铺开,就摊上事了! 抓马的是,此次推出的“视频通话”功能一度被称为电影《Her》现实版,而怒斥OpenAI的刚好是给电影中AI配音的斯嘉丽·约翰逊(寡姐)。 寡…

英特尔预计Q3发布下一代AIPC处理器
英特尔预计Q3发布下一代AIPC处理器

英特尔官方最新宣布—— 自今年第3季度起到假日季,其即将到来的客户端处理器 Lunar Lake 将继续扩大全球AI PC规模,并在未来可用时免费升级 Windows 11 AI PC体验。 Luna…

Meta新发布多模态模型
Meta新发布多模态模型

Meta 的 FAIR 团队新发表了一项名为 Chameleon 的研究。 该研究开发了一系列早期融合的混合模态基础模型,能够以任意顺序理解和生成图像和文本。 该模型在综合任务上进行了评估,包括视觉问…

UMI:斯坦福开发的一个机器人数据收集和策略学习框架
UMI:斯坦福开发的一个机器人数据收集和策略学习框架

通过手持式夹持器和精心设计的接口进行数据收集。 UMI可以将人类在复杂环境下的操作技能直接转移给机器人,无需人类编写详细的编程指令。 也就是通过人类亲自操作演示然后收集数据,直接转移到机器人身上,使得…

AI图片视频去水印合集
AI图片视频去水印合集

实际上大部分水印都是不可能去除的,这里说的不是各大平台的解析无水印下载,而是自带水印,只能遮盖水印,或者是模糊水印,又或者裁剪 1、Photoshop:必备技能,点击下载:Photoshop 2023…

ChatGPT永久记忆功能正式上线
ChatGPT永久记忆功能正式上线

OpenAI宣布ChatGPT的一项重要更新:增加了记忆功能和新的用户控制选项。 GPT现在可以在与用户的交互中跨聊天记住你们互动的所有信息,并在后续对话中利用这些信息来提供更相关和个性化的回答。 之…

更多