一次可输入多张图像,还能多轮对话!最新开源数据集,让AI聊天更接近现实
大模型对话能更接近现实了! 不仅可以最多输入20张图像,还能支持多达27轮对话。可处理文本+图像tokens最多18k。 这就是最新开源的超长多图多轮对话理解数据集MMDU(Multi-Turn Mu...
AI如何改变通信?对话联想懂的通信
刚刚,世界通信行业顶级大会——MWC上海站落下帷幕。 展会上,不仅5.5G(5G-A)标准正式亮相,AI也成为了通信领域新的热门话题。 与此同时,承载这些功能的终端丰富多样,从PC、汽车到新物种,已经...
炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言自由交流
很炸裂!讯飞星火大秀语音识别能力,现场掌声雷动—— 三个人同时说话,再加上背景音乐,如此强干扰的场景,大模型却表示都能听懂听清,还瞬间转化为文字,语音识别的“鸡尾酒会”难题不在话下~ ,时长00:23...
谷歌开源系模型第二代免费开放!27B媲美LLaMA3 70B,单H100或TPU主机可跑
谷歌开源模型Gemma 2开放了! 虽然前段时间Google I/O大会上,Gemma 2开源的消息就已经被放出,但谷歌还留了个小惊喜—— 除27B模型外,还有一个更轻的9B版本。 DeepMind创...
LeCun谢赛宁全新多模态大模型开源:1000张A100算力训出SOTA,“不是另一个GPT-4V”
刚刚,谢赛宁&Lecun团队官宣新成果—— 正式推出以视觉为中心的多模态大模型Cambrian-1! 模型名为“寒武纪”,谢赛宁本人激动表示: 就像在寒武纪大爆发中生物发展出更好的视力一样,我...
Midjourney 推出 Personalization 功能
Midjourney 推出 Personalization 功能

会记住你的艺术喜好 当你在Midjourney网站上对一对对的图像进行排名时,选择你喜欢的图像。 比如,你会看到两张图片,你选择更喜欢哪一张。 Midjourney会记住你的选择。 使用个性化参数:当…

Freepik Designer:一个在线AI 图像编辑器
Freepik Designer:一个在线AI 图像编辑器

几分钟内完成专业级别的图像设计 1、无需设计技能:即使没有设计经验,用户也可以轻松上手,避免设计中的繁琐步骤。无需下载任何软件,直接在线上进行设计编辑。 2、海量模板:提供丰富的模板库,包括Logo、…

DuckDuckGo 推出私密AI 聊天机器人
DuckDuckGo 推出私密AI 聊天机器人

承诺不会使用你的数据训练模型 目前免费,无需注册即可使用 DuckDuckGo通过替换用户的IP地址,确保聊天内容无法追溯到个人。 也不会存储用户数据,并确保 AI 提供商在 30天内删除保存的聊天记…

Chatwiz:一个非常丝滑的 AI 虚拟女朋友
Chatwiz:一个非常丝滑的 AI 虚拟女朋友

高度还原真实对话 包含6个角色,3位女性3位女性,对话非常的丝滑,非常接近真人对话情景。 根据股权穿透来看,应该是字节旗下的产品。 在线体验:https://chatwiz.cn 之前泄露了一些这些A…

腾讯混元发布开源加速库,生图时间缩短75%
腾讯混元发布开源加速库,生图时间缩短75%

腾讯混元针对文生图开源模型,发布了一组【加速库】—— 加速后的生图时间缩短75%、生图速度提升4倍。 据了解,官方通过两个方面实现生成加速: – 知识蒸馏。通过降低扩散模型迭代的步数实现加…

AI虚拟角色国内产品榜TOP15
AI虚拟角色国内产品榜TOP15

AI智能助手,代表的是生产力方向。 AI陪伴,则是从互动娱乐的方向,展开最in AI原生产品的竞逐。 现在,无论是角色扮演、虚拟恋人还是日常陪伴,AI陪伴产品正在用AIGC技术,以产品化形态,来到了台…

Stability AI 开源其音频生成模型:Stable Audio Open
Stability AI 开源其音频生成模型:Stable Audio Open

• 能够通过简单的文本提示生成最长47秒的立体声音频(44.1kHz)。 • 适用于创建鼓点、乐器片段、环境声音和拟音录音等。 • 基于transforms扩散模型(DiT),在自动编码器的潜在空间中…

智谱发布新的GLM 9B系列开源模型
智谱发布新的GLM 9B系列开源模型

更快的速度,更低的价格 性能提升40% 超越Llama 3 GLM 4V 9B能力比肩GPT 4V 支持1M无损上下文,26种语言,函数调用能力提升40%,比肩GPT 4V

Backseat AI:英雄联盟 AI 游戏伴侣
Backseat AI:英雄联盟 AI 游戏伴侣

该助手能通过语音为玩家提供实时的游戏评论和建议,包括购买建议、对线策略等。 玩家可以在比赛中提出任何关于游戏的问题,并立即获得解答。 每场比赛结束后,玩家可以在赛后大厅页面查看比赛总结,包括各个玩家的…

Video-MME: 首个多模态大模型视频分析综合评估基准
Video-MME: 首个多模态大模型视频分析综合评估基准

该基准由来自多个大学和研究机构的研究人员共同开发,旨在通过多样化和高质量的数据集,全面考察MLLMs在处理视频数据时的能力。 视频数据集涵盖6个主要视觉领域,包括知识、电影与电视、体育竞技、艺术表演、…

AI和脑机接口帮助失语症患者恢复双语交流
AI和脑机接口帮助失语症患者恢复双语交流

加州大学旧金山分校的研究人员刚刚开发出一种大脑植入物,研究人员成功地帮助一名失去说话能力的双语患者通过脑植入设备实现了双语交流。 这一系统由人工智能(AI)与脑植入设备结合而成,能够实时解码患者试图表…

马斯克调整规则 正式允许 X 发布成人内容
马斯克调整规则 正式允许 X 发布成人内容

新规则允许用户在 X 平台上发布经过双方同意制作的成人内容。 此更改也适用于AI生成的视频和图像。 为了确保这些内容不会无意间暴露给不愿意看到它们的用户,X要求发布者显著标记这些内容。 平台强调,性表…

更多