看个病都有大模型陪诊了!上海市第一人民医院主导,一手体验在此
现在看个病,都有大模型全程陪诊了。 这是上海市第一人民医院此时此时正在发生的事情—— AI就医助理,无需下载APP,打开支付宝就能用。 从诊前预约挂号、在线取号,到诊中院内导航、排队叫号、扫码支付,再...
一次可输入多张图像,还能多轮对话!最新开源数据集,让AI聊天更接近现实
大模型对话能更接近现实了! 不仅可以最多输入20张图像,还能支持多达27轮对话。可处理文本+图像tokens最多18k。 这就是最新开源的超长多图多轮对话理解数据集MMDU(Multi-Turn Mu...
AI如何改变通信?对话联想懂的通信
刚刚,世界通信行业顶级大会——MWC上海站落下帷幕。 展会上,不仅5.5G(5G-A)标准正式亮相,AI也成为了通信领域新的热门话题。 与此同时,承载这些功能的终端丰富多样,从PC、汽车到新物种,已经...
炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言自由交流
很炸裂!讯飞星火大秀语音识别能力,现场掌声雷动—— 三个人同时说话,再加上背景音乐,如此强干扰的场景,大模型却表示都能听懂听清,还瞬间转化为文字,语音识别的“鸡尾酒会”难题不在话下~ ,时长00:23...
谷歌开源系模型第二代免费开放!27B媲美LLaMA3 70B,单H100或TPU主机可跑
谷歌开源模型Gemma 2开放了! 虽然前段时间Google I/O大会上,Gemma 2开源的消息就已经被放出,但谷歌还留了个小惊喜—— 除27B模型外,还有一个更轻的9B版本。 DeepMind创...
Lecun断言LLM不会达到人类智能水平
Lecun断言LLM不会达到人类智能水平

据《金融时报》报道,图灵奖得主 Lecun 认为—— 自回归 LLM 不足以达到人类水平的智力(甚至猫水平的智力)。 他指出,这类大语言模型的缺陷在于缺乏对逻辑的理解,对物理世界的掌握有限,没有持久记…

NVIDIA发布数字人 AI 技术:NVIDIA ACE
NVIDIA发布数字人 AI 技术:NVIDIA ACE

可以让游戏NPC具有AI对话功能,同时能直接生成数字人的语音和面部动画! Avatar Cloud Engine (ACE)是一项用于提升游戏和虚拟角色互动体验的技术。 1.赋予游戏角色智能:ACE可…

中国芯片领域史上最大规模基金项目落地
中国芯片领域史上最大规模基金项目落地

国家集成电路产业投资基金三期(大基金三期)正式成立,注册资本3440亿元。 此次投资比一期(987.2亿元)、二期(2041.5亿元)总和更多。 这是中国芯片领域史上最大规模基金项目,也是芯片领域最新…

Khoj:一个开源的个人化AI 助手
Khoj:一个开源的个人化AI 助手

能连接你的在线和本地文档 充当你的第二大脑 Khoj 可以连接你本地的PDF等文件和在线Markdown、GitHub和Notion文件,并将它们与在线信息整合在一起。 在你的文档和笔记中提供快速、准…

OpenAI妥协 准备向媒体购买内容训练AI
OpenAI妥协 准备向媒体购买内容训练AI

The Information 报道,两名与OpenAI 谈判的媒体高管透露,OpenAI已经向一些媒体公司开出了每年 100 万-500 万美元,以获得将新闻内容用于训练自家大语言模型的授权许可。 …

Lumiere:一次性生成整个视频
Lumiere:一次性生成整个视频

Google Research团队开发的基于空间时间的文本到视频扩散模型。 它采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时间长度,不同于其他模型那样逐帧合成视频。 确保了生成视频的连…

Mac 版 ChatGPT 客户端能力首次展示
Mac 版 ChatGPT 客户端能力首次展示

在巴黎的 VivaTech 活动上,OpenA 法国团队展示了最新GPT 4o实时语音和视觉你能力 不过这次使用的 Mac 版客户端 展示了实时翻译能力以及通过视觉识别简笔画并观看地图进度导航引导。 …

利用一张图和提取视频中的人物姿势开源
利用一张图和提取视频中的人物姿势开源

阿里的那个利用一张图和提取视频中的人物姿势 合成角色动画的项目被Novita AI开源并做了API 现在可以通过他们的API直接接入合成动画了 你只需要提供一张照片+一个参考视频即可,它能够自动识别视…

超详细的胎教级Midjourney使用教程
超详细的胎教级Midjourney使用教程

一、Midjourney强大在哪里? 1.照片风格多样 在Midjourney里面,几乎可以生成各种风格的照片(不可以涩涩) 2.操作简单,照片质量高 AI绘画没有大家想象的那么难 在Midjourn…

GPT-Pilot:AI开发者伴侣
GPT-Pilot:AI开发者伴侣

GPT Pilot 一个真正的AI程序员,它可以从零开始构建整个应用程序,它能自己编写代码、配置开发环境、管理开发任务、调试代码,你还可以随时和它聊天提问帮助你解决开发难题。 你只需要在一旁监督开发过…

该来的终于来了,Midjourney将面临集体诉讼
该来的终于来了,Midjourney将面临集体诉讼

Midjourney 被曝光未经许可使用了包含 16000 名艺术家的作品风格来训练其图像生成AI。 这个名单不仅包括现代和当代著名艺术家的作品,还包括了为公司如Hasbro和Nintendo工作的商…

ChatGPT永久记忆功能正式上线
ChatGPT永久记忆功能正式上线

OpenAI宣布ChatGPT的一项重要更新:增加了记忆功能和新的用户控制选项。 GPT现在可以在与用户的交互中跨聊天记住你们互动的所有信息,并在后续对话中利用这些信息来提供更相关和个性化的回答。 之…

更多