一次可输入多张图像,还能多轮对话!最新开源数据集,让AI聊天更接近现实
大模型对话能更接近现实了! 不仅可以最多输入20张图像,还能支持多达27轮对话。可处理文本+图像tokens最多18k。 这就是最新开源的超长多图多轮对话理解数据集MMDU(Multi-Turn Mu...
AI如何改变通信?对话联想懂的通信
刚刚,世界通信行业顶级大会——MWC上海站落下帷幕。 展会上,不仅5.5G(5G-A)标准正式亮相,AI也成为了通信领域新的热门话题。 与此同时,承载这些功能的终端丰富多样,从PC、汽车到新物种,已经...
炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言自由交流
很炸裂!讯飞星火大秀语音识别能力,现场掌声雷动—— 三个人同时说话,再加上背景音乐,如此强干扰的场景,大模型却表示都能听懂听清,还瞬间转化为文字,语音识别的“鸡尾酒会”难题不在话下~ ,时长00:23...
谷歌开源系模型第二代免费开放!27B媲美LLaMA3 70B,单H100或TPU主机可跑
谷歌开源模型Gemma 2开放了! 虽然前段时间Google I/O大会上,Gemma 2开源的消息就已经被放出,但谷歌还留了个小惊喜—— 除27B模型外,还有一个更轻的9B版本。 DeepMind创...
LeCun谢赛宁全新多模态大模型开源:1000张A100算力训出SOTA,“不是另一个GPT-4V”
刚刚,谢赛宁&Lecun团队官宣新成果—— 正式推出以视觉为中心的多模态大模型Cambrian-1! 模型名为“寒武纪”,谢赛宁本人激动表示: 就像在寒武纪大爆发中生物发展出更好的视力一样,我...
【10分钟教你】如何使用Google PaLM2搭建个人知识库
【10分钟教你】如何使用Google PaLM2搭建个人知识库

我们都知道Chatgpt有一个严重的问题,就是幻觉,一部分原因是因为ChatGPT缺少该领域的专业知识。借助大型语言模型 (LLM),我们可以集成特定领域的数据来回答用户请求,一定程度缓解这个问题。这…

超详细的胎教级Midjourney使用教程
超详细的胎教级Midjourney使用教程

一、Midjourney强大在哪里? 1.照片风格多样 在Midjourney里面,几乎可以生成各种风格的照片(不可以涩涩) 2.操作简单,照片质量高 AI绘画没有大家想象的那么难 在Midjourn…

ChatGPT使用指南!基本功能与核心操作技巧
ChatGPT使用指南!基本功能与核心操作技巧

一、关于教程 如何让屏幕前的每一位同学都快速意识到这场颠覆又震撼的革命,能享受到 AI 带来生产力的暴涨,是我制作这个视频的的初衷。 本期视频要讲的就是GPT的基本教学了,其实我这边说的基本教学比很多…

百度全球首发量子领域大模型:量子科技+大模型
百度全球首发量子领域大模型:量子科技+大模型

9月26日消息,量子信息科技一向被认为是未来产业的代表之一,有数据显示,到2031年全球69%的大型企业计划将采用量子计算。 而随着ChatGPT的横空出世,认知大模型也成为了全球科技界最热门的话题之…

Stable Diffusion A卡专用整合包(DirectML)资源下载
Stable Diffusion A卡专用整合包(DirectML)资源下载

基于 lshqqytiger 分支制作,功能与 v4.4 版本整合包相同 仅经过朋友一台电脑测试,不保证完全可用,若发现无法使用请及时评论区反馈 使用方法和普通整合包完全一致,首次使用打开启启动器后,…

Stable Diffusion绘世整合版 安装使用教程
Stable Diffusion绘世整合版 安装使用教程

一、概述 本文使用秋叶大佬发布的【绘世整合包】作为软件,它是目前市面上最易于使用的整合包之一,无需对网络和Python有太多的前置知识,已经为AI绘画的普及做出了巨大贡献。绘世启动器整合包于2023年…

更多