开源项目WeClone:用微信聊天记录,做个“数字版的你”,某种意义上实现“数字永生”
该项目可以把AI调成模仿你的口气说话,再接入聊天机器人,实现属于你自己的“数字分身”。 来看下它具体能干嘛: – 支持从微信导出聊天记录,并自动处理成问答格式 – 基于LoRA...
Gemini-2.0夺冠!全球首个几何推理专项评测出炉,淘天集团出品
多模态大模型几何解题哪家强? 首个从几何原理视角出发,全面评估多模态大模型几何解题能力的双语综合基准来了! GeoSense,系统评测多模态大模型在几何原理识别和应用中的表现,评测基准的数据和评测代码...
开源垂直领域高质量数据合成框架!专业QA自动生成,无需人工标注
垂域模型训练,高质量问答数据稀缺一直是行业痛点。 在垂直领域大模型训练中,人工标注成本高昂,合成数据又常陷入质量与专业性难以兼得的困境。 为此,上海AI实验室等提出GraphGen。 通过“知识图谱引...
智能车速度刷新:仅10个月,首个纯端侧大模型上车量产!
端侧大模型圈子的《速度与激情》,就这么水灵灵地上演了。 坐标上海车展,在长安马自达新车发布之际,车上的智能座舱竟然成了大亮点之一。 因为速度着实有点太快——从零到量产,只花了10个月的时间! 要知道,...
OpenAI 发布最新的4o图像生成 API :gpt-image-1
开发者和企业可直接集成到自身工具和平台 -可通过文本描述直接生成新图片。可设置图片数量、分辨率、质量、透明度等参数。代码调用简单,支持 Python、JS、Shell 等主流环境。 -Edits(编辑...
YOLO v10:毫秒级实时的端到端目标检测开源模型
YOLO v10:毫秒级实时的端到端目标检测开源模型

由清华大学多媒体智能组(THU-MIG)开发。 从输入图像到输出检测结果的整个过程全部由模型直接完成,消除了中间的人工干预或额外处理步骤。 YOLOv10 能够在极短的时间内处理输入的图像或视频帧,通…

Lecun断言LLM不会达到人类智能水平

据《金融时报》报道,图灵奖得主 Lecun 认为—— 自回归 LLM 不足以达到人类水平的智力(甚至猫水平的智力)。 他指出,这类大语言模型的缺陷在于缺乏对逻辑的理解,对物理世界的掌握有限,没有持久记…

Mac 版 ChatGPT 客户端能力首次展示
Mac 版 ChatGPT 客户端能力首次展示

在巴黎的 VivaTech 活动上,OpenA 法国团队展示了最新GPT 4o实时语音和视觉你能力 不过这次使用的 Mac 版客户端 展示了实时翻译能力以及通过视觉识别简笔画并观看地图进度导航引导。 …

Mistral发布7B模型0.3版本

抱抱脸上线了 Mistral-7B-v0.3 的基础版和指令微调版。 相比于Mistral-7B-v0.2,新版本更新如下: – 词汇量从 32000 扩展到 32768 – …

OpenAI下架寡姐声音

OpenAI的新王炸GPT-4o还没全面铺开,就摊上事了! 抓马的是,此次推出的“视频通话”功能一度被称为电影《Her》现实版,而怒斥OpenAI的刚好是给电影中AI配音的斯嘉丽·约翰逊(寡姐)。 寡…

英特尔预计Q3发布下一代AIPC处理器

英特尔官方最新宣布—— 自今年第3季度起到假日季,其即将到来的客户端处理器 Lunar Lake 将继续扩大全球AI PC规模,并在未来可用时免费升级 Windows 11 AI PC体验。 Luna…

Meta新发布多模态模型

Meta 的 FAIR 团队新发表了一项名为 Chameleon 的研究。 该研究开发了一系列早期融合的混合模态基础模型,能够以任意顺序理解和生成图像和文本。 该模型在综合任务上进行了评估,包括视觉问…

更多