
What……控制机器人的工具,竟然可以是蘑菇? 有视频为证,这个长得像海星,在桌面上走来走去的机器人,里面就装上了一颗“蘑菇大脑”。 这是一项来自美国康奈尔大学和意大利佛罗伦萨大学的正经仿生学研究,已…
What……控制机器人的工具,竟然可以是蘑菇? 有视频为证,这个长得像海星,在桌面上走来走去的机器人,里面就装上了一颗“蘑菇大脑”。 这是一项来自美国康奈尔大学和意大利佛罗伦萨大学的正经仿生学研究,已…
把Llama 3蒸馏到Mamba,推理速度最高可提升1.6倍! 而且性能不减,甚至表现比原始模型还要优异。 这是来自Together AI的新作,通过蒸馏将Transformer和Mamba模型结合到…
在AI-2.0时代,OCR模型的研究难道到头了吗!? (OCR:一种将图像中的文字转换为可编辑和可搜索文本的技术) Vary作者团队开源了第一个迈向OCR-2.0的通用端到端模型GOT。 用实验结果向…
自9月7日起,2024年职业资格考试即将进入密集期,大模型正悄然成为考生“刷题”备考的新型技术工具。据悉,职业技能学习平台考试宝已接入豆包大模型,为平台涵盖的上万个细分职业类别提供AI试题解析,该平台…
短短几天内,AMD连续宣布两项颠覆性的转变: 放弃旗舰游戏显卡,转而抢占中低端市场份额 专注AI,统一现在并存的两种GPU微架构,挑战英伟达CUDA生态 两条策略背后还有一个统一的目标:扩大生态规模。…
WechatFerry 是一个微信机器人框架,提供了一套强大、快速且可定制的解决方案,适用于开发和集成微信机器人。为开发微信机器人的用户提供了 SDK 封装和多种插件,能够轻松调用微信的相关功能,适用…
现在,最强数学大模型,人人都可上手玩了! 一觉醒来,阿里千问大模型团队发布了Qwen2-Math的Demo,抱抱脸在线可玩。 惊喜的是,如果嫌输入数学公式比较麻烦,可以把想问的题截图or扫描,上传即可…
只用提示词,多模态大模型就能更懂场景中的人物关系了。 北京大学最新提出多模态提示学习(Conditional Multi-Modal Prompt, CMMP)方法,利用提示词工程技术教会多模态大模型…
ChatGPT有新模型了! 官方账号宣布:最新版本GPT-4o从上周起已实装,我们猜你会喜欢的。 然后……就尴尬了,下面评论区画风是一片的:“啊?改哪里了?没发现啊”。 没有改进,我天天用,没啥区别。…
国产大模型,多模态能力都开始超越GPT-4-Turbo了?? 权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉: 特别是腾讯的hunyuan-vision、上海AI Lab的Inte…
7月24日消息,巴黎奥运会将大量采用中国AI技术,应用在赛事解说、360度直播、视觉搜索等领域。阿里巴巴的通义大模型,在与众多国际科技公司的竞争中获胜,成为奥运首个AI大模型应用的技术提供方。 国际奥…
刚刚,GPT-4o mini版迎来“高光时刻”—— 登顶了lmsys大模型竞技场,和满血版并列第一,还把Claude 3.5甩在了身后。 不同于一般的数据集测评,大模型竞技场是用户自己出题、用脚投票的…
家人们!无需排队申请,快手可灵AI官宣即日起全面开放内测了。 还在前阵的WAIC上,可灵AI才公布了成绩单—— 上线1个月,“超50万人申请,已开放给超30万用户使用,生成超700万条短视频。” 值此…
近日,如影数字人生成平台SenseAvatar (以下简称“如影”)正式在微软全球云市场Microsoft Azure Marketplace上线,为客户提供高质量的数字人内容制作服务。 借助微软Az…
今日,第十七届英特尔网络与边缘计算行业大会在天津举行,超过400位生态伙伴和客户代表齐聚一堂,与英特尔共同探讨边缘AI的未来发展趋势,并介绍了众多基于英特尔边缘AI解决方案,在教育、智能制造等垂直领域…
7 月 23 日,Meta 正式发布 Llama 3.1 模型,包含 8B、70B 和 405B 三种参数规模。其中 405B 是目前最大开源模型之一,拥有 4050 亿参数,支持多语言输入输出,在复…
现在看个病,都有大模型全程陪诊了。 这是上海市第一人民医院此时此时正在发生的事情—— AI就医助理,无需下载APP,打开支付宝就能用。 从诊前预约挂号、在线取号,到诊中院内导航、排队叫号、扫码支付,再…
大模型对话能更接近现实了! 不仅可以最多输入20张图像,还能支持多达27轮对话。可处理文本+图像tokens最多18k。 这就是最新开源的超长多图多轮对话理解数据集MMDU(Multi-Turn Mu…
刚刚,世界通信行业顶级大会——MWC上海站落下帷幕。 展会上,不仅5.5G(5G-A)标准正式亮相,AI也成为了通信领域新的热门话题。 与此同时,承载这些功能的终端丰富多样,从PC、汽车到新物种,已经…
很炸裂!讯飞星火大秀语音识别能力,现场掌声雷动—— 三个人同时说话,再加上背景音乐,如此强干扰的场景,大模型却表示都能听懂听清,还瞬间转化为文字,语音识别的“鸡尾酒会”难题不在话下~ ,时长00:23…
谷歌开源模型Gemma 2开放了! 虽然前段时间Google I/O大会上,Gemma 2开源的消息就已经被放出,但谷歌还留了个小惊喜—— 除27B模型外,还有一个更轻的9B版本。 DeepMind创…
刚刚,谢赛宁&Lecun团队官宣新成果—— 正式推出以视觉为中心的多模态大模型Cambrian-1! 模型名为“寒武纪”,谢赛宁本人激动表示: 就像在寒武纪大爆发中生物发展出更好的视力一样,我…
Hugging Face的CEO宣布了全新的开放LLM排行榜。 他们使用了300个H100 GPU来重新评估所有主要的开源LLM。 本次评估引入了新的基准,包括MMLU-Pro、GPQA、MuSR、M…
什么?烹饪也有大模型?! 没有听错,这就是国产厨电龙头老板电器最新发布——“食神”大模型。 数十亿级行业数据,数千万级知识图谱加持,据称还是全球首个。 它能为每个人提供个性化量身定制的解决方案,不仅告…
如果你正在寻找资源来学习LLMs指令微调过程,这里有一个开源笔记本教程可以从头开始指导你实现微调过程,本书的作者Sebastian Raschka 也是畅销书《Python Machine Learn…
清华博士秦禹嘉最近发表一篇博文称:是时候把数据scale down了! LLaMA3告诉大家一个悲观的现实:模型架构不用动,把数据量从2T加到15T就可以暴力出奇迹。 这一方面告诉大家基座模型长期来看…
HeyGen是一家专注于用AI技术生成视频的公司。区别于成本高昂、制作繁琐的传统视频制作流程,用户只需输入脚本,即可在几分钟内生成用于营销、沟通、销售、学习等的视频。 HeyGen 还允许用户使用 A…
开发了很受欢迎的人工智能聊天工具Kimi之后,月之暗面也一直在开发针对美国市场的产品,在苹果和谷歌应用商店上架了和人工智能角色扮演聊天应用Ohai,以及音乐视频生成器Noisee的网站。 Ohai为用…