近日,如影数字人生成平台SenseAvatar (以下简称“如影”)正式在微软全球云市场Microsoft Azure Marketplace上线,为客户提供高质量的数字人内容制作服务。 借助微软Az…
近日,如影数字人生成平台SenseAvatar (以下简称“如影”)正式在微软全球云市场Microsoft Azure Marketplace上线,为客户提供高质量的数字人内容制作服务。 借助微软Az…
AI卫星影像知识生成模型数据集稀缺的问题,又有新解了。 来自武汉大学、上海AI实验室、西工大等9家机构共同推出了该领域的大型数据集,涵盖了21万个地理目标和40万个目标-关系三元组。 而且像机场、港口…
示例代码地址:https://blog.mrbun.cn/post/20
– 同时拨打或接听多大500000个电话 – 保证和人类接听员一样的水准,自然且流畅 – 可以创建声音克隆,模仿任何人的声音 – 对其进行编程以执行任何…
让大神Andrej Karpathy一键三连❤️(点赞+转发+评论),一个教你从头开始实现Llama3的代码库爆火。 X上转赞收藏量超6.8k,GitHub揽星2k+。 火就火在,它教你从头用Meta…
能聊天、能生图、能出视频 还支持包括搜索和替换、背景移除、创意放大、结构控制、外绘和草图等功能。 倒闭边缘的盈利尝试…
可在消费级笔记本电脑上运行 该模型包含 20 亿个参数。在图像质量上有显著提升,能够生成更高质量、更细腻的图像。能够更准确地将文本描述转换为图像。 Stable Diffusion 3 Medium …
自SDXL这个“地表最强开源大模型”发布以来,关于它的种种江湖传言不断: “8G显存玩不了?”、“4090都跑得特别慢?”…… 我找来了一批全新的RTX 40系显卡,拿它们作了一个非常简单的“跑图测试…
通过这项技术,你可以让一个虚拟的3D人物模型模仿真实人的表情和头部动作。 而且这个过程是实时的,通过摄像头输入,当真人改变表情或头部姿势时,3D模型也会立即做出相同的反应。 通俗来说就是:3D变脸术 …
TrailBlazer是英伟达的一个预训练好的模型,只需输入文本即可生成视频。 同时他们提出一个边界框的概念,来控制视频对象的运动方向、速度和行为。 例如,你可以通过改变边界框的大小、方向,让视频中的…
马斯克的 xAI 公司计划建造一台巨大的超级计算机,称为“超级计算工厂”。 这台超级计算机将使用10万个 H100 GPU来训练和运行其AI模型 Grok的下一个版本。 马斯克计划将这些芯片整合到一个…
作为继OpenAI、微软、谷歌后,最后一个万众期待的尖子生,苹果在上周举行的WWDC24全球开发者大会上,终于交出了自己的“AI答卷”。 一方面,苹果推出Apple Intelligence,对旗下系…
没想到吧?我用核显也能跑AIGC了!本期教学带你探索让SD速度飙升的秘密脚本! OpenVINO脚本github页面:https://github.com/openvinotoolkit/openvi…
由MyShell TTS开发。它能够仅使用一小段参考发言者的音频片段来复制其声音,然后能生成多种语言的语音。 OpenVoice能对声音风格的精细控制,包括情感、口音、节奏、停顿和语调,同时能够复制参…
清华博士秦禹嘉最近发表一篇博文称:是时候把数据scale down了! LLaMA3告诉大家一个悲观的现实:模型架构不用动,把数据量从2T加到15T就可以暴力出奇迹。 这一方面告诉大家基座模型长期来看…
国产大模型,多模态能力都开始超越GPT-4-Turbo了?? 权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉: 特别是腾讯的hunyuan-vision、上海AI Lab的Inte…
10月8日消息:微软日前宣布将对 OneDrive 进行更新,旨在使人们更容易访问、查看、分享和管理他们的文件。 在本周的在线活动中,被称为「微软 OneDrive:文件管理的未来已经来临」,微软公司…
它专门针对稳定扩散VAE模型,增加图像生成的稳定性和一致性,可以让生成的图像更加清晰和连贯。 这对于需要生成高质量图片的人来说是个有用的工具。 开源地址:https://github.com/open…
艺术家可以用MIST在他们的作品上加上一种特殊的水印,这种水印肉眼几乎看不见,但可以阻止AI程序正确地“理解”和复制这些作品。 当AI尝试学习或复制加了MIST水印的图片风格时,它会受到干扰,导致无法…