文章

Stability AI 开源其 Stable Diffusion 3 Medium 模型
Stability AI 开源其 Stable Diffusion 3 Medium 模型

可在消费级笔记本电脑上运行 该模型包含 20 亿个参数。在图像质量上有显著提升,能够生成更高质量、更细腻的图像。能够更准确地将文本描述转换为图像。 Stable Diffusion 3 Medium …

TrailBlazer:利用边界框控制视频对象轨迹
TrailBlazer:利用边界框控制视频对象轨迹

TrailBlazer是英伟达的一个预训练好的模型,只需输入文本即可生成视频。 同时他们提出一个边界框的概念,来控制视频对象的运动方向、速度和行为。 例如,你可以通过改变边界框的大小、方向,让视频中的…

AI教育“智”变大考,小度率先交卷了

作为继OpenAI、微软、谷歌后,最后一个万众期待的尖子生,苹果在上周举行的WWDC24全球开发者大会上,终于交出了自己的“AI答卷”。 一方面,苹果推出Apple Intelligence,对旗下系…

OpenVoice:多功能即时语音克隆
OpenVoice:多功能即时语音克隆

由MyShell TTS开发。它能够仅使用一小段参考发言者的音频片段来复制其声音,然后能生成多种语言的语音。 OpenVoice能对声音风格的精细控制,包括情感、口音、节奏、停顿和语调,同时能够复制参…

更多