– 2023年,越来越多的开发者开始使用AI技术,同时也尝试构建基于AI的应用程序。 – 基于OpenAI等公司的基础模型的生成性AI项目数量激增,其中一些项目甚至进入了最受欢…
– 2023年,越来越多的开发者开始使用AI技术,同时也尝试构建基于AI的应用程序。 – 基于OpenAI等公司的基础模型的生成性AI项目数量激增,其中一些项目甚至进入了最受欢…
TrailBlazer是英伟达的一个预训练好的模型,只需输入文本即可生成视频。 同时他们提出一个边界框的概念,来控制视频对象的运动方向、速度和行为。 例如,你可以通过改变边界框的大小、方向,让视频中的…
Perplexity公布了一些数据: – Perplexity 的月活跃用户增长到了1000万 – 2023年,Perplexity处理了超过5亿次查询 – 超过1…
该项目由阿里巴巴开发,AnyText支持在图像中生成和编辑多种语言的文本,使其与背景无缝融合。 该模型还解决了合成文本中模糊、不可读或错误字符的问题。 AnyText可以与现有的扩散模型集成,用于准确…
它可以将一个人的歌声转换成另一个人的歌声。同时能够保持了声音的自然度和真实感。 最牛P的是CoMoSVC实现了一步采样。意思是它可以在单次操作中即可完成声音的转换,大大加快了处理速度。 该项目由香港大…
它可以从多人对话中语音中生成与对话相对应的逼真面部表情、完整身体和手势动作。 这些生成的虚拟人物不仅在视觉上很逼真,而且能够准确地反映出对话中的手势和表情细节,如指点、手腕抖动、耸肩、微笑、嘲笑等。 …
The Information 报道,两名与OpenAI 谈判的媒体高管透露,OpenAI已经向一些媒体公司开出了每年 100 万-500 万美元,以获得将新闻内容用于训练自家大语言模型的授权许可。 …
由坦福大学开发,专门设计用于执行需要双手和全身协调的复杂移动任务。 可以通过模仿学习(即观察人类操作然后模仿这些动作),仅通过50次任务演示,共同训练,它就能够自主完成日常生活中的各种任务。 如做饭、…
能根据音频让人物头像照片说话、唱歌同时保持嘴型和表情一致。 GitHub:https://github.com/ali-vilab/dreamtalk HuggingFace:https://hugg…
VCoder的一个视觉编码器,能够帮助MLLM更好地理解和分析图像内容。提高模型在识别图像中的对象、理解图像场景方面的能力。 它可以帮助模型显示图片中不同物体的轮廓或深度图(显示物体距离相机的远近)。…
可以帮助你撰写和保存日记条目,记录你的思考和经历,当备忘录也可以! 内置了OpenAI 的API功能,可以自己写提示词让AI帮你扩展你的想法和日记。 还可以使用AI来搜索日记内容或对整个日记提出问题。…
该模型由腾讯与新加坡国立大学开发,M2UGen能够理解各种音乐,包括风格、演奏乐器、表达的情绪情感等,并进行音乐问答。 而且还能根据文本、图像、视频和音频生成各种音乐,同时对生成的音乐也能理解并根据文…
LARP能让游戏角色像真人一样和玩家对话,同时能够理解游戏中复杂的情境、记住过去的互动。并根据这些信息做出合理的反应。 它能让游戏角色的行为更加真实和有深度,从而提升玩家的游戏体验。 LARP的工作原…
由MyShell TTS开发。它能够仅使用一小段参考发言者的音频片段来复制其声音,然后能生成多种语言的语音。 OpenVoice能对声音风格的精细控制,包括情感、口音、节奏、停顿和语调,同时能够复制参…
SSR-Encoder能够提取图像中的多种特征,包括人物、视觉元素、风格、情感和细节等 然后它会利用提取的这些特征再结合文字提示,重新生成新的图像。 比如你看到一张照片,觉得它某一部分很好,就可以指定…
目前的图像生成模型,再生成图像方面已经非常出色,但在生成人类手部的图像时却常常出现问题,比如手指数量不对或者手形怪异。 HandRefiner提出一种方法,在不改变图片其他部分的情况下,修正那些形状不…
2023年50个访问量最大的AI工具及AI行业分析报告 Writerbuddy AI使用 SEO 行业著名的工具SEMrush,通过抓取AI工具数据,研究了3000多种 AI 工具。 从中选出了访问量…
你只需要通过iPhone随便拍摄一段大约5分钟的视频。它会用视频将用来捕捉你的外貌、动作和可能的表情。 然后克隆一个虚拟的你! 最牛的是它可以将PPT、PDF文件直接转换成解说视频,只需两次点击操作即…
GPT Pilot 一个真正的AI程序员,它可以从零开始构建整个应用程序,它能自己编写代码、配置开发环境、管理开发任务、调试代码,你还可以随时和它聊天提问帮助你解决开发难题。 你只需要在一旁监督开发过…
比如,你想知道“如何做蛋糕”,只需在这个网站上输入这个问题,它就会找到相关的视频来帮你解答。 更牛P的是,你还可以跟视频进行对话,就像跟一个人聊天一样,还能帮你总结视频内容。 最牛P的是他把这个项目开…