人生搜索引擎免费用,开源版哈利波特“冥想盆”登GitHub热榜,支持中文
天啦撸!回溯你在网上看过、做过的一切,也有免费软件可用了! 简单说,针对任何“之前好像在哪看过”的电脑文件,只需输入相关搜索词,这个软件都能帮你一键轻松回忆了。 打开方式be like(没错,也有中文...
多样任务真实数据,大模型在线购物基准Shopping MMLU开源|NeurIPS&KDD Cup 2024
谁是在线购物领域最强大模型?也有评测基准了。 基于真实在线购物数据,电商巨头亚马逊终于“亮剑”—— 联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU,用以评估大语言...
集合 GameFi + AI 双热门叙事:融资 1350 万美元的 Ultiverse 为何值得关注
Gamefi 和 AI 是我们这个周期十分看好两大赛道之一,Gamefi 拥有极强的破圈效应,引领 Web2 用户进军 Web3 最佳利器。AI 是这个周期最热门赛道,无论 Web2 的 OpenAI...
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型
北大等出品,首个多模态版o1开源模型来了—— 代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。 在多模态推理基准测试中,LLaVA-o1...
一块显卡理解一部电影,最新超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源
仅需1块80G显卡,大模型理解小时级超长视频。 智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校带来最新成果超长视频理解大模型Video-XL。 它借助语言模型(LLM)的原...
TrailBlazer:利用边界框控制视频对象轨迹
TrailBlazer:利用边界框控制视频对象轨迹

TrailBlazer是英伟达的一个预训练好的模型,只需输入文本即可生成视频。 同时他们提出一个边界框的概念,来控制视频对象的运动方向、速度和行为。 例如,你可以通过改变边界框的大小、方向,让视频中的…

CoMoSVC:一种高效、高质量的歌声转换方法
CoMoSVC:一种高效、高质量的歌声转换方法

它可以将一个人的歌声转换成另一个人的歌声。同时能够保持了声音的自然度和真实感。 最牛P的是CoMoSVC实现了一步采样。意思是它可以在单次操作中即可完成声音的转换,大大加快了处理速度。 该项目由香港大…

OpenAI妥协 准备向媒体购买内容训练AI

The Information 报道,两名与OpenAI 谈判的媒体高管透露,OpenAI已经向一些媒体公司开出了每年 100 万-500 万美元,以获得将新闻内容用于训练自家大语言模型的授权许可。 …

VCoder:大语言模型的眼睛
VCoder:大语言模型的眼睛

VCoder的一个视觉编码器,能够帮助MLLM更好地理解和分析图像内容。提高模型在识别图像中的对象、理解图像场景方面的能力。 它可以帮助模型显示图片中不同物体的轮廓或深度图(显示物体距离相机的远近)。…

Pile:一款开源的界面非常整洁美观的AI日记软件
Pile:一款开源的界面非常整洁美观的AI日记软件

可以帮助你撰写和保存日记条目,记录你的思考和经历,当备忘录也可以! 内置了OpenAI 的API功能,可以自己写提示词让AI帮你扩展你的想法和日记。 还可以使用AI来搜索日记内容或对整个日记提出问题。…

M2UGen:多模态音乐理解和生成模型
M2UGen:多模态音乐理解和生成模型

该模型由腾讯与新加坡国立大学开发,M2UGen能够理解各种音乐,包括风格、演奏乐器、表达的情绪情感等,并进行音乐问答。 而且还能根据文本、图像、视频和音频生成各种音乐,同时对生成的音乐也能理解并根据文…

OpenVoice:多功能即时语音克隆
OpenVoice:多功能即时语音克隆

由MyShell TTS开发。它能够仅使用一小段参考发言者的音频片段来复制其声音,然后能生成多种语言的语音。 OpenVoice能对声音风格的精细控制,包括情感、口音、节奏、停顿和语调,同时能够复制参…

SSR-Encoder:从图像中提取关键特征来生成新的图像

SSR-Encoder能够提取图像中的多种特征,包括人物、视觉元素、风格、情感和细节等 然后它会利用提取的这些特征再结合文字提示,重新生成新的图像。 比如你看到一张照片,觉得它某一部分很好,就可以指定…

HandRefiner:解决AI图像生成中手部畸形的问题

目前的图像生成模型,再生成图像方面已经非常出色,但在生成人类手部的图像时却常常出现问题,比如手指数量不对或者手形怪异。 HandRefiner提出一种方法,在不改变图片其他部分的情况下,修正那些形状不…

GPT-Pilot:AI开发者伴侣
GPT-Pilot:AI开发者伴侣

GPT Pilot 一个真正的AI程序员,它可以从零开始构建整个应用程序,它能自己编写代码、配置开发环境、管理开发任务、调试代码,你还可以随时和它聊天提问帮助你解决开发难题。 你只需要在一旁监督开发过…

AI视频搜索引擎,你可以像问问题一样搜索视频
AI视频搜索引擎,你可以像问问题一样搜索视频

比如,你想知道“如何做蛋糕”,只需在这个网站上输入这个问题,它就会找到相关的视频来帮你解答。 更牛P的是,你还可以跟视频进行对话,就像跟一个人聊天一样,还能帮你总结视频内容。 最牛P的是他把这个项目开…

更多