文章 – 第 9 页

资讯 1年前

Pinokio，一键安装部署各种 AI 大模型的浏览器

一款免费开源的 AI 浏览器，可以自动轻松地安装、运行和自动化任何 AI 应用程序和模型。支持运行如 SD、Fooocus、ComfyUI、SDXL Turbo、LCM、Whisper 等众多模型。并…

资讯 1年前

Ai图片转动态/视频，系列工具合集

部分需要魔法，请自备，仅做整理，后期将出详细教程 LeiaPix: https://convert.leiapix.com/ CapCut: https://www.capcut.com (3D zo…

资讯 1年前

AI图片转高清/图片变清晰/老照片修复工具合集

1、GFPGAN-腾讯开源的照片修复工具 https://github.com/TencentARC/GFPGAN 2、视频，图像和GIF无损放大/放大（超分辨率）和视频帧插值 https://git…

资讯 1年前

AI图片视频去水印合集

实际上大部分水印都是不可能去除的，这里说的不是各大平台的解析无水印下载，而是自带水印，只能遮盖水印，或者是模糊水印，又或者裁剪 1、Photoshop：必备技能，点击下载：Photoshop 2023…

资讯 1年前

ChatGPT永久记忆功能正式上线

OpenAI宣布ChatGPT的一项重要更新：增加了记忆功能和新的用户控制选项。 GPT现在可以在与用户的交互中跨聊天记住你们互动的所有信息，并在后续对话中利用这些信息来提供更相关和个性化的回答。之…

资讯 1年前

Meta 发布最新编程辅助模型：Code Llama 70B

CodeLlama-70B-Instruct 在 HumanEval 上获得 67.8 分，使其成为当今性能最高的开放模型之一。 Code Llama 70B分为三个版本： ◦ CodeLlama &…

资讯 1年前

SliceGPT：微软开发的一种新型的大语言模型压缩方法

SLICEGPT能够在保持99%，99%，和90%零样本任务性能的同时，将LLAMA2-70B、OPT 66B和Phi-2模型分别去除高达25%的模型参数（包括嵌入）。使用SLICE GPT的模型可…

资讯 1年前

LLMs-from-scratch：教你如何从零开始制作一个类似于ChatGPT这样的大语言模型

该项目详细解释了LLMs的工作原理，并通过清晰的文本、图表和示例，逐步引导读者创建自己的LLM。适合企业团队、初创公司和教育机构来培训学习！项目详细介绍了创建像ChatGPT这样的大型基础模型时所…

资讯 1年前

谷歌 TPU v5p AI 芯片击败英伟达H100 速度是其的3.4到4.8倍

Google最近推出了其最新旗舰张量处理单元（TPU）v5p，这是一款专门设计的AI加速器，用于AI训练和推理，标志着Google在对抗市场领导者Nvidia的GPU方面迈出了重要一步。 TPU v5…

资讯 1年前

百川智能发布超千亿大模型Baichuan 3，宣称中文评测超越GPT-4

在医疗领域的中文任务中也表现突出，成为了表现最佳的大模型之一。对中华传统文化的深刻理解，在传统文化的诗词创作上，Baichuan 3展现了其对格式、韵律和表意等方面的深刻理解！ Baichuan 3…

资讯 1年前

SpeechGPT-Gen：为大语言模型提供内在的跨模态对话能力

它不仅能处理传统的文本数据，还能理解和生成语音数据，实现文本与语音之间的无缝对话。能够接收语音输入，理解其内容，并以语音形式做出回应。为大语言模型在处理和生成语音方面提供了强大的支持。 Speec…

资讯 1年前

SUPIR：通过增加模型的规模（即增加模型的参数数量）提升图像修复的能力

通过参数增加使得模型不仅能够修复图像中的错误或损坏，还能根据文本提示进行智能修复。例如根据描述来改变图像中的特定细节。这样的处理方式提升了图像修复的质量和智能度，使得模型能够更准确、更灵活地恢复和改…

资讯 1年前

Lumiere：一次性生成整个视频

Google Research团队开发的基于空间时间的文本到视频扩散模型。它采用了创新的空间时间U-Net架构，能够一次性生成整个视频的时间长度，不同于其他模型那样逐帧合成视频。确保了生成视频的连…

资讯 1年前

ElevenLabs 推出一个全自动化的AI配音或视频翻译工具

你只需要上传视频或者粘贴视频链接，这个工具就能全自动的在几十秒到几分钟内将你的视频翻译成29种语言。更牛P的是接克隆原视频里面的声音，来给你配音。就算是视频里面有多个人说话也能全部克隆翻译。下面…

资讯 1年前

HuixiangDou：利用AI解决群聊场景中冷场的问题

茴香豆是一个基于大语言模型的群聊知识助手，它能够自动识别并回答群聊中的技术相关的问题，且不会被群聊中的非技术内容干扰。可以集成到即时聊天工具（如微信、飞书）的群聊中。主要针对技术问题，特别是与编程…

资讯 1年前

RPG-DiffusionMaster：利用LLM优化SD文本到图像的转换过程

RPG利用大语言模型来更好地理解和分解生成图像的文字提示，把一幅图像分解成不同的部分或区域。然后对每个部分都根据理解的相应文本提示来生成图像，最后合成为一个符合你预期要求的图像。该框架无需额外的模…

资讯 1年前

SCEPTER：由阿里巴巴开发的，一个专为生成模型设计的开源框架

用于训练、微调和推理生成模型，涵盖诸如图像生成、转换、编辑等下游任务。专门用于支持和简化图像生成、合成和编辑任务的开发，包括从文本到图像的生成和高级图像编辑技术。 1、任务支持：文本到图像生成：支…

教程 1年前

Pinokio 一键自动化部署开源AI项目

安装、运行和控制这些AI引擎的过程可能是一项艰巨的任务。Pinokio基本上是一个自主的虚拟计算机，通过自动化命令行进程并使用户能够单击一次即可创建和共享脚本来简化此过程。 “就像一个网络浏览器，Pi…

资讯 1年前

LEGO：一个由字节跳动和复旦大学研发的多模态理解和图像定位模型

LEGO能够处理和理解多种类型的输入，支持图像、音频和视频输入，并对这些信息进行分析和理解。模型还具备精准定位的能力。例如在图像中标识出物体的具体位置，在视频中指出特定事件发生的时间点，在音频中识别…

资讯 1年前

Chatbot UI：一个开源的聊天机器人Web UI框架

支持接入OpenAI、Azure OpenAI、Anthropic、Google、Mistral和Perplexity等模型同时支持Ollama上的本地模型接入。这样你只需要输入这些模型的API，…