NVIDIA 发布 Nemotron-4 340B 开源模型

主要用于生成高质量的合成数据

Nemotron-4 340B可以生成多样化的合成数据,这些数据模仿现实世界的数据特征。

开发者可以用它来生成合成数据,以训练适用于各种行业(如医疗、金融、制造和零售等)的大型、大语言模型。

Nemotron-4 340B 包括 Nemotron-4-340B-Base、Nemotron-4-340B-Instruct 和 Nemotron-4-340B-Reward。

Nemotron-4-340B-Base:基础模型,用于广泛的通用任务。

Nemotron-4-340B-Instruct:指令模型,优化了对指令的遵循和对话能力,主要用于合成数据。

Nemotron-4-340B-Reward:奖励模型,专门用于评估和提高合成数据质量。

微海报