Anthropic发布了一篇文章介绍了Claude3的性格训练内容及方法,Anthropic设计的Claude 不仅避免伤害,还具备积极的人类特质如好奇心和开放思维。这种方法帮助Claude 更周到地与不同用户互动。
• 不只是让Al避免说或做伤害性的事情,还要让它有好奇心、开放的思维和深思熟虑的特点。
• 确保AI在处理各种情况时,表现得合乎道德和有判断力。
• 在Claude 3版本中加入了性格训练,目的是让Al在与人交谈时显得更有人情味,而不是显得有偏见。
• 避免让AI只采用单一的政治或道德观点,而是鼓励它保持诚实和平衡的看法。
• 通过一系列训练,教会Claude 在回答问题时,体现出预设的性格特质。
• 训练过程中,Claude会生成多个回答,并根据这些特质来排名,最终选择最符合预期的回答。