LOADING STUFF...

AD赞助商

StableVicuna

4周前发布 4 00

第一个通过RLHF训练的大规模开源聊天机器人

收录时间：

2025-03-19

打开网站手机查看

StableVicuna

StableVicuna

StableVicuna是由StableDiffusion背后的StabilityAI推出的第一个通过基于人类反馈的强化学习（RLHF）训练的大规模开源聊天机器人。StableVicuna是Vicunav013b的进一步指令微调和RLHF训练版本，它是一个指令微调的LLaMA130亿模型。

数据统计

相关导航

Cohere

构建AI产品的大语言模型平台

Codex

OpenAI旗下AI代码生成训练模型

HuggingFace

AI模型开发社区

OpenBMB

清华团队支持发起的大规模预训练语言模型库与相关工具

序列猴子

出门问问推出的一款超大规模的语言模型

悟道

智源“悟道”大模型，中国首个+世界最大人工智能大模型

Llama 3

Meta最新开源推出的新一代大模型

StableLM

Stability AI推出的开源的类ChatGPT大语言模型

暂无评论

none

暂无评论...