始智AI wisemodel.cn开源社区
符嘉义
导师为肖仰华教授。研究方向是大模型安全,水印,以及对齐 技术,已有相关工作发表在 ACL。目前研究主要集中于大语言模型的对齐技术,以及其中的 reward hacking 现象。
关于wisemodel更多
查看原图 200K
始智AI wisemodel.cn开源社区
符嘉义
导师为肖仰华教授。研究方向是大模型安全,水印,以及对齐 技术,已有相关工作发表在 ACL。目前研究主要集中于大语言模型的对齐技术,以及其中的 reward hacking 现象。
关于wisemodel更多