calico-1226

Follow

Calico calico-1226

Follow

RL researcher

28 followers · 11 following

ZJU
Hangzhou, Zhejiang, China
00:48 (UTC +08:00)
[email protected]

Achievements

Achievements

Organizations

Pinned Loading

PKU-Alignment/safe-rlhf PKU-Alignment/safe-rlhf Public

Safe RLHF: Constrained Value Alignment via Safe Reinforcement Learning from Human Feedback

Python 1.4k 120
PKU-Alignment/omnisafe PKU-Alignment/omnisafe Public

JMLR: OmniSafe is an infrastructural framework for accelerating SafeRL research.

Python 946 132
PKU-Alignment/beavertails PKU-Alignment/beavertails Public

BeaverTails is a collection of datasets designed to facilitate research on safety alignment in large language models (LLMs).

Makefile 113 5
PKU-Alignment/safe-sora PKU-Alignment/safe-sora Public

SafeSora is a human preference dataset designed to support safety alignment research in the text-to-video generation field, aiming to enhance the helpfulness and harmlessness of Large Vision Models…

Python 26 5