Tanaybh
/

gpt2-rlhf-anthropic

Text Generation

reinforcement-learning-from-human-feedback

anthropic-hh-rlhf

chatgpt-style-training

supervised-fine-tuning

human-preferences

text-generation-inference

Model card Files Files and versions

gpt2-rlhf-anthropic

499 MB

1 contributor

History: 6 commits

Tanaybh's picture

Upload RLHF-trained GPT-2 model

822364b verified 25 days ago