Dnext

February 6, 2024 6:30am

LIMA: Less Is More for Alignment | #llms #finetuning #pretraining #alignment

LIMA: Less Is More for Alignment

Large language models are trained in two stages: (1) unsupervised pretraining from raw text, to learn general-purpose representations, and (2) large scale instruction tuning and reinforcement learning, to better align to end tasks and user...

0 Persons are tagged with #pretraining

#pretraining