summaryrefslogtreecommitdiff
path: root/collaborativeagents/training
ModeNameSize
-rw-r--r--dataset_info.json309logplain
-rw-r--r--ds_z3_config.json745logplain
-rw-r--r--estimate_token_lengths.py11685logplain
-rw-r--r--generate_training_data.py12259logplain
d---------grpo90logplain
d---------grpo_verl173logplain
-rw-r--r--llama_factory_config.yaml894logplain
-rw-r--r--llama_factory_lora_config.yaml1019logplain
-rw-r--r--llama_factory_qlora_config.yaml1124logplain
-rw-r--r--llama_factory_resume_config.yaml980logplain
d---------outputs / sft_reflection_lf44logplain
-rw-r--r--run_train.sh1858logplain
d---------sft48logplain
-rw-r--r--sft_config.yaml1047logplain
-rw-r--r--train_grpo.py11336logplain
-rw-r--r--train_sft.py4262logplain
-rw-r--r--train_sft.sbatch1778logplain
-rw-r--r--train_sft_lf.sbatch1501logplain
-rw-r--r--train_sft_lora.sbatch1048logplain
-rw-r--r--train_sft_qlora.sbatch901logplain
-rw-r--r--train_sft_resume.sbatch1440logplain
d---------training_data101logplain
-rw-r--r--training_script.sh488logplain