training « collaborativeagents - personalization-user-model.git - Unnamed repository; edit this file 'description' to name the repository.

Mode	Name	Size
-rw-r--r--	dataset_info.json	309	log plain
-rw-r--r--	ds_z3_config.json	745	log plain
-rw-r--r--	estimate_token_lengths.py	11685	log plain
-rw-r--r--	generate_training_data.py	12259	log plain
d---------	grpo	90	log plain
d---------	grpo_verl	173	log plain
-rw-r--r--	llama_factory_config.yaml	894	log plain
-rw-r--r--	llama_factory_lora_config.yaml	1019	log plain
-rw-r--r--	llama_factory_qlora_config.yaml	1124	log plain
-rw-r--r--	llama_factory_resume_config.yaml	980	log plain
d---------	outputs / sft_reflection_lf	44	log plain
-rw-r--r--	run_train.sh	1858	log plain
d---------	sft	48	log plain
-rw-r--r--	sft_config.yaml	1047	log plain
-rw-r--r--	train_grpo.py	11336	log plain
-rw-r--r--	train_sft.py	4262	log plain
-rw-r--r--	train_sft.sbatch	1778	log plain
-rw-r--r--	train_sft_lf.sbatch	1501	log plain
-rw-r--r--	train_sft_lora.sbatch	1048	log plain
-rw-r--r--	train_sft_qlora.sbatch	901	log plain
-rw-r--r--	train_sft_resume.sbatch	1440	log plain
d---------	training_data	101	log plain
-rw-r--r--	training_script.sh	488	log plain