| Mode | Name | Size | |
|---|---|---|---|
| -rw-r--r-- | dataset_info.json | 309 | logplain |
| -rw-r--r-- | ds_z3_config.json | 745 | logplain |
| -rw-r--r-- | estimate_token_lengths.py | 11685 | logplain |
| -rw-r--r-- | generate_training_data.py | 12259 | logplain |
| d--------- | grpo | 90 | logplain |
| d--------- | grpo_verl | 173 | logplain |
| -rw-r--r-- | llama_factory_config.yaml | 894 | logplain |
| -rw-r--r-- | llama_factory_lora_config.yaml | 1019 | logplain |
| -rw-r--r-- | llama_factory_qlora_config.yaml | 1124 | logplain |
| -rw-r--r-- | llama_factory_resume_config.yaml | 980 | logplain |
| d--------- | outputs / sft_reflection_lf | 44 | logplain |
| -rw-r--r-- | run_train.sh | 1858 | logplain |
| d--------- | sft | 48 | logplain |
| -rw-r--r-- | sft_config.yaml | 1047 | logplain |
| -rw-r--r-- | train_grpo.py | 11336 | logplain |
| -rw-r--r-- | train_sft.py | 4262 | logplain |
| -rw-r--r-- | train_sft.sbatch | 1778 | logplain |
| -rw-r--r-- | train_sft_lf.sbatch | 1501 | logplain |
| -rw-r--r-- | train_sft_lora.sbatch | 1048 | logplain |
| -rw-r--r-- | train_sft_qlora.sbatch | 901 | logplain |
| -rw-r--r-- | train_sft_resume.sbatch | 1440 | logplain |
| d--------- | training_data | 101 | logplain |
| -rw-r--r-- | training_script.sh | 488 | logplain |
