summaryrefslogtreecommitdiff
path: root/QUICK_START.md
diff options
context:
space:
mode:
Diffstat (limited to 'QUICK_START.md')
-rw-r--r--QUICK_START.md143
1 files changed, 143 insertions, 0 deletions
diff --git a/QUICK_START.md b/QUICK_START.md
new file mode 100644
index 0000000..eb1bf4e
--- /dev/null
+++ b/QUICK_START.md
@@ -0,0 +1,143 @@
+# 🚀 One-shot GEE 快速启动指南
+
+## 📋 准备工作
+
+### 1. 激活环境
+```bash
+conda activate one-shot-gee
+```
+
+### 2. 验证环境
+```bash
+# 检查Python版本
+python --version # 应该显示 Python 3.10.x
+
+# 检查关键包
+python -c "import torch, pandas, transformers; print('环境正常')"
+```
+
+## 🧪 测试流程
+
+### 步骤1: 基础组件测试
+```bash
+# 运行组件功能测试
+python test_gee_components.py
+```
+
+**期望输出:**
+```
+==================================================
+测试GEE数据处理器
+==================================================
+测试性别检测:
+ 'He is a doctor...' -> male
+ 'She is a nurse...' -> female
+...
+✓ GEE数据处理器测试通过
+✓ GEE损失函数测试通过
+✓ 组件集成测试通过
+所有测试通过!✓
+```
+
+### 步骤2: 训练逻辑测试
+```bash
+# 运行训练逻辑测试
+python test_gee_training.py
+```
+
+**期望输出:**
+```
+============================================================
+测试GEE训练逻辑
+============================================================
+Step 1 | loss=6.411685 | entropy_gap=0.004735 | H_male=6.409283 | H_female=6.414019
+...
+✓ GEE训练逻辑测试通过
+🎯 准备就绪,可以进行真实模型训练!
+```
+
+## 🎯 成功标准
+
+### ✅ 通过标准
+- 所有测试显示 "✓ 通过"
+- 没有错误或异常
+- 熵值在合理范围内 (6.0-7.0)
+- 性别标签转换正确 (male=0, female=1)
+
+### ❌ 失败情况
+如果遇到以下问题:
+
+**1. 模块导入错误**
+```bash
+ModuleNotFoundError: No module named 'xxx'
+```
+解决方案:
+```bash
+conda activate one-shot-gee
+pip install 缺失的包名
+```
+
+**2. 路径错误**
+```bash
+FileNotFoundError: [Errno 2] No such file or directory
+```
+解决方案:
+```bash
+# 确保在项目根目录
+cd /path/to/one-shot-em
+```
+
+**3. CUDA错误**
+```bash
+CUDA out of memory
+```
+解决方案:使用CPU版本测试(当前配置已经是CPU版本)
+
+## 🔄 完整测试命令
+
+```bash
+# 一键运行所有测试
+conda activate one-shot-gee && \
+python test_gee_components.py && \
+echo "组件测试完成 ✅" && \
+python test_gee_training.py && \
+echo "训练逻辑测试完成 ✅" && \
+echo "所有测试通过!准备就绪 🎉"
+```
+
+## 📊 结果解读
+
+### 组件测试结果
+- **性别检测**: 应该正确识别male/female/neutral
+- **熵计算**: Token熵应该在6-7范围内
+- **损失函数**: L2和L1版本应该有明显差异
+
+### 训练测试结果
+- **损失收敛**: 损失值应该稳定在6.4左右
+- **熵差距**: 应该在0.001-0.1范围内
+- **参数影响**: 不同lambda值应该影响偏见损失
+
+## 🎯 下一步
+
+### 如果测试通过 ✅
+您可以:
+1. 获取Qwen2.5-Math-7B模型
+2. 修改 `scripts/train_one_shot_gee.sh` 中的模型路径
+3. 运行真实训练:`bash scripts/train_one_shot_gee.sh`
+
+### 如果测试失败 ❌
+请:
+1. 检查错误信息
+2. 参考 `TEST_GUIDE.md` 的故障排除部分
+3. 确保环境配置正确
+
+## 📞 需要帮助?
+
+查看详细文档:
+- `GEE_README.md` - 完整项目文档
+- `TEST_GUIDE.md` - 详细测试指南
+- `IMPLEMENTATION_SUMMARY.md` - 实现总结
+
+---
+
+**记住**: 当前测试使用模拟数据和模型,不需要真实的Qwen2.5-Math-7B模型。这些测试验证的是代码逻辑的正确性! \ No newline at end of file