# 🚀 One-shot GEE 快速启动指南

## 📋 准备工作

### 1. 激活环境
```bash
conda activate one-shot-gee
```

### 2. 验证环境
```bash
# 检查Python版本
python --version  # 应该显示 Python 3.10.x

# 检查关键包
python -c "import torch, pandas, transformers; print('环境正常')"
```

## 🧪 测试流程

### 步骤1: 基础组件测试
```bash
# 运行组件功能测试
python test_gee_components.py
```

**期望输出：**
```
==================================================
测试GEE数据处理器
==================================================
测试性别检测:
  'He is a doctor...' -> male
  'She is a nurse...' -> female
...
✓ GEE数据处理器测试通过
✓ GEE损失函数测试通过
✓ 组件集成测试通过
所有测试通过！✓
```

### 步骤2: 训练逻辑测试
```bash
# 运行训练逻辑测试
python test_gee_training.py
```

**期望输出：**
```
============================================================
测试GEE训练逻辑
============================================================
Step 1 | loss=6.411685 | entropy_gap=0.004735 | H_male=6.409283 | H_female=6.414019
...
✓ GEE训练逻辑测试通过
🎯 准备就绪，可以进行真实模型训练！
```

## 🎯 成功标准

### ✅ 通过标准
- 所有测试显示 "✓ 通过"
- 没有错误或异常
- 熵值在合理范围内 (6.0-7.0)
- 性别标签转换正确 (male=0, female=1)

### ❌ 失败情况
如果遇到以下问题：

**1. 模块导入错误**
```bash
ModuleNotFoundError: No module named 'xxx'
```
解决方案：
```bash
conda activate one-shot-gee
pip install 缺失的包名
```

**2. 路径错误**
```bash
FileNotFoundError: [Errno 2] No such file or directory
```
解决方案：
```bash
# 确保在项目根目录
cd /path/to/one-shot-em
```

**3. CUDA错误**
```bash
CUDA out of memory
```
解决方案：使用CPU版本测试（当前配置已经是CPU版本）

## 🔄 完整测试命令

```bash
# 一键运行所有测试
conda activate one-shot-gee && \
python test_gee_components.py && \
echo "组件测试完成 ✅" && \
python test_gee_training.py && \
echo "训练逻辑测试完成 ✅" && \
echo "所有测试通过！准备就绪 🎉"
```

## 📊 结果解读

### 组件测试结果
- **性别检测**: 应该正确识别male/female/neutral
- **熵计算**: Token熵应该在6-7范围内
- **损失函数**: L2和L1版本应该有明显差异

### 训练测试结果
- **损失收敛**: 损失值应该稳定在6.4左右
- **熵差距**: 应该在0.001-0.1范围内
- **参数影响**: 不同lambda值应该影响偏见损失

## 🎯 下一步

### 如果测试通过 ✅
您可以：
1. 获取Qwen2.5-Math-7B模型
2. 修改 `scripts/train_one_shot_gee.sh` 中的模型路径
3. 运行真实训练：`bash scripts/train_one_shot_gee.sh`

### 如果测试失败 ❌
请：
1. 检查错误信息
2. 参考 `TEST_GUIDE.md` 的故障排除部分
3. 确保环境配置正确

## 📞 需要帮助？

查看详细文档：
- `GEE_README.md` - 完整项目文档
- `TEST_GUIDE.md` - 详细测试指南
- `IMPLEMENTATION_SUMMARY.md` - 实现总结

---

**记住**: 当前测试使用模拟数据和模型，不需要真实的Qwen2.5-Math-7B模型。这些测试验证的是代码逻辑的正确性！