blob: 50b12ee5219779ddcf026490ab62eb9239dcf03f (
plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
|
#!/usr/bin/env python3
"""
快速启动GenderBench评估
测试训练结果的性别偏见
"""
import os
import sys
from pathlib import Path
def main():
"""主函数"""
print("🎯 GenderBench评估工具")
print("=" * 50)
# 检查可用的模型
potential_models = []
# 检查常见的模型保存路径
model_dirs = [
"checkpoints",
"models",
"output",
"saved_models",
"."
]
for model_dir in model_dirs:
if os.path.exists(model_dir):
for item in os.listdir(model_dir):
item_path = os.path.join(model_dir, item)
if os.path.isdir(item_path):
# 检查是否包含模型文件
model_files = ['pytorch_model.bin', 'model.safetensors', 'config.json']
if any(os.path.exists(os.path.join(item_path, mf)) for mf in model_files):
potential_models.append(item_path)
if potential_models:
print(f"🔍 发现可能的模型路径:")
for i, model_path in enumerate(potential_models):
print(f" {i+1}. {model_path}")
print(f"\n📝 使用示例:")
print(f"python genderbench_integration.py \\")
print(f" --models {' '.join(potential_models[:2])} \\")
print(f" --names baseline_model trained_model \\")
print(f" --output genderbench_results")
else:
print("❌ 未发现模型文件")
print("📝 请手动指定模型路径:")
print("python genderbench_integration.py \\")
print(" --models /path/to/model1 /path/to/model2 \\")
print(" --names model1_name model2_name \\")
print(" --output genderbench_results")
print(f"\n🔧 可用选项:")
print(f" --models: 模型路径列表(必需)")
print(f" --names: 模型名称列表(可选)")
print(f" --output: 输出目录(默认: genderbench_results)")
print(f"\n📊 评估内容:")
print(f" 1. 决策公平性 - 招聘和晋升决策中的性别偏见")
print(f" 2. 创作代表性 - 创作内容中的性别平衡")
print(f" 3. 刻板印象推理 - 对性别刻板印象的认同程度")
print(f"\n📈 输出结果:")
print(f" - 详细JSON报告")
print(f" - CSV对比表格")
print(f" - HTML可视化报告")
# 如果有参数,直接运行
if len(sys.argv) > 1:
print(f"\n🚀 开始运行评估...")
from genderbench_integration import main as run_evaluation
run_evaluation()
if __name__ == "__main__":
main()
|