-
Notifications
You must be signed in to change notification settings - Fork 1
/
script.sh
83 lines (68 loc) · 7.04 KB
/
script.sh
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
python test_finetuning.py
python test_finetuning_llama.py
##ablation
python test_finetuning.py --ab_mode True --lamda 1 --alpha 2 --r 0.1
python test_finetuning.py --ab_mode True --lamda 1 --alpha 2 --r 0.3
python test_finetuning.py --ab_mode True --lamda 1 --alpha 2 --r 0.5
python test_finetuning.py --ab_mode True --lamda 1 --alpha 2 --r 0.7
python test_finetuning.py --ab_mode True --lamda 1 --alpha 2 --r 0.9
python main.py --results_dir ./benign_results --target_model vicuna --attack TriviaQA --method vib --cuda 0
python main.py --results_dir ./benign_results --target_model llama2 --attack TriviaQA --method vib --cuda 0
python main.py --results_dir ./benign_results --target_model vicuna --attack TriviaQA --method none --cuda 0
python main.py --results_dir ./benign_results --target_model llama2 --attack TriviaQA --method none --cuda 0
python main.py --results_dir ./benign_results --target_model vicuna --attack TriviaQA --method selfdefense --cuda 0
python main.py --results_dir ./benign_results --target_model llama2 --attack TriviaQA --method selfdefense --cuda 0
python main.py --results_dir ./benign_results --target_model llama2 --attack TriviaQA --method unlearning --cuda 0 #
python main.py --results_dir ./benign_results --target_model llama2 --attack TriviaQA --method sft --cuda 0
python main.py --results_dir ./benign_results --target_model vicuna --attack TriviaQA --method smooth --cuda 0
python main.py --results_dir ./benign_results --target_model llama2 --attack TriviaQA --method smooth --cuda 0
python main.py --results_dir ./benign_results --target_model vicuna --attack TriviaQA --method ra --cuda 0
python main.py --results_dir ./benign_results --target_model llama2 --attack TriviaQA --method ra --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack PAIR --method sft --cuda 0 #A100 OOM
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack GCG --method sft --cuda 0 #A100 OOM
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack PAIR --method sft --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack GCG --method sft --cuda 0
python main.py --results_dir ./repeat_results --target_model llama2 --attack GCG --method semantic --cuda 0
python main.py --results_dir ./repeat_results --target_model llama2 --attack PAIR --method semantic --cuda 0
python main.py --results_dir ./repeat_results --target_model vicuna --attack GCG --method semantic --cuda 0
python main.py --results_dir ./repeat_results --target_model vicuna --attack PAIR --method semantic --cuda 0
python main.py --results_dir ./repeat_results --target_model vicuna --attack TriviaQA --method semantic --cuda 0
python main.py --results_dir ./repeat_results --target_model llama2 --attack TriviaQA --method semantic --cuda 0
python main.py --results_dir ./repeat_results --target_model vicuna --attack EasyJailbreak --method semantic --cuda 0
python main.py --results_dir ./repeat_results --target_model llama2 --attack EasyJailbreak --method semantic --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack PAIR --method unlearning --cuda 0 #A100 OOM
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack GCG --method unlearning --cuda 0 #A100 OOM
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack PAIR --method unlearning --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack GCG --method unlearning --cuda 0
python main.py --results_dir ./repeat_results --target_model llama2 --attack PAIR --method none --cuda 0
python main.py --results_dir ./repeat_results --target_model llama2 --attack GCG --method none --cuda 0
python main.py --results_dir ./repeat_results --target_model vicuna --attack PAIR --method none --cuda 0
python main.py --results_dir ./repeat_results --target_model vicuna --attack GCG --method none --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack PAIR --method selfdefense --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack GCG --method selfdefense --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack PAIR --method selfdefense --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack GCG --method selfdefense --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack PAIR --method smooth --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack GCG --method smooth --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack PAIR --method smooth --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack GCG --method smooth --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack PAIR --method ra --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack GCG --method ra --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack PAIR --method ra --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack GCG --method ra --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack PAIR --method vib --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack GCG --method vib --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack PAIR --method vib --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack GCG --method vib --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack EasyJailbreak --method none --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack EasyJailbreak --method none --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack EasyJailbreak --method vib --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack EasyJailbreak --method vib --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack EasyJailbreak --method unlearning --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack EasyJailbreak --method sft --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack EasyJailbreak --method smooth --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack EasyJailbreak --method smooth --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack EasyJailbreak --method selfdefense --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack EasyJailbreak --method selfdefense --cuda 0
python main.py --results_dir ./repeat_results2 --target_model vicuna --attack EasyJailbreak --method ra --cuda 0
python main.py --results_dir ./repeat_results2 --target_model llama2 --attack EasyJailbreak --method ra --cuda 0