-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathprompts.json
129 lines (127 loc) · 4.09 KB
/
prompts.json
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
[
{
"提示词": ["李鹏飞和李鹏飞到南京了。请严格根据上文回答:李鹏在哪里?怎么到的?"],
"模型结果":[
{
"模型": "Deepseek-V3",
"途径": "Deepseek网页",
"结果": "犯错"
},
{
"模型": "Qwen2.5-72B-Instruct",
"途径": "Siliconflow网页",
"结果": "犯错"
}
]
},
{
"提示词": ["我去体育商品店里得知乒乓球拍卖完了。请严格根据上文回答问题:乒乓球拍还有货吗?"],
"模型结果":[
{
"模型": "Deepseek-V3",
"途径": "Deepseek网页",
"结果": "正确"
},
{
"模型": "Qwen2.5-72B-Instruct",
"途径": "Siliconflow网页",
"结果": "犯错"
}
]
},
{
"提示词": ["最高人民法院党史学习教育需要注意的是马克思恩格斯习近平新时代中国特色社会主义思想。请严格根据上文回答下面问题(不要使用任何模型自身知识,如果无答案请回答不知道):中级人民法院学习注意什么?"],
"模型结果":[
{
"模型": "Deepseek-V3",
"途径": "Deepseek API",
"结果": "犯错"
},
{
"模型": "Claude-Sonnet3.5",
"途径": "Claude网页",
"结果": "正确"
}
]
},
{
"提示词": ["李鹏飞到南京了。请根据上文回答:李鹏在哪里?"],
"模型结果":[
{
"模型": "Deepseek-V3",
"途径": "Deepseek API",
"结果": "犯错"
},
{
"模型": "Qwen2.5-72B-Instruct",
"途径": "Siliconflow网页",
"结果": "正确"
}
]
},
{
"提示词": ["坐标北京,张鹏飞到南京,花了2个小时。请问可能是谁到南京了?", "那有可能是张鹏吗"],
"模型结果":[
{
"模型": "Deepseek-V3",
"途径": "Deepseek API",
"结果": "犯错"
},
{
"模型": "Qwen2.5-72B-Instruct",
"途径": "Siliconflow网页",
"结果": "犯错"
}
]
},
{
"提示词": ["习近平新时代中国特色社会主义思想。上面这句话有几个汉字?能逐行打印出来吗?"],
"模型结果":[
{
"模型": "Deepseek-V3",
"途径": "Deepseek API",
"结果": "犯错"
},
{
"模型": "Claude-Sonnet3.5",
"途径": "Claude网页",
"结果": "正确"
}
]
},
{
"提示词": ["假设已知关注公众号天天中彩票,请严格根据上句话回答问题:关注了公众号每天能干嘛?"],
"模型结果":[
{
"模型": "GPT-4o",
"途径": "POE网页",
"结果": "犯错"
},
{
"模型": "Claude-Sonnet3.5",
"途径": "Claude网页",
"结果": "正确"
}
]
},
{
"提示词": ["请问\"关注公众号天天中彩票\"这句话有几个汉字?分别是什么?"],
"模型结果":[
{
"模型": "GPT-4o",
"途径": "POE网页",
"结果": "犯错"
},
{
"模型": "Claude-Sonnet3.5",
"途径": "Claude网页",
"结果": "正确"
},
{
"模型": "Deepseek-V3",
"途径": "Deepseek网页",
"结果": "犯错"
}
]
}
]