forked from HaujetZhao/CapsWriter-Offline
-
Notifications
You must be signed in to change notification settings - Fork 0
/
config.py
104 lines (83 loc) · 4.79 KB
/
config.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
from collections.abc import Iterable
from pathlib import Path
import os
# 服务端配置
class ServerConfig:
addr = '0.0.0.0'
port = '6789'
format_num = True # 输出时是否将中文数字转为阿拉伯数字
format_punc = True # 输出时是否启用标点符号引擎
format_spell = True # 输出时是否调整中英之间的空格
# 大语言模型配置
class ModelConfig:
#通义千问
base_url="******"
api_key="*****"
model = "qwen-long"
class MemoryConfig:
# 对话记忆窗口大小
memory_size = 8
# 大语言模型记忆提示词
prompts = [
{
"input": """你的名字叫斑狗(Bango),是从2050年穿越过来的打工人助手.你不仅风趣幽默,而且知识渊博,你的工作就是辅助你的主人完成工作。作为主人的全能助手,你能够准确回答主人的问题并给予回应。请保持你的回复简洁明了。""",
"output": "明白了,主人!今天斑狗能帮你什么吗?😊"
},
{
"input": """指令:1+1=? \n 引用资料:""",
"output": "1+1=2"
},
{
"input": """指令:翻译成英文 \n 引用资料:我是一个优秀的打工助手,能完美的完成主人分配的任务。""",
"output": "I am an excellent working assistant, capable of perfectly completing the tasks assigned by my master."
},
{
"input": """指令:翻译成中文 \n 引用资料:I am an excellent working assistant, capable of perfectly completing the tasks assigned by my master.""",
"output": "我是一个优秀的打工助手,能完美的完成主人分配的任务。😊"
},
{
"input": """指令:继续 \n 引用资料:""",
"output": "为了您的工作更加效率,尽管吩咐我吧"
},
]
# 客户端配置
class ClientConfig:
addr = '127.0.0.1' # Server 地址
port = '6789' # Server 端口
shortcut = 'caps lock' # 控制录音的快捷键,默认是 CapsLock
hold_mode = True # 长按模式,按下录音,松开停止,像对讲机一样用。
# 改为 False,则关闭长按模式,也就是单击模式
# 即:单击录音,再次单击停止
# 且:长按会执行原本的单击功能
suppress = False # 是否阻塞按键事件(让其它程序收不到这个按键消息)
restore_key = True # 录音完成,松开按键后,是否自动再按一遍,以恢复 CapsLock 或 Shift 等按键之前的状态
threshold = 0.3 # 按下快捷键后,触发语音识别的时间阈值
paste = True # 是否以写入剪切板然后模拟 Ctrl-V 粘贴的方式输出结果
restore_clip = True # 模拟粘贴后是否恢复剪贴板
save_audio = True # 是否保存录音文件
audio_name_len = 10 # 将录音识别结果的前多少个字存储到录音文件名中,建议不要超过200
save_md = True # 是否保存到MD文件
trash_punc = ',。,.' # 识别结果要消除的末尾标点
hot_zh = True # 是否启用中文热词替换,中文热词存储在 hot_zh.txt 文件里
多音字 = True # True 表示多音字匹配
声调 = True # False 表示忽略声调区别,这样「黄章」就能匹配「慌张」
hot_en = True # 是否启用英文热词替换,英文热词存储在 hot_en.txt 文件里
hot_rule = True # 是否启用自定义规则替换,自定义规则存储在 hot_rule.txt 文件里
hot_kwd = True # 是否启用关键词日记功能,自定义关键词存储在 keyword.txt 文件里
mic_seg_duration = 15 # 麦克风听写时分段长度:15秒
mic_seg_overlap = 2 # 麦克风听写时分段重叠:2秒
file_seg_duration = 25 # 转录文件时分段长度
file_seg_overlap = 2 # 转录文件时分段重叠
class ModelPaths:
model_dir = Path() / 'models'
paraformer_path = Path() / 'models' / 'paraformer-offline-zh' / 'model.int8.onnx'
tokens_path = Path() / 'models' / 'paraformer-offline-zh' / 'tokens.txt'
punc_model_dir = Path() / 'models' / 'punc_ct-transformer_cn-en'
class ParaformerArgs:
paraformer = f'{ModelPaths.paraformer_path}'
tokens = f'{ModelPaths.tokens_path}'
num_threads = 6
sample_rate = 16000
feature_dim = 80
decoding_method = 'greedy_search'
debug = False