1220 条记录
52 私有链接
52 私有链接
这段内容描述了一个基于NAS的简易AI助手项目。它使用NAS上的funasr进行语音转文字,然后通过Dify调用在线LLM(如硅基流动的qwen2.5-7b和Gemini)解析文本并生成操作命令或回答。对于时间相关问题,使用Gemini搜索;对于通识问题,优先使用响应速度快的Gemini模型。最后,通过Python程序执行命令或进行语音回复。该项目还考虑了Spotify API调用、键盘快捷键以及屏幕内容识别等问题,并提供了一个PC操作命令序列转换的上下文,用于规范化LLM输出的指令。