本发明涉及强化学习、电网故障诊断技术领域,具体为一种基于先验知识强化学习的电网故障诊断方法、系统和装置,获取不同环境状态下电网故障的告警数据文本,首先将告警数据文本与先验知识中的关键特征规则先进行关键特征的文本匹配,如果匹配成功,则直接输出动作,将匹配不成功的告警数据文本经嵌入处理后转化为嵌入向量,对嵌入向量进行进一步处理,得到当前环境状态下不同动作的期望值,然后基于开关特征、开关状态特征、不同动作的估计期望值获得当前环境状态下估计期望值最高的动作和对应的电网故障类型,并引入经验回放更新估计期望值,有效提高了对电网故障诊断的有效性和准确性。 |