基于自然语言描述表格的检索增强生成方法与流程
技术特征:
1.基于自然语言描述表格的检索增强生成方法;用于将包括两层以上层级列名和/或两层以上层级行名的表格转化为仅有单层级列名和/或单层级行名的表格;
2.根据权利要求1所述的基于自然语言描述表格的检索增强生成方法,其特征在于,所述文档解析工具是python-docx,自动检测文档中的表格区域,区分表格与非表格内容。
3.根据权利要求1所述的基于自然语言描述表格的检索增强生成方法,其特征在于,所述逻辑连接字符为“的”。
4.根据权利要求1所述的基于自然语言描述表格的检索增强生成方法,其特征在于,完成对应所有所述列名或者所述行名的所述单元格填充的所述结果表格用于生成式人工智能对于使用者问题的解答。
5.根据权利要求4所述的基于自然语言描述表格的检索增强生成方法,其特征在于,所述生成式人工智能在采用所述结果表格或者所述结果表格中的任何内容解答所述使用者问题后,均提供展示相应的所述原始表格的链接。
6.根据权利要求5所述的基于自然语言描述表格的检索增强生成方法,其特征在于,所述原始表格的链接的生成方式具体如下:
技术总结
本发明公开了基于自然语言描述表格的检索增强生成方法;用于将包括两层以上层级列名和/或两层以上层级行名的表格转化为仅有单层级列名和/或单层级行名的表格;包括如下步骤;1、导入需要转换的包括两层以上层级列名和/或两层以上层级行名的表格作为原始表格;2、建立一个数据区与原始表格的数据区完全相同,但仅有单层级列名和/或单层级行名,且存储每一列名或每一行名所在单元格均为空白的结果表格;3、通过文档解析工具提取原始表格中的内容,对结果表格中空白的每一列名或者每一行名的单元格进行填充。本发明对表格进行转化,将多层次复杂的列名或行名,逐层降维拆解,再以自然语言描述形式组合重建成单层的列名或行名。
技术研发人员:孟毓,牟艳莉,朱磊
受保护的技术使用者:上海电力设计院有限公司
技术研发日:
技术公布日:2024/11/18
文档序号 :
【 40048512 】
技术研发人员:孟毓,牟艳莉,朱磊
技术所有人:上海电力设计院有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
技术研发人员:孟毓,牟艳莉,朱磊
技术所有人:上海电力设计院有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
