登录    注 册
专利名称 2017101769310一种定制数据爬取工作流的方法及系统 响应
生效日期 2024-01-11 许可期限 2026-04-30 专利权人 山东大学
许可费方式 2 支付标准 入门费提成费相结合
联系人 牟春竹 联系电话 15205319199 电子邮件
地址邮编   
浏览人次 626 备 注 本发明公开了一种定制数据爬取工作流的方法及系统,其中,该定制数据爬取工作流的方法包括:配置网页的参数及存储路径,生成定制网页并同步存储至XML文件中;采用DOM方式来解析XML文件并生成爬虫树;编译运行爬虫树,进而抓取出相应网页数据。本发明在数据抽取的通用性、灵活性方面的得到巨大改进,能够让用户在短时间内准确的筛选出需要的内容。
【关 闭】