登录
注 册
首页
专利运营库
企业需求库
融资需求
开放许可
专利许可
单位名称(
*
)
联 系 人
移动电话(
*
)
所在城市
济南
青岛
淄博
枣庄
东营
烟台
潍坊
济宁
泰安
威海
日照
临沂
德州
聊城
滨州
菏泽
省外
其他说明
专利名称
【
2017101769310
】
一种定制数据爬取工作流的方法及系统
响应
生效日期
2024-01-11
许可期限
2026-04-30
专利权人
山东大学
许可费方式
2
支付标准
入门费提成费相结合
联系人
牟春竹
联系电话
15205319199
电子邮件
地址邮编
浏览人次
626
备 注
本发明公开了一种定制数据爬取工作流的方法及系统,其中,该定制数据爬取工作流的方法包括:配置网页的参数及存储路径,生成定制网页并同步存储至XML文件中;采用DOM方式来解析XML文件并生成爬虫树;编译运行爬虫树,进而抓取出相应网页数据。本发明在数据抽取的通用性、灵活性方面的得到巨大改进,能够让用户在短时间内准确的筛选出需要的内容。
【关 闭】