当前位置：首页 > 优惠 >大语言模型>文章详情

新型网络爬虫生成系统AUTOCRAWLER：自动化地从特定类型的垂直信息网页中提取数据

推荐人：暴走AI| 商城: AI | 2年前 (2024-04-22)| 分类：大语言模型 | 热度：697 ℃

已关闭评论

来自复旦大学和爱橙科技的研究人员推出新型网络爬虫生成系统AUTOCRAWLER，它是为了自动化地从特定类型的垂直信息网页中提取数据而设计的。垂直信息网页是指那些专注于特定主题或业务的网站，比如汽车、书籍、电影、NBA球员信息等。

假设你想要从一个电影信息网站上提取所有电影的标题、导演和类型。使用AUTOCRAWLER，你只需提供一些种子网页（即该网站的几个页面）和提取指令，系统将自动生成一个爬虫，该爬虫能够访问网站的不同页面并提取出所需的信息。

例如，对于NBA球员信息的提取，AUTOCRAWLER可以生成一个爬虫，该爬虫能够从ESPN等体育新闻网站的NBA球员页面中提取出球员的姓名、所在球队、身高和体重等信息。

这项工作的意义在于，传统的网络自动化方法在面对新网站时适应性和可扩展性较差，而基于LLM的生成型代理在开放世界场景中的表现也不理想。AUTOCRAWLER结合了LLM和爬虫的优点，提高了在多样化和不断变化的网络环境中的效率和可重用性。

AUTOCRAWLER 网络爬虫

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

上一篇： SRepair：基于大语言模型的函数级别APR技术

下一篇： LLM-R2：利用大语言模型增强的基于规则的查询重写系统，旨在提高查询效率

暂时木有评论

查看更多商品