Skip to content

从网页导入数据

提交单个或多个网址链接,可自动解析网页内容并导入知识库。

1、选择获取在线网页数据image.png

2、添加URL地址

  • 支持批量输入网址,可一键获取站点下各子页面的知识内容,包括文本、表格、图片、音频、图片等多种形式。

  • 支持设置自动更新频率,自动定期获取网址知识内容并更新至知识库。

  • 选择器:是针对Web页面的数据可以设置定获取某个div内的数据,默认获取 body数据。支持选填重新定义,常见的选择器类型包括属性选择器(如div)、类选择器(如class)和ID选择器,例如:div[data-prismjs-copy] 或 .docs-content 。如果有多个选择器,请用逗号隔开,例如:.docs-content .mb-0.d-flex表示docs-content类下同时包含mb-0和d-flex两个类的子元素。

  • 若选择URL类型为飞书在线文档,则需要填写app id和app secret。image.png

image.png