“提取小红书图文笔记内容” 功能,支持用户输入小红书笔记链接(
xhs_img
)以及从指定地址(
https://www.51aigc.cc/#/userInfo)获取的
api_token
,借助多节点协作的工作流,先通过下载节点获取小红书笔记的图集内容,再利用 OCR(光学字符识别)插件(general_ocr)提取图集中图片里的文字内容,最终实现从小红书笔记链接输入到图集及其中文字内容获取的全流程。无论是内容创作者收集素材,还是研究者分析小红书内容,该功能都能高效满足需求,为用户提供从小红书笔记链接输入到图集与文字内容提取的一站式服务,让小红书图文内容获取更便捷、高效。
- 获取
api_token
:访问https://www.51aigc.cc/#/userInfo,按照页面提示获取api_token
。
- 准备小红书笔记链接(
xhs_img
):找到需要提取内容的小红书图文笔记,复制其分享链接。
- 输入参数:在工作流平台的 “开始” 节点输入区域,填入准备好的小红书笔记链接(
xhs_img
)和获取到的api_token
。
- 工作流执行环节:
- 图集下载:“download” 节点接收
xhs_img
(作为str.url
)和api_token
(作为str.api_token
)输入,从小红书笔记中下载图集内容,输出包含图集数据的data
、执行时间exec_time
、IP 地址ip
、提示信息msg
、状态码code
等内容,为后续文字提取提供图集来源。
- 文字提取:“general_ocr” 节点(OCR 火山版)接收来自 “download” 节点的图集相关
url
,对图集中的图片进行光学字符识别,提取图片里的文字内容,输出outputList
,其中包含识别出的文字信息。
- 结束节点:“结束” 节点整合 “general_ocr” 节点的输出结果,以返回变量
output
和outputList
的形式输出,标志着小红书图文笔记内容提取工作流运行完成。
- 启动工作流:点击工作流界面的运行按钮,触发工作流运行,界面会显示各节点的运行状态(如 “运行中”“运行成功” 等)。
- 查看运行进度与结果:通过平台的运行日志或节点状态提示,查看各环节(如图集下载、文字提取等)的运行进度。工作流运行结束后,在 “结束” 节点的输出区域,获取
output
和outputList
(包含提取到的图集及其中文字内容相关信息)。通过查看这些输出结果,可验证是否成功提取到小红书图文笔记的图集和其中的文字内容,是否符合使用需求。
“提取小红书图文笔记内容” 功能,以输入小红书笔记链接xhs_img
和api_token
为起点,通过 “download”“general_ocr” 等节点的协作,实现了从小红书笔记链接到图集及其中文字内容提取的全流程。从参数准备(获取api_token
、复制小红书笔记链接)到工作流配置、执行,再到内容提取结果获取与验证,流程清晰且操作便捷。该功能为有小红书内容提取需求的用户提供了快速、专业的途径,利用下载与 OCR 识别技术,提升了小红书图文内容获取的效率,为内容创作、学术研究等场景提供了有力支持,让小红书图文笔记内容提取不再繁琐,更具便捷性与实用性。