Webᵀ Crawl by Web Transpose 是一款实时网页数据采集工具,为LLMs提供了强大的数据支持。只需提供一个URL,让 Webᵀ Crawl 处理其余的工作,快速将完整网站内容(如PDF、FAQ等)转化为微调提示和向量数据库的数据块。
主要特点和功能:
- 将整个网站转化为可用于构建自定义LLMs的数据集。
- 快速处理各种网站内容,为微调和向量数据库提供数据支持。
- Web Transpose网站工具集的一部分,旨在让网络成为你的资源。
- 提供了关于微调和向量数据库的教程,帮助用户更好地利用数据。
- 提供反馈渠道,作者Mike期待与大家探讨有关网页数据、网页抓取等的话题。
访问链接: https://github.com/mike-gee/webtranspose-tutorials-python/