Hasty Briefsbeta

双语

Show HN: Webclone.js – A simple tool to clone websites

3 months ago
  • #command-line-tool
  • #offline-browsing
  • #web-archiving
  • WebClone.js 是一个用于创建网站离线存档的命令行工具。
  • 它能爬取网站、保存页面和资源、重写链接并下载视频。
  • 开发初衷是为了解决传统工具(如wget)的功能局限性。
  • 核心功能包括完整网站存档、链接重写和视频下载。
  • 支持通过交互式登录或cookie文件进行身份验证。
  • 高度可配置,可设置爬取深度、并发数和范围等参数。
  • 使用puppeteer-extra增强隐蔽性和鲁棒性。
  • 通过自动滚动页面支持懒加载内容。
  • 需要Node.js 18+环境,视频下载需额外安装yt-dlp和ffmpeg。
  • 安装方式为克隆仓库后安装依赖项。
  • 使用示例涵盖基础存档、私有站点存档和视频下载场景。
  • 命令行选项支持精细化配置。
  • 基于MIT许可证开放贡献。