Show HN: Nano PDF – A CLI Tool to Edit PDFs with Gemini's Nano Banana
3 months ago
- #AI
- #PDF-editing
- #CLI-tool
- 使用Google Gemini 3 Pro Image('Nano Banana'模型)通过自然语言指令编辑PDF幻灯片的CLI工具
- 功能包括:自然语言编辑(如更新图表、更改图表类型)、添加与演示文稿风格匹配的新幻灯片,以及通过OCR重新水合实现非破坏性编辑保留文本层
- 支持多页和并行处理以提高效率,可配置分辨率(4K/2K/1K)平衡质量与成本
- 通过pip安装,需使用已启用付费的Google Gemini API密钥
- 命令功能:编辑单页/多页、插入AI生成的新幻灯片,支持使用文档上下文、指定样式参考和设置输出文件名等选项
- 提供示例场景:修正错别字、更新品牌标识/财务数据、添加议程幻灯片
- 依赖项包括Python 3.10+、poppler和tesseract,含macOS/Windows/Linux系统安装说明
- 使用技巧:指定样式参考、确保高分辨率OCR、调整分辨率以加速处理
- 可从GitHub安装开发版本,工具采用MIT许可证