Hasty Briefsbeta

双语

Show HN: Chonky – a neural approach for text semantic chunking

a year ago
  • #Text Processing
  • #Python
  • #NLP
  • Chonky 是一个基于Transformer模型的Python语义文本分割库。
  • 它在RAG(检索增强生成)系统中非常实用。
  • 通过pip即可轻松安装:`pip install chonky`。
  • 使用时需初始化`TextSplitter`,将文本处理为有意义的片段。
  • 首次运行时会自动下载Transformer模型。
  • 示例展示了如何将样本文本按'--'分隔符分割成片段。