Hasty Briefsbeta

双语

Show HN: I built an "ilovepdf" for CSV files (and I called it ILoveCSV)

5 months ago
  • #data-analytics
  • #machine-learning
  • #data-visualization
  • 统一分析工作区,用于转换、分析和可视化数据集。
  • 通过Gemini Live API实现语音驱动的数据分析。
  • 使用原生算法对时间序列数据进行预测分析。
  • 交互式可视化数据探索与图表生成。
  • 自动统计画像,包括偏度与方差分析。
  • 完整数据审计(缺失值/基数/数据类型检查)。
  • 皮尔逊热力图揭示变量间关联关系。
  • 数值分布分析与方差指标详解。
  • 线性建模量化变量间预测效力。
  • 基于K-Means算法的无监督分群。
  • 多列数学表达式特征构造器。
  • 日期特征提取(周末/工作日/季度等)。
  • 带阈值封顶机制的智能异常值检测。
  • 双版本数据集可视化比对工具。
  • 基于分类均值的缺失值智能填充策略。
  • 字典逻辑驱动的分类标签重映射。
  • 文本特征提取(词数/字符数/联系方式识别)。
  • 列间逻辑完整性规则校验(如结束>开始)。
  • 变量归一化(0-1)与标准化处理。
  • 分类文本到二进制数值的特征转换。
  • 连续数值离散化分箱工具。
  • 时间序列滚动窗口降噪变换。
  • 文本列关键词密度与词频分析。
  • 动态多维数据透视与交叉表生成。
  • 基于分组键的数据集聚合视图。
  • 宽表转长表格式适配BI与数据库。
  • 精确匹配键的多表对齐合并。
  • 模糊字符串匹配解决表间命名差异。
  • 自动化去重与空白字符净化。
  • 基于相似度的智能记录去重(优先级可配置)。
  • 莱文斯坦距离概率化记录融合。
  • 正则模式驱动的数据修复与文本转换。
  • Z-score统计异常值检测。
  • 变量数值冲击注入与累积趋势模拟。
  • 线性启发式的数据缺口插值策略。
  • 列名蛇形标准化与格式统一。
  • Box-Muller变换实现数据统计扩容。
  • CSV转结构化JSON(适配Web/App)。
  • 安全转换并原生嵌入Excel文件。
  • 文档图层空间文本回收(表格数据提取)。
  • 异构时间格式统一为ISO-8601标准。
  • 多运算符组合的高级逻辑查询链。
  • CSV特殊格式的专业级清洗方案。
  • CSV文件唯一行提取器。
  • 指定CSV列值频次统计器。
  • 多CSV智能合并(自动对齐列/解析表头差异)。
  • CSV即时模式推断与可视化(含类型/约束)