Show HN: I built an "ilovepdf" for CSV files (and I called it ILoveCSV)
5 months ago
- #data-analytics
- #machine-learning
- #data-visualization
- 统一分析工作区,用于转换、分析和可视化数据集。
- 通过Gemini Live API实现语音驱动的数据分析。
- 使用原生算法对时间序列数据进行预测分析。
- 交互式可视化数据探索与图表生成。
- 自动统计画像,包括偏度与方差分析。
- 完整数据审计(缺失值/基数/数据类型检查)。
- 皮尔逊热力图揭示变量间关联关系。
- 数值分布分析与方差指标详解。
- 线性建模量化变量间预测效力。
- 基于K-Means算法的无监督分群。
- 多列数学表达式特征构造器。
- 日期特征提取(周末/工作日/季度等)。
- 带阈值封顶机制的智能异常值检测。
- 双版本数据集可视化比对工具。
- 基于分类均值的缺失值智能填充策略。
- 字典逻辑驱动的分类标签重映射。
- 文本特征提取(词数/字符数/联系方式识别)。
- 列间逻辑完整性规则校验(如结束>开始)。
- 变量归一化(0-1)与标准化处理。
- 分类文本到二进制数值的特征转换。
- 连续数值离散化分箱工具。
- 时间序列滚动窗口降噪变换。
- 文本列关键词密度与词频分析。
- 动态多维数据透视与交叉表生成。
- 基于分组键的数据集聚合视图。
- 宽表转长表格式适配BI与数据库。
- 精确匹配键的多表对齐合并。
- 模糊字符串匹配解决表间命名差异。
- 自动化去重与空白字符净化。
- 基于相似度的智能记录去重(优先级可配置)。
- 莱文斯坦距离概率化记录融合。
- 正则模式驱动的数据修复与文本转换。
- Z-score统计异常值检测。
- 变量数值冲击注入与累积趋势模拟。
- 线性启发式的数据缺口插值策略。
- 列名蛇形标准化与格式统一。
- Box-Muller变换实现数据统计扩容。
- CSV转结构化JSON(适配Web/App)。
- 安全转换并原生嵌入Excel文件。
- 文档图层空间文本回收(表格数据提取)。
- 异构时间格式统一为ISO-8601标准。
- 多运算符组合的高级逻辑查询链。
- CSV特殊格式的专业级清洗方案。
- CSV文件唯一行提取器。
- 指定CSV列值频次统计器。
- 多CSV智能合并(自动对齐列/解析表头差异)。
- CSV即时模式推断与可视化(含类型/约束)