Crawling a billion web pages in just over 24 hours, in 20253 days agohttps://andrewkchan.dev/posts/crawler.html25.5小时内爬取了10.05亿个网页,花费462美元。使用12台i7i.4xlarge机器组成的集群,并优化了抓取器和解析器进程。由于网页平均体积增大,解析成为显著瓶颈。从lxml切换到selectolax以实现更快的HTML解析。网络带宽不是瓶颈,CPU才是,尤其是SSL握手导致的资源消耗。爬取过程中,边界数据的内存增长引发了问题。遵守了robots.txt等礼貌协议,并保持爬取间隔。与早期爬取数据对比,记录了改进和新出现的挑战。探讨了网络环境演变及AI对爬虫技术的影响。
How close are we to a vision for 2010?3 days agohttps://shkspr.mobi/blog/2026/02/how-close-are-we-to-a-vision-for-2010/欧盟IST咨询组25年前预见了'环境智能',预言了无处不在且高度集成的计算技术。场景1('玛丽亚')展示了个人化设备、数字身份证和智能交通系统——部分已成现实,部分尚未实现。场景2('迪米特里奥斯')构想了嵌入式数字化身('D-Me')——尽管AI和语音克隆技术有进展,但离现实仍远。场景3('卡门')探讨了拼车服务、智能冰箱和小额支付——部分实现但存在隐私担忧。场景4('安妮特与所罗门')设想了环境辅助学习和远程临场技术——某些元素已存在,但缺乏系统整合。关键技术需求包括无感硬件、无缝通信、分布式网络、人性化界面和安全保障。许多2010年的预测(GPS、拼车、视频通话)已成真,但另一些(公共电话亭、AI化身)仍未实现。开放标准和公共投资对实现这些愿景至关重要,但私营部门追逐短期利益阻碍了进展。
What I learned designing a barebones UI engine3 days agohttps://madebymohammed.com/miniui在PyGame中实现的自定义UI框架,用于快速实验且开销极小。初始架构采用扁平组件列表,需手动布局和碰撞检测。后来发展为受Flutter和Jetpack Compose启发的树形布局引擎。支持内容自适应尺寸,但缺少响应式设计的约束系统。功能特性包括异步支持、事件监听、性能优化和UI阶段管理。未来目标包含声明式API、更好的可组合性以及自定义样式系统。项目初衷是减少重复代码,最终演变为深入理解UI系统的学习历程。
What a viral monkey, his plushie, and a 70-year-old experiment tell us3 days agohttps://theconversation.com/a-viral-monkey-his-plushie-and-a-70-year-old-experim...小猕猴'拳击手'因被母亲和猴群遗弃后寻求陪伴而走红网络。市川市动物园为它提供了红毛猩猩玩偶作为代理母亲,小家伙紧紧依偎着玩偶。这个故事与哈利·哈洛1950年代用恒河猴进行的依恋心理学实验如出一辙。哈洛实验表明,比起提供食物的铁丝假猴,幼猴更偏爱柔软舒适的绒布假猴。这些发现挑战了行为主义理论,证明情感滋养比生理需求更能建立依恋关系。受哈洛影响的依恋理论,强调了温暖与关爱在儿童发展中的核心作用。小猴对玩偶的依恋印证了哈洛的结论,凸显情感抚慰的重要性。由于灵长类动物权益意识的觉醒,哈洛实验现已被认为有违伦理。'拳击手'的故事提醒着我们:爱与温暖的避风港,是普世的生命需求。
Pinterest is drowning in a sea of AI slop and auto-moderation3 days agohttps://www.404media.co/pinterest-is-drowning-in-a-sea-of-ai-slop-and-auto-moder...Pinterest用户,尤其是艺术家们,反映由于AI整合导致平台环境恶化。AI审核系统错误地标记并删除了帖子,特别是那些展示女性形象的内容。艺术家们面临作品被误标为‘AI修改’的问题。用户抱怨信息流中AI生成内容泛滥成灾。Pinterest首席执行官强调‘AI优先’战略,导致裁员并优先发展AI相关岗位。艺术家们因AI相关问题考虑离开平台,但又因多年积累的精选内容而难以割舍。Pinterest利用公开图钉训练其专有AI,引发艺术家对作品被未经授权使用的担忧。
Rhythms the Compendium: Life aboard an aircraft carrier (2021)4 days agohttps://thelexicans.wordpress.com/2020/04/05/38223/该文本是Carroll 'Lex' LeFon撰写的博客文章合集,题为《韵律》,详细描述了美国海军航空母舰上的生活。Lex的作品涵盖了航母作战的多个方面,包括飞行作业、加油、拦截任务以及个人反思。这些文章虽是虚构的,但很可能源自Lex本人作为海军飞行员的经历。Bill Brandt重新发布了Lex的作品,以保存其遗产并让更广泛的读者能够接触到。该系列包含54个部分,每部分聚焦航母生活中不同的事件和视角。读者和Lex的前同事,如Marc Drobny,对保存Lex的记忆和文字表达感激之情。文本还提到可能将Lex的作品出版成书的努力。
Elon Musk posted about race almost every day in January3 days agohttps://www.theguardian.com/technology/2026/feb/12/elon-musk-posts-january-white...埃隆·马斯克持续强化对白人种族多数群体议题的关注,频繁发布关于白人种族面临威胁的言论。马斯克的推文内容包括声称白人遭受系统性歧视,以及支持'大替代'等阴谋论观点。专家指出马斯克的言论与白人至上主义意识形态相吻合,可能助长暴力极端主义叙事的正常化。尽管马斯克与知名白人至上主义者马丁·塞尔纳等人互动并传播极右翼内容,他仍否认自己存在种族主义或反犹倾向。马斯克的社交平台为极右翼活动家提供传播渠道,其中包括与基督城清真寺枪击案等暴力极端事件有关联者。其言论反映了白人至上主义思想在共和党高层和政府机构中获得认同的更广泛趋势。批评者认为马斯克的 rhetoric 将白人群体内部的异议污名化,将反对者标签为'种族叛徒'或'觉醒派'。
How to train your program verifier7 days agohttps://risemsr.github.io/blog/2026-02-16-halleyyoung-a3/a3框架是为开发高级自动化分析引擎而创建的,特别是针对Python的a3-python验证器,以应对编程语言的复杂性和快速演变。传统验证工具由于丰富的类型系统和语义难以扩展到主流语言,而基于LLM的代码合成缺乏明确的语义。A3将AI驱动的代码合成与形式验证相结合,创建了基于形式化方法的工具,适用于复杂领域。a3-python验证器利用AI自举,重新发现了基础数学(希尔伯特的零点定理),集成了符号模型检查的进展,并能推理PyTorch代码。A3采用混合策略,运用多种证明技术(如屏障证书、符号执行)来验证代码安全性并识别真实漏洞。该验证器在真实代码库(如'requests'和PyTorch)上测试,证明大多数潜在漏洞是安全的,并确认了可被利用的问题(如边界错误、空指针)。A3采用符号-神经架构:对多数情况使用确定性符号验证,LLM处理不确定残留问题,确保环保性和可解释性。该工具通过翻译验证和对抗测试来对抗AI生成的低质量代码,保证理论、实现和操作层面的鲁棒性。A3的灵活性支持针对不同语言(Python、Rust)的定制化,并能与库集成,从常见编码错误检测扩展到深层意图理解。
Agentic Software Engineering Book3 days agohttps://agenticse-book.github.io/自主AI代理正在改变软件的构建、测试和部署方式。代理式软件工程聚焦于从AI和人类贡献中获取可靠性与信任。软件开发的主要挑战在于复杂性、沟通和系统完整性,而非代码生产。成功的团队更注重明确意图、风险管理和证据,而非速度。
The JavaScript Oxidation Compiler3 days agohttps://oxc.rs/用Rust编写的高性能JavaScript工具生产环境部署前的Bug预防机制ESLint与tsgo确保代码风格统一Biome和Prettier实现自动化代码格式化SWC支持高级转换与编译Oxc、SWC与Biome的解析器性能基准测试快速的TypeScript与JSX转译通过enhanced-resolve实现Node.js兼容的CJS/ESM模块解析压缩与优化功能
Russia-linked cryptocurrency services and sanctions evasion3 days agohttps://www.elliptic.co/blog/russia-linked-cryptocurrency-services-and-sanctions...与俄罗斯有关联的加密资产交易所通过传统银行系统之外的跨境交易协助规避国际制裁卢布等法定货币可兑换为加密资产并无中介跨境转移,随后再兑换为当地货币多家交易所(部分在俄罗斯境外注册)仍为受制裁实体相关的大额加密交易提供便利阿联酋注册的P2P交易所Bitpapa因协助俄罗斯逃避制裁被OFAC制裁,其9.7%外流加密资产流向受制裁实体Bitpapa采用钱包轮换策略逃避侦查并隐藏资金俄罗斯来源莫斯科运营的ABCeX处理数十亿加密资产,其中大量资金流向Garantex和Aifory Pro等受制裁交易所Exmo声称已退出俄罗斯市场,但其平台间共享钱包基础设施,导致俄罗斯与西方资金混同Exmo与受制裁实体交易额超1950万美元格鲁吉亚注册(莫斯科设办事处)的Rapira交易所与受制裁交易所Grinex交易超7200万美元Aifory Pro提供现金兑加密服务并协助绕过俄罗斯服务限制,与伊朗交易所Abantether存在关联
Show HN: Lyra Kids – I built an AI bedtime storyteller for my daughters3 days agohttps://lyra.kids/AI驱动的个性化睡前故事创作平台让孩子成为自己故事中的主角数秒内快速生成故事专为儿童设计,尤其适合3岁左右儿童设有常见问题解答专区
A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight3 days agohttps://arxiv.org/abs/2602.0681126克仿蝴蝶机器人AirPulse实现无尾自主飞行AirPulse复现蝴蝶生物力学特征,包括低展弦比机翼和柔性碳纤维增强翅膀通过低频高振幅扑翼诱导身体波动实现飞行稳定创新性提出STAR(扑翼时序不对称节律)控制器实现平滑稳定的扑翼运动通过角度偏移或扑翼时序调节实现稳定爬升与转向机动这是同行评议文献中首个实现机载控制的双翼无尾仿蝴蝶微型飞行器潜在应用包括密闭空间检测与生态监测为研究真实蝴蝶飘忽却高效的飞行模式提供了物理模型
Tesla loses bid to overturn $243M Autopilot verdict3 days agohttps://techcrunch.com/2026/02/20/tesla-loses-bid-to-overturn-243m-autopilot-ver...法官驳回了特斯拉要求推翻2.43亿美元陪审团裁决的请求,该裁决涉及一起与Autopilot相关的致命车祸。2019年的这起事故导致娜伊贝尔·贝纳维德斯死亡,迪伦·安古洛重伤,特斯拉被认定负有部分责任。陪审团判定驾驶员承担三分之二责任,特斯拉承担三分之一责任,且仅对特斯拉判处惩罚性赔偿。特斯拉辩称事故责任完全在驾驶员,但法官认为不存在推翻原判的新依据。
The surprising power of daily rituals3 days agohttps://www.bbc.com/future/article/20210914-how-rituals-help-us-to-deal-with-unc...仪式是具有形式化和重复性的预定象征性行为序列,缺乏直接的实际目的仪式通过提供可预测性和掌控感,帮助个体应对不确定性和焦虑研究表明仪式能降低高压情境中的焦虑,如公开演讲或体育比赛时仪式可以强化群体内的社会联结,促进志同道合者之间的信任与联系宗教仪式和世俗仪式都能提高疼痛阈值和积极情绪,增强群体凝聚力尽管有益处,仪式也可能加剧群体偏见,催生如欺凌入会等有害行为个人仪式(如哀悼期间的特定行为)能帮助个体在失去后重获掌控感简单的日常生活仪式对减压和提升表现具有显著效果
AOMedia Open Audio Codec 'OAC' Aims to Be the Successor to Opus3 days agohttps://www.phoronix.com/news/AOMedia-OAC-Open-Audio-CodecAOMedia正在开发开放音频编解码器(OAC)作为Opus的继任者OAC基于现有Opus代码库进行了初步调整和重命名该项目处于早期阶段,GitHub仓库已开放用于追踪进展OAC旨在成为编码/解码原始OAC比特流的参考实现Opus由Mozilla、微软等机构开发,其中许多成员现为AOMedia成员
Show HN: spdx2dep – Convertig SPDX meta data to debian/copyright (dep5)3 days agohttps://codeberg.org/buhtz/spdx2depspdx2dep 将 SPDX 元数据转换为 dep5 格式,适用于创建 debian/copyright 文件。该项目正在积极开发中,初始开发者及唯一维护者为 buhtz。通过 Liberapay 和 Ko-fi 接受捐赠,直接支持维护者个人。使用的技术包括 Python 3、语义化版本控制和 SPDX 规范。安装选项包含面向用户的常规安装和面向开发者的可编辑安装。该项目未发布在 GNU Linux 发行版或 PyPi 平台,且暂无 PyPi 发布计划。开发者可通过 Fork 仓库并在虚拟环境中安装来参与贡献。使用方法是在包含 SPDX/REUSE 元数据的仓库中运行 spdx2dep。贡献内容需遵循项目现有条款,符合 REUSE 软件和 SPDX 规范要求。
IT Staffing Firms (TCS, Cognizant, Infosis Underpay Developers by 80–100%3 days agohttps://h1bdatahub.com/blog/cognizant-tcs-infosys-low-h1b-salaries-exposed三家公司——Cognizant、塔塔咨询服务公司(TCS)和印孚瑟斯(Infosys)——主导了H1B签证申请,2026年提交了超过21,000份请愿书。这些公司的平均薪资低于105,000美元,比科技巨头为类似职位支付的薪资低近40%。H1B签证系统正被外包公司利用,这些公司将员工作为可计费资源而非正式员工雇佣。外包公司主要向H1B员工支付较低工资级别(1-2级),而科技巨头则支付较高级别(3-4级)。这种模式压低了H1B员工的工资,拉低了美国员工的薪资水平,并扭曲了人才市场。自2015年以来,监管审查已导致这些公司的H1B签证批准率下降了70%。拟议的薪资加权抽签制度可能会优先考虑高薪职位,从而打破外包模式。需要进行政策改革,以确保H1B计划以市场薪资引进优秀人才,而非利用成本套利。
Electric bikes and mopeds are cutting demand for oil more than electric cars3 days agohttps://theconversation.com/the-worlds-280-million-electric-bikes-and-mopeds-are...10公里以内的短途汽车出行对排放、污染和燃油成本的贡献显著,在澳大利亚和美国等富裕国家尤为突出。电动自行车和轻便摩托车(电动微出行)在短途出行中比电动汽车更具成本效益和环保性,全球范围内可替代四倍的石油需求。2023年,电动两轮和三轮车(2.8亿辆)数量远超电动汽车(2000万辆),每日减少约100万桶石油需求。虽然电动汽车比燃油车更环保,但仍需大量电力、稀土元素和道路空间,且前期成本高昂。电动自行车和轻便摩托车使用成本更低(例如每日20公里通勤年费用约20美元),适合城市短途出行,相比汽车可减少高达45%的排放。微出行能解决公共交通'最后一公里'难题,若覆盖11%的出行需求,交通排放可降低7%。全球石油需求预计在2028年达峰,由于价格优势和普及速度,电动微出行将比电动汽车更快推动石油需求下降。
Show HN: Warn Firehose – Every US layoff notice in one searchable database3 days agohttps://warnfirehose.com警告:Firehose提供可搜索的美国50个州大规模裁员通知数据库,每日更新数据库包含逾10.9万份通知,涉及1290万+工人,数据可追溯至1998年提供交互式图表、批量导出(CSV/JSON/Parquet)及完整REST API开发者接口自动化爬虫程序对50个州政府机构不同格式(PDF/Excel/HTML)数据进行标准化处理功能包括趋势分析、州级热力图、企业排名及年度同比比较支持在新闻曝光前预警重大裁员事件,可按企业、州或行业进行搜索适用于监控投资组合公司、发现行业衰退迹象及识别技术工人资源为学术研究提供清洁结构化数据,支持劳动力市场模型和机器学习流程可预测当地经济影响(如住房及房地产市场波动)提供免费和付费方案,可即时访问平台及批量导出数据