Hasty Briefsbeta

双语

Facebook's Fascination with My Robots.txt

2 days ago

#Facebook
#Web Crawling
#Robots.txt

过去4天里，Facebook持续访问作者自托管Forgejo实例中的/robots.txt文件
请求来自Meta的IP地址段，并使用用户代理'facebookexternalhit/1.1'
仅访问robots.txt文件，未请求其他任何文件或路径
Facebook官方文档称其爬虫用于收集链接分享的元数据，但作者怀疑自己的站点并未被广泛分享
作者推测这可能是Meta端的程序错误或配置失误，质疑此类重复请求对全球带宽和能源的消耗
与之前遇到的AI机器人流量相比，该行为虽基本无害，但仍是个奇特且值得关注的现象