TE
科技回声
首页24小时热榜最新最佳问答展示工作
GitHubTwitter
首页

科技回声

基于 Next.js 构建的科技新闻平台,提供全球科技新闻和讨论内容。

GitHubTwitter

首页

首页最新最佳问答展示工作

资源链接

HackerNews API原版 HackerNewsNext.js

© 2025 科技回声. 版权所有。

Facebook's robots.txt

40 点作者 sander超过 11 年前

7 条评论

perryh2超过 11 年前
<a href="http://disqus.com/humans.txt" rel="nofollow">http:&#x2F;&#x2F;disqus.com&#x2F;humans.txt</a>
评论 #6822970 未加载
评论 #6821761 未加载
评论 #6821904 未加载
viana007超过 11 年前
<a href="http://www.google.com/robots.txt" rel="nofollow">http:&#x2F;&#x2F;www.google.com&#x2F;robots.txt</a>
评论 #6823056 未加载
评论 #6821679 未加载
kr1m超过 11 年前
You don&#x27;t scrape Facebook, Facebook scrapes you!
评论 #6821656 未加载
yalogin超过 11 年前
So what does it mean by facebook whitelisting a scraping service? Do they actively block scrapers?
评论 #6821643 未加载
pdfcollect超过 11 年前
Is there a way to replace this robots.txt with a null robots.txt? :)
评论 #6821603 未加载
bibstha超过 11 年前
What is a User Agent: Yeti?
评论 #6822826 未加载
decasteve超过 11 年前
Even Facebook&#x27;s robots.txt has a hatred for my pseudo-anonymous browser settings. Facebook gives me this (for any page): &quot;Sorry, something went wrong. We&#x27;re working on getting this fixed as soon as we can.&quot;
评论 #6821610 未加载