2011-01-29 10 views
9

Ana etki alanının altındaki bir klasörde yer alan bir projem var ve etki alanının kendisinin köke erişemiyorum.Alt dizinde robots.txt

http://mydomain.com/myproject/ 

Ben

http://mydomain.com/myproject/forbidden/ 

ben sadece myproject klasöründe bir robots.txt koyabilir miyim "yasak" alt klasöründe üzerinde indeksleme izin vermemek istiyor? Kökte robots.txt olmasa bile okunacak mı?

Yasaklı klasörü engellemek için doğru sözdizimi nedir? robotstxt.org itibaren

User-agent: * 
Disallow: /forbidden/ 

veya

User-agent: * 
Disallow: forbidden/ 

cevap

18

:

o

kısa cevabı koymak: Web sunucunun en üst düzey dizinde.

uzun cevap:

robot URL için "/robots.txt" dosyasını arar

, bu URL (ilk tek eğik çizgi her şeyi) gelen yol bileşenini şeritler ve yerine "/robots.txt" koyar. Örneğin

, için /shop/index.html " http://www.example.com/shop/index.html, o kaldıracaktır "", ve ile değiştirin "/robots.txt" ve ile sona erecek" http://www.example.com/robots.txt".

Yani, bir web sitesi sahibi olarak bunu elde edilen URL çalışması için web sunucuda doğru yere koymak gerekir. Genellikle bu web sitesinin ana "endeksini koymak aynı yerde .html "hoşgeldiniz sayfası. tam olarak tha t, ve orada dosyayı koymak için web sunucunuza yazılım bağlıdır. "Robots.txt" değil "robots.txt

yüzden cevap koymak için sahip olmasıdır korkuyorum:

dosya için tüm küçük harf kullanmayı unutmayın. ikinci sorunuza ile ilgili olarak

:-(kök klasöründe, ben doğru sözdizimi eğik çizgi (örn. /forbidden/) ile başlayan biri olduğuna inanıyoruz.

+0

+1 iyi bir açıklama için/alıntı. – Alxandr

+2

Ama Robots.txt kökünde olacağından, o okumak isteyeceksiniz 'Disallow:/myproject/yasak /'. –

+1

@Jim, Sözdizimden bahsediyordum, gerçek yollar değil, ama siz haklısınız. –

3

Sen ne yazık ki olamaz. Robots.txt, yalnızca alanın kök dizinine gidebilir.

Belki de alan sahibine ricada bulunursanız lütfen mecbur olur mu?

ilk sözdizimi doğru sözdizimi, ancak etki alanının kökünden mutlak yol olması gerekir hatırlıyorum. Eğer kök yoksa

0

Aslında, ben hep 404 hatası neden bir alt klasörde robots.txt hakkında botlara çeşitli istekleri görebilirsiniz. Sadece bu botlara bazıları:

Aptal 404 hatalar içeren hata günlüğü spam bu engellemek istiyorsanız 363.210

Yani, .htaccess yoluyla doğru yere bu istekleri yönlendirmek:

RewriteRule .+/robots.txt$ /robots.txt [R=301,L]