Robots.txt: تفاوت بین نسخه‌ها   

از دانشنامه جوملا فارسی - مامبو فارسی
پرش به: ناوبری، جستجو
سطر ۱: سطر ۱:
 
==robots.txt چیست ؟==
 
==robots.txt چیست ؟==
  
بطور خلاصه فایل robots.txt محدودیت هایی رو برای موتورهای جستجو در زمینه جستجو و گردآوری سایت شما انجام می ده.
+
بطور خلاصه فایل robots.txt محدودیت‌هایی را برای موتورهای جستجو در زمینه جستجو و گردآوری سایت شما انجام می‌دهد.
شاید شما هم به این فکر رسیده باشید که اگر بخواهید جلوی قسمتی از سایت، محتوا و یا جایی از سایتتون رو برای خوانده شدن توسط موتورهای جستجویی نظیر گوگل یا یاهو بگیرید چه کاری باید انجام بدید.
+
  
خب، راه حل استفاده از فایل robots.txt هست. موتورهای جستجو قبل از هر کاری ابتدا به این فایل مراجعه می کنند و اگر اجازه داشتند به ادامه کار می پردازند. پیروی از فایل robots.txt نوعی قانون در موتورهای جستجو محسوب می شه.
+
شاید شما هم به این فکر رسیده باشید که اگر بخواهید جلوی قسمتی از سایت، محتوا و یا جایی از سایت خود را برای خوانده شدن توسط موتورهای جستجویی نظیر گوگل یا یاهو بگیرید چه کاری باید انجام دهید.
  
خب، اگه شما می خواهید موتورهایی جستجو همه سایت شما رو بخوانند بنابراین نیازی نیست این مطلب رو بخوانید. نبود این فایل نشانگر رضایت شما از خوانده شدن تمام محتوای قابل دسترس برای موتورهای جستجو هست …
+
راه حل استفاده از فایل robots.txt هست. موتورهای جستجو قبل از هر کاری ابتدا به این فایل مراجعه می‌کنند و اگر اجازه داشتند به ادامه کار می‌پردازند. پیروی از فایل robots.txt نوعی قانون در موتورهای جستجو محسوب می‌شود.
 +
 
 +
اگه شما می‌خواهید موتورهای جستجو تمامی محتوای سایت شما را بخوانند نبود این فایل نشانگر رضایت شما از خوانده شدن تمام محتوای قابل دسترس برای موتورهای جستجو است.
  
 
==فایل robots.txt کجا باید قرار گیرد؟==
 
==فایل robots.txt کجا باید قرار گیرد؟==
فایل robots.txt باید در root هاست شما ( پوشه اصلی که دامنه شما در آن قرار دارد ) قرار گیرد. بطور مثال آدرس فایل <nowiki>http://www.example.com/robots.txt</nowiki> قابل قبول هست ولی آدرسی مانند <nowiki>http://www.example.com/mysite/robots.txt</nowiki> غیرقابل قبول محسوب می شود و محتویات اون خوانده نمی شود. اگر شما به پوشه اصلی ( [[root]] ) دسترسی ندارید می توانید از [[META tag]] ها استفاده کنید.
+
 
 +
فایل robots.txt باید در root هاست شما ( پوشه اصلی که دامنه شما در آن قرار دارد ) قرار گیرد.
 +
 
 +
بطور مثال آدرس فایل <nowiki>http://www.example.com/robots.txt</nowiki> قابل قبول است ولی آدرسی مانند <nowiki>http://www.example.com/mysite/robots.txt</nowiki> غیرقابل قبول محسوب می‌شود و محتویات آن خوانده نمی‌شود. اگر شما به پوشه اصلی ( [[root]] ) دسترسی ندارید می‌توانید از [[META tag]]‌ها استفاده کنید.
  
 
==چگونه فایل robots.txt رو بسازم ؟==
 
==چگونه فایل robots.txt رو بسازم ؟==
شما کافیست برای این کار فایلی با نام robots و با پسوند txt بسازید. توجه داشته باشید تمامی حروف باید کوچک باشد و برای هنگام ذخیره باید حالت ASCII-encoded text رو انتخاب کنید. با برنامه ای مثل notepad می توانید خیلی راحت این کار را انجام دهید.
+
 
ساده ترین فایل robots.txt شامل ۲ نقش است:
+
شما کافیست برای این کار فایلی با نام robots و با پسوند txt بسازید. توجه داشته باشید تمامی حروف باید کوچک باشد و برای هنگام ذخیره باید حالت ASCII-encoded text را انتخاب کنید. با برنامه‌ای مثل notepad می توانید خیلی راحت این کار را انجام دهید.
 +
 
 +
==ساده‌ترین فایل robots.txt شامل ۲ نقش است==
  
 
* User-agent : روبات های مجاز
 
* User-agent : روبات های مجاز
 
* Disallow : صفحه های غیرمجاز
 
* Disallow : صفحه های غیرمجاز
  
بطور مثال برای اجازه دادن به تمامی روبات های خزنده وب می تونید از دستور زیر استفاده کنید :
+
بطور مثال برای اجازه دادن به تمامی روبات‌های خزنده [[وب]] می‌توانید از دستور زیر استفاده کنید:
  
 
+
<source lang="xml">
<div dir=ltr>
+
<code>
+
<pre>
+
  
 
User-agent: *
 
User-agent: *
  
</pre>
+
</source>
</code>
+
</div>
+
 
+
  
چند تا مثال کاربردی:
+
==چند تا مثال کاربردی==
  
 
جلوگیری از خوانده شدن محتوا برای تمامی موتورهای جستجو:
 
جلوگیری از خوانده شدن محتوا برای تمامی موتورهای جستجو:
  
 
+
<source lang="xml">
<div dir=ltr>
+
<code>
+
<pre>
+
  
 
User-agent: *
 
User-agent: *
 
Disallow: /
 
Disallow: /
  
</pre>
+
</source>
</code>
+
</div>
+
  
 +
جلوگیری از خوانده شدن محتوای ۴ پوشه مشخص شده:
  
 
+
<source lang="xml">
جلوگیری از خوانده شدن محتوای ۴ پوشه مشخص شده :
+
 
+
 
+
<div dir=ltr>
+
<code>
+
<pre>
+
  
 
User-agent: *
 
User-agent: *
سطر ۶۳: سطر ۵۳:
 
Disallow: /private/
 
Disallow: /private/
  
</pre>
+
</source>
</code>
+
</div>
+
  
 +
جلوگیری از خواندن محتویات پوشه private توسط گوگل:
  
  
جلوگیری از خواندن محتویات پوشه private توسط گوگل :
+
<source lang="xml">
 
+
 
+
<div dir=ltr>
+
<code>
+
<pre>
+
  
 
User-agent: Googlebot
 
User-agent: Googlebot
 
Disallow: /private/
 
Disallow: /private/
  
</pre>
+
</source>
</code>
+
</div>
+
  
 +
جلوگیری از خوانده شدن یک فایل خاص:
  
جلوگیری از خوانده شدن یک فایل خاص :
+
<source lang="xml">
 
+
 
+
<div dir=ltr>
+
<code>
+
<pre>
+
  
 
User-agent: *
 
User-agent: *
 
Disallow: /directory/file.html
 
Disallow: /directory/file.html
  
</pre>
+
</source>
</code>
+
</div>
+
  
 
+
برای کامنت گذاری از # استفاده می‌شود. تمامی نوشته‌ها بعد از # در یک خط کامنت محسوب می‌شوند ( در نظر گرفته نمی‌شوند ).
برای کامنت گذاری از # استفاده می شه. تمامی نوشته ها بعد از # در یک خط کامنت محسوب می شوند ( در نظر گرفته نمی شوند ).
+
  
 
توجه داشته باشید که بزرگ و کوچک بودن آدرس ها مهم است.
 
توجه داشته باشید که بزرگ و کوچک بودن آدرس ها مهم است.
  
 
=منبع=
 
=منبع=
عصرونه
+
 
 +
'''عصرونه'''
 +
 
 +
بارنویسی : تیم [http://www.joomlafarsi.com/ جوملا فارسی]
 +
 
 +
{{کپی رایت}}
  
 
[[رده:اطلاعات عمومی]]
 
[[رده:اطلاعات عمومی]]

نسخهٔ ‏۲۰ مارس ۲۰۱۱، ساعت ۰۹:۴۹

robots.txt چیست ؟

بطور خلاصه فایل robots.txt محدودیت‌هایی را برای موتورهای جستجو در زمینه جستجو و گردآوری سایت شما انجام می‌دهد.

شاید شما هم به این فکر رسیده باشید که اگر بخواهید جلوی قسمتی از سایت، محتوا و یا جایی از سایت خود را برای خوانده شدن توسط موتورهای جستجویی نظیر گوگل یا یاهو بگیرید چه کاری باید انجام دهید.

راه حل استفاده از فایل robots.txt هست. موتورهای جستجو قبل از هر کاری ابتدا به این فایل مراجعه می‌کنند و اگر اجازه داشتند به ادامه کار می‌پردازند. پیروی از فایل robots.txt نوعی قانون در موتورهای جستجو محسوب می‌شود.

اگه شما می‌خواهید موتورهای جستجو تمامی محتوای سایت شما را بخوانند نبود این فایل نشانگر رضایت شما از خوانده شدن تمام محتوای قابل دسترس برای موتورهای جستجو است.

فایل robots.txt کجا باید قرار گیرد؟

فایل robots.txt باید در root هاست شما ( پوشه اصلی که دامنه شما در آن قرار دارد ) قرار گیرد.

بطور مثال آدرس فایل http://www.example.com/robots.txt قابل قبول است ولی آدرسی مانند http://www.example.com/mysite/robots.txt غیرقابل قبول محسوب می‌شود و محتویات آن خوانده نمی‌شود. اگر شما به پوشه اصلی ( root ) دسترسی ندارید می‌توانید از META tag‌ها استفاده کنید.

چگونه فایل robots.txt رو بسازم ؟

شما کافیست برای این کار فایلی با نام robots و با پسوند txt بسازید. توجه داشته باشید تمامی حروف باید کوچک باشد و برای هنگام ذخیره باید حالت ASCII-encoded text را انتخاب کنید. با برنامه‌ای مثل notepad می توانید خیلی راحت این کار را انجام دهید.

ساده‌ترین فایل robots.txt شامل ۲ نقش است

  • User-agent : روبات های مجاز
  • Disallow : صفحه های غیرمجاز

بطور مثال برای اجازه دادن به تمامی روبات‌های خزنده وب می‌توانید از دستور زیر استفاده کنید:

<source lang="xml">

User-agent: *

</source>

چند تا مثال کاربردی

جلوگیری از خوانده شدن محتوا برای تمامی موتورهای جستجو:

<source lang="xml">

User-agent: * Disallow: /

</source>

جلوگیری از خوانده شدن محتوای ۴ پوشه مشخص شده:

<source lang="xml">

User-agent: * Disallow: /cgi-bin/ Disallow: /images/ Disallow: /tmp/ Disallow: /private/

</source>

جلوگیری از خواندن محتویات پوشه private توسط گوگل:


<source lang="xml">

User-agent: Googlebot Disallow: /private/

</source>

جلوگیری از خوانده شدن یک فایل خاص:

<source lang="xml">

User-agent: * Disallow: /directory/file.html

</source>

برای کامنت گذاری از # استفاده می‌شود. تمامی نوشته‌ها بعد از # در یک خط کامنت محسوب می‌شوند ( در نظر گرفته نمی‌شوند ).

توجه داشته باشید که بزرگ و کوچک بودن آدرس ها مهم است.

منبع

عصرونه

بارنویسی : تیم جوملا فارسی

8.pngاستفاده از مطالب دانشنامه جوملا فارسی - مامبو فارسی با ذکر منبع ( دانشنامه جوملا فارسی ) و لینک مستقیم به http://docs.joomlafarsi.com بلامانع است.