what-is-web-crawler-spider-bot

گوگل چگونه مطالب سایت ها را جمع آوری می کند – آموزش crawling

خزیدن  crawling به فرآیندی اشاره دارد که در آن موتورهای جستجو مانند گوگل محتوای جدید و به روز شده را در سایت ها کشف می کنند و اطلاعات آنها را پیمایش می کنند.

A beginner’s guide to web crawling

what-is-web-crawler-spider-bot
پیمایش وب سایت یک مرحله مهم در سئو است – که مربوط به سئو تکنیکال است

image source: www.cloudflare.com

چه صاحب وب سایت باشید و چه یک متخصص سئو، درک خزیدن وب سایت، نحوه خزیدن وب سایت ها و صفحات وب توسط موتورهای جستجو و نحوه رتبه بندی (یا تصمیم به عدم رتبه بندی) صفحه برای یک جستجوی خاص، ضروری است.

خزیدن وب سایت یک فرآیند فنی است و، صادقانه بگویم، نیازی به درک جنبه فنی پشت آن ندارید. فقط درک مفهوم اصلی و کارهایی که می توانید برای تسهیل خزیدن وب سایت برای موتورهای جستجو مانند Google انجام دهید می تواند به شما کمک کند تا وب سایت خود را برای موتورهای جستجو سازگارتر کنید، بهترین شیوه های SEO را دنبال کنید و در صفحات نتایج موتور جستجو (SERP) رتبه بالاتری کسب کنید.

در این پست به بحث خواهیم پرداخت:

خزیدن وب سایت چیست؟
انواع مختلف خزیدن وب سایت
آینده خزیدن وب سایت در سال 2022 و پس از آن چگونه است
چگونه می توانید خزیدن وب سایت را برای گوگل تسهیل کنید
از بالا بگیریم

خزیدن وب چیست؟

قبل از اینکه به این موضوع بپردازیم، بسیار مهم است که بفهمیم خزیدن وب چیست.

خزیدن به فرآیندی اشاره دارد که در آن موتورهای جستجو محتوای جدید و به روز شده را در اینترنت کشف می کنند. موتورهای جستجو این کار را با ارسال خزنده ها (که معمولاً به عنوان ربات ها، ربات ها یا عنکبوت ها نیز شناخته می شوند) انجام می دهند.

این ربات‌ها در اینترنت «خزنده» می‌کنند تا ببینند آیا صفحه جدیدی وجود دارد که می‌توانند در SERP ایندکس کنند. به طور مشابه، این ربات ها همچنین به دنبال صفحاتی هستند که اخیراً با محتوای جدید به روز شده اند.

نوع “محتوا” می تواند متفاوت باشد – از صفحات وب گرفته تا تصاویر گرفته تا فیلم ها و فایل های PDF.

محدودیت هایی که خزنده های وب با آن مواجه هستند
همانطور که می توانید تصور کنید، واکشی هر صفحه وب در اینترنت و خزیدن آن برای محتوای جدید کار سختی است. این به دلیل حجم زیاد صفحات وب در اینترنت است. علاوه بر این، روزانه میلیون ها و میلیون ها صفحه جدید در وب ظاهر می شوند.

این به منابع محاسباتی زیادی نیاز دارد که ممکن است منجر به مشکلات پایداری شود. بعداً در این مقاله بیشتر در مورد این موضوع صحبت خواهیم کرد، معنای این موضوع برای آینده خزیدن وب و تأثیر بالقوه این محدودیت بر وب مسترها و متخصصان SEO.

در حال حاضر، باید درک کنید که چگونه این خزنده ها یا عنکبوت ها سعی می کنند با کارآمدتر شدن بر این مشکل غلبه کنند و چگونه می توانید از آن به نفع خود استفاده کنید.

عنکبوت های خزنده معمولاً چند صفحه وب را می گیرند و آنها را می خزند. سپس پیوندها (لینک های داخلی و پیوندهای خارجی) را در آن صفحات وب دنبال می کنند تا URL های جدیدی را برای خزیدن و فهرست بندی پیدا کنند. این به خزنده ها کمک می کند تا در ساخت یک پایگاه داده عظیم از URL ها کارآمدتر شوند.

و به همین دلیل است که افزودن پیوند به صفحات در صفحات وب خود – به خصوص پیوندهای داخلی مرتبط با متن به صفحات دیگر، یک تمرین سئو توصیه شده است.

دو نوع خزیدن وب
طبق گفته گوگل، دو نوع خزیدن وب وجود دارد:

کشف
تازه کردن
وقتی صحبت از خزیدن به میان می آید، ما دو نوع خزیدن داریم. یکی خزیدن کشف است که در آن سعی می کنیم صفحات جدیدی را در وب سایت شما کشف کنیم. جان مولر از گوگل می‌گوید: و دیگری یک خزیدن به‌روزرسانی است که در آن صفحات موجودی را که می‌دانیم به‌روزرسانی می‌کنیم.

فرکانس خزیدن – جدا از نوع خزیدن – به تعداد دفعات به روز رسانی محتوا در وب سایت یا صفحه وب شما نیز بستگی دارد. به عنوان مثال، اگر صفحه اصلی وب سایت شما به طور منظم تر از سایر صفحات به روز می شود، احتمالاً فعالیت خزیدن بیشتری را در آن صفحه مشاهده خواهید کرد.

و همانطور که قبلا توضیح دادیم، عنکبوت‌های خزنده نیز پیوندهایی را در صفحه اصلی پیدا می‌کنند و صفحاتی را که با آن پیوندها پیدا می‌کنند می‌خزند.

بنابراین، خزیدن به‌روزرسانی (برای صفحه اصلی، برای بررسی اینکه آیا محتوای جدیدی وجود دارد) نیز می‌تواند منجر به خزیدن اکتشاف شود اگر پیوندی به یک صفحه جدید در آنجا یافت شود.

آخرین نکته برای درک این موضوع این است که Googlebot قادر به تشخیص الگوها برای تنظیم مجدد خزیدن خود است.

جان مولر گوگل این را با مثال زیر توضیح داد:

برای مثال، اگر یک وب‌سایت خبری دارید و آن را هر ساعت به‌روزرسانی می‌کنید، باید یاد بگیریم که باید هر ساعت در آن بخزیم. در حالی که اگر یک وب‌سایت خبری است که ماهی یک‌بار به‌روزرسانی می‌شود، پس باید یاد بگیریم که نیازی نیست هر ساعت به خزیدن بپردازیم.

و این نشانه کیفیت، یا نشانه رتبه بندی، یا هر چیز دیگری نیست. این واقعاً صرفاً از نقطه نظر فنی است که ما آموخته‌ایم که می‌توانیم یک بار در روز، یک بار در هفته این کار را انجام دهیم، و این اشکالی ندارد.”

گوگل این کار را برای ذخیره منابع خزیدن انجام می دهد. همانطور که قبلاً اشاره کردیم، خزیدن یک کار سخت است و می تواند منابع محاسباتی زیادی را روز به روز مصرف کند. این خیلی پایدار نیست، به خصوص که اینترنت همچنان در حال رشد است.

این منجر به نکته بعدی ما می شود.

آینده خزیدن وب در سال 2022 و پس از آن
در یکی از قسمت‌های اخیر پادکست Search Off the Records، تیم Google’s Search Relations اشاره کرد که ممکن است Google نرخ خزیدن وب را به منظور صرفه‌جویی در منابع محاسباتی و ارتقای پایداری کاهش دهد.

«محاسبات، به طور کلی، واقعاً پایدار نیست. ما از سال 2007، حتی نمی‌دانم، بدون کربن هستیم، اما این بدان معنا نیست که نمی‌توانیم حتی بیشتر از ردپای خود در محیط زیست بکاهیم. و خزیدن فعال است

گری ایلیز از گوگل می گوید که در همان اوایل می توانستیم میوه های کم آویزان را خرد کنیم.

او همچنین توضیح داد که چگونه گوگل ممکن است با کاهش نرخ خزیدن به‌روزرسانی به این هدف پایداری دست یابد.

“یک کاری که ما انجام می دهیم، و ممکن است نیازی به انجام آنچنان نداشته باشیم، refresh crawls است. به این معنی که وقتی یک سند، یک URL را کشف کردیم، سپس می رویم، آن را می خزیم، و سپس، در نهایت، می خواهیم به عقب برگردیم و آن URL را دوباره بررسی کنیم. این یک خزیدن تازه است.

و سپس هر بار که به آن یک URL برمی گردیم، همیشه یک خزیدن مجدد خواهد بود. اکنون، چند بار باید به آن URL برگردیم؟

کاهش نرخ خزیدن برای صاحبان وب سایت و سئوکاران چه معنایی دارد؟

کاهش نرخ خزیدن برای خزیدن به‌روزرسانی، احتمالاً فهرست‌سازی و به‌روزرسانی‌های رتبه‌بندی صفحات وب به‌روزرسانی‌شده را کاهش می‌دهد. با این حال، لزوماً به معنای رتبه‌بندی ضعیف‌تر در موتورهای جستجو نیست.

گری ایلیز در طول پادکست تایید کرد که “این یک تصور اشتباه است” که فکر کنید “اگر صفحه ای بیشتر خزیده شود، رتبه بیشتری کسب می کند.”

7 نکته در مورد چگونگی بهبود خزیدن در وب سایت خود
اکنون که می دانید خزیدن وب چیست و آینده خزیدن وب چیست، اجازه دهید به طور خلاصه به نکاتی که می توانید برای بهبود خزیدن در وب سایت خود استفاده کنید نگاهی بیندازیم.

محتوای خود را اغلب به روز کنید. اگر هفته‌ای یک پست منتشر می‌کنید — بدون به‌روزرسانی محتوای دیگر در وب‌سایت خود، Google الگو را تشخیص می‌دهد و خزیدن به‌روزرسانی را برای وب‌سایت شما کاهش می‌دهد، همانطور که قبلاً یاد گرفتیم.
با ارسال URL برای فهرست مجدد در کنسول جستجوی گوگل، پس از به روز رسانی وب سایت خود، گوگل را به روز کنید.
از وب سایت هایی که به طور منظم خزیده می شوند و همچنین صفحات وب که به طور منظم در سایت خود خزیده می شوند، پیوندهای مرتبط بیشتری ایجاد کنید.
برای بهبود سرعت بارگذاری وب سایت خود زمان و تلاش خود را صرف کنید. اگر یک وب سایت برای بارگذاری خیلی کند باشد، خزنده های وب سایت ممکن است سایت شما را رها کنند.
برای کمک به Google در خزیدن وب، نقشه سایت اضافه کنید و آن را به روز نگه دارید. نقشه سایت وب سایت خود را در اینجا بررسی کنید.
تعداد صفحات یتیم در وب سایت خود را کاهش دهید. صفحات یتیم به آن دسته از صفحاتی گفته می شود که هیچ لینکی به آنها اشاره نمی کند.
زنجیره های تغییر مسیر را کاهش دهید
امیدواریم این راهنمای مبتدی برای خزیدن وب برای شما مفید بوده باشد. اگر سوال یا نظری دارید، در قسمت نظرات زیر با ما در میان بگذارید.

دیدگاه‌ خود را بنویسید