موتورهای جستجو چگونه کار می کنند؟
موتور جستجو چیست؟
موتورهای جستجو ماشین ها یا ابزارهای پاسخگویی هستند. وظیفه آن ها کشف، درک و سازماندهی محتواهای موجود در اینترنت است. موتورهای جستجو طی فرآیندهایی خاص و با بررسی فاکتور های بسیاری ارزیابی می کنند که کدام یک از محتواهای موجود در اینترنت، بهترین پاسخ ها را برای پرسش های کاربران دارند. موتور های جستجوگر می خواهند بهترین نتیجه ها را برای ارائه اطلاعات موردنظر به کاربران اینترنت ارائه دهند.
کاربران اینترنت که گستره ای جهانی دارند، سوالات خود را از موتورهای جستجوگر می پرسند تا موتور های جستجو آن ها را به سایت ها و صفحاتی که به آن نیاز دارند برسانند. ناگفته پیداست که موتور های جستجو از اهمیت زیادی برخوردار هستند. انسان ها در سراسر جهان برای رسیدن به جواب سوالات خود از آن ها استفاده می کنند و برای بدست آوردن هرگونه اطلاعاتی از این طریق اقدام می کنند.
تاکنون موتورهای جستجو زیادی ساخته شده اند اما هیچ یک از آن ها به اندازه گوگل محبوبیت ندارند. 90 درصد جستجوهایی که در اینترنت صورت می گیرد از طریق گوگل انجام می شود. بعد از گوگل ، bing و yahoo مورد استفاده بیشتری بوده اند اما گوگل بزرگترین سهم را در این بازار دارد.
موتورهای جستجو چگونه کار می کنند؟
موتور های جستجو سه بخش اصلی دارند:
Crawl(خزیدن): برای پیدا کردن محتوا در اینترنت می گردند، و هر لینک، URL و کدی که برسند آن را بررسی می کنند.
Index(فهرست کردن): در این قسمت موتورهای جستجو هر محتوایی را که در پروسه crawling پیدا کرده اند را ذخیره و سازماندهی می کنند. هر صفحه ای که ایندکس می شود اماده ی نمایش به عنوان سوالات مربوطه کاربران در موتورهای جستجو است.
Rank: قسمت هایی از محتوا فراهم می شود که بهترین پاسخ به سوالات جستجو کننده است. به زبان ساده تر نتایج جستجو را به نحوی مرتب می سازد که جواب بهتری برای جستجو کننده نمایش داده شود.
کراولینگ موتورهای جستجو چیست؟
کراولینگ پروسه کشفی است که موتورهای جستجو انجام می دهند. موتورهای جستجو تیمی از ربات ها که به عنوان کراولرها(crawlers) و عنکبوت ها(spiders) شناخته می شوند را برای کشف و اپدیت محتوا می فرستد. محتوا در اینترنت از همدیگر متفاوت هستند. یک محتوا می تواند صفحه ی وب، عکس، ویدیو، PDF و غیره باشند. اما در کل محتوا صرف نظر از فرمت آن ها با لینک پیدا می شوند.
ربات ها شروع می کنند که چند صفحه وب را بررسی کنند، سپس به دنبال لینک های موجود در آن صفحه می روند تا اینکه URLهای جدید را پیدا می کنند. این پروسه به همین نحو ادامه پیدا می کند و محتوای کراولر ها می توانند هر لحظه محتوای جدیدی را کشف کنند و آن را یه ایندکس خود اضافه می کنند. حال پایگاه داده ای بسیار عظیم از URL ها کشف و ذخیره شده است و بعدا زمانی که یک جستجو کننده به دنبال اطلاعاتی می گردد، موتورهای جستجو گر بتوانند محتوای موجود بر روی URL را برای کاربر بازیابی کنند.
ایندکس موتورهای جستجو چیست؟
موتور های جستجو سعی می کنند که اطلاعات فوق العاده زیادی را که در مرحله ی پیش به کشف کرده اند را دسته بندی و ذخیره کنند و محتوای را که به اندازه ی کافی مناسب هستند را برای کاربران عرضه می کنند.
رنکینگ موتور جستجو
وقتی یک نفر جستجویی را انجام می دهد، موتور جستجو صفحه ی اول خود را برای مرتبط ترین محتوا اماده می کند سپس این صفحه را بر اساس مرتبط ترین محتوا مرتب می کند به امید اینکه بتواند در پرسش کاربر را به درستی جواب بدهد. این مرتب سازی نتایج جستجو بر اساس مرتبط ترین محتوا را رنکینگ می گویند. در کل می توان فهمید هر سایتی که بالاتر قرار گرفته است موتور جستجو فکر می کند بهترین جواب برای جستجوی شما است.
امکان این وجود دارد که شما ربات و کراولرهای موتور جستجو را بلاک کنید که به بخش یا کل سایت شما دسترسی نداشته باشند و نتوانند آن قسمت ها را ایندکس کنند. تا زمانی که شما بخواهید موتور های جستجو از سایت شما دور باشند مشکلی نیست و موتور های جستجو نمی توانند محتوای شما را ایندکس کنند و لی در غیر این صورت شما باید مطمئن باشید که سایت شما به جستجو گر ها اجازه ی ورود می دهد.
آیا واقعا نیاز است که وب سایت را در موتورهای جست وجو ثبت کنیم؟
گوگل و سایر موتورهای جستجو بر اساس ورود اطلاعات دستی ساخته نشده اند و آن ها به وسیله خزنده ها و ربات ها اقدام به مشاهده تمام صفحات وب می کنند.
اگر با مفهوم خزیدن و خزنده آشنا نیستید: خزیدن در وب به این مفهوم است که موتورهای جست وجو لینک های جدید را جست وجو می کنند و آن ها را دنبال می کنند. اگر یک لینک تازه کشف شده منجر به محتوای مفیدی شود آن صفحه ایندکس خواهد شد
همچنین گوگل به داده های دیگری نیز توجه می کند مثل آمار استفاده از مرورگر کروم و اطلاعات ثبت دامنه برای کمک به مشاهده بی قفه وب سایت های جدید. در نهایت باید گفت موتورهای جستجو در پیدا کردن سایت ها و صفحات جدید به شرطی که از جایی لینک شده باشند نسبتا خوب عمل می کنند.
پس چرا باید وب سایت را در موتورهای جستجو ثبت کرد؟
در ادامه به برسی چند دلیل برای ثبت دستی سایت در موتورهای جستجو می پردازیم:
بهتر است که مطمئن عمل کنیم تا در آینده متاسف نشویم: موتورهای جست وجو احتمالا قادر خواهند بود که وب سایت شما را پیدا کنند صرف نظر از اینکه شما به صورت دستی وب سایت خود را به آن ها معرفی کرده باشید یا خیر. اما آیا “احتمالا” برای شما کافی است؟ منظور من این است که بعد از اتمام فرایند طراحی وب سایت ، ثبت وب سایت در موتورهای جستجو نهایتا 1 یا 2 دقیقه از شما وقت بگیرد. پس آیا منطقی است که ریسک کنیم؟
موتورهای جستجو نمی توانند همه چیز را به واسطه خزیدن کشف کنند: اگر شما به وسیله روش هایی که در ادامه آن ها را توضیح می دهیم وب سایت خود را ثبت کنید، این فرصت را دارید که علاوه بر ثبت سایت اطلاعات ارزشمند دیگری درباره سایت را به موتورهای جست وجو ارائه کنید. به عنوان مثال شما می توانید بگویید که کدام صفحات برای شما اهمیت بیشتری دارند که این اطلاعات را خزینده به صورت اتوماتیک نمی تواند به دست آورد
کمک می کند تا وب سایت شما پیشرفت کند: وقتی وب سایت را معرفی می کنید گوگل و بینگ پیشنهادهای جهت بهبود سایت به شما میدهند که از ابزار های مختلفی جهت تست سایت استفاده می کنند و در صورتی که وب سایت شما خطایی داشته باشد به شما هشدار می دهند.
دیدگاهتان را بنویسید