ابزار تشخیص محتوای کپی و تاثیر محتوای کپی در سایت
کپی کردن مطالب سایت یکی از دغدغه های اصلی مدیران سایت ها در ایران است. متاسفانه عده زیادی نیز هستند که مطالب سایت من را کپی میکنند و به اسم خودشان منتشر میکنند و این موضوع یکی از دغدغه های اصلی من شده است، اخیرا با یک سایت مدعی در زمینه سئو آشنا شدم که اقدام به چنین کاری میکند و نصف مقالات این سایت عینا کپی شده از مطالب سایت من هست. مبارزه با سایت های کپی کار یکی از روش های بهبود وضعیت سئو سایت است که در این مقاله به نکات مختلف مرتبط با کپی شدن مطالب سایت و ابزارهای تشخیص کپی بودن متن و معرفی یک روش مبتکرانه برای مبارزه با سایت های کپی کار می پردازم.
پیشنهاد ویژه :آموزش رایگان طراحی سایت صفر تا صد
نحوه برخورد گوگل با محتوای کپی
نحوه عملکرد گوگل با محتوای کپی با آنچه بسیاری از افراد تصور می کنند متفاوت است. از طرف گوگل علاقه ای ندارد که محتوای تکراری در بانک اطلاعاتی خود نگهداری کند و به دنبال نمایش سایت های با کیفیت در نتایج است. از سوی دیگر، تشخیص اینکه کدام سایت برای اولین بار یک مطلب را نوشته است کار ساده ای نیست. بنابراین در بسیاری از مواقع گوگل سایتی که اعتبار بالاتری را دارد به عنوان مرجع اصلی محتوا در نظر می گیرد. در چنین حالتی سایتی که ضعیف تر است لطمه می بیند و جریمه می شود حتی اگر تولید کننده اصلی محتوا همان سایت باشد! در ادامه در مورد عملکرد گوگل و دیدگاه گوگل به محتوای کپی توضیح می دهم.
من فکرمیکنم برای اینکه بتوانیم در مورد نکات مختلف سئو از جمله بحث کپی کردن محتوا قضاوت و درک درستی داشته باشیم، اول باید به مستندات گوگل مراجعه کنیم و در مرحله بعد به چرایی موضوع و فلسفه گوگل فکرکنیم و نهایتا به نتایج و مثالهای واقعی و آزمایشهای گوگل مراجعه کنیم.
بارها افراد مختلف از من پرسیدند که ما محتوای باکیفیت منتشر میکنیم و رتبه اول گوگل هستیم، اما رقیب محتوای ما را کپی میکند و جای ما را میگیرد چرا؟! برای پاسخ دادن به این سوال و سوالات مشابه بهتر است موارد زیر را بررسی کنیم:
چرا گوگل میانهای با محتوای کپی ندارد؟
چون تمایل ندارد به کاربران نتایج تکراری و یکسان نمایش دهد. بنابراین بخش MC صفحات نباید یکسان باشد و اگر باشد فقط یکی از مطالب را نمایش میدهد.
آیا گوگل سایتهای کپی کننده را جریمه میکند؟
خیر! در بسیاری از موارد ممکن است محتوای یکسان (مانند خبر) در سایتهای مختلف کپی شود، یا دلیل کپی شدن محتوا کیفیت بالای آن باشد و لزوما محتوای کپی شده اسپم نیست.
آیا گوگل به تاریخ نقشه سایت، اسکیما، تاریخ ایندکس و… اهمیت میدهد؟
خیر، زیرا تاریخ نقشه سایت، اسکیما و… را میتوان تغییر داد. از سوی دیگر تاریخ ایندکس شدن در گوگل دلیل مناسبی برای اینکه یک سایت نویسنده اصلی مطلب باشد، نیست.
ممکن است من محتوای کتاب چاپی را در سایت خودممنتشر کنم، چند سال بعد نویسنده اصلی ان را در وبلاگش منتشر کند. ممکن است من مطلب را از سایتی کپی کنم که نرخ خزش پایینی دارد و گوگل اولین بار محتوا را در سایت من ببیند.
ممکن است من یک مقاله را ۱۰ سال پیش منتشر کرده باشم، اما امروز ان را ویرایش کنم و محتوای کپی سایت دیگری را در ان قرار بدم. آیا چون تاریخ ایندکس صفحه من قدیمیتر است من باید نویسنده اصلی شوم؟ آیا گوگل برای تشخیص این موضوع باید تاریخچه تغییرات همه صفحات وب را نگهداری کند و بخشهای مختلف آنها را با هم مقایسه کند و بررسی کند که کدامیک قدیمیتر است؟
رفتار گوگل چگونه است؟ چگونه محتوای اصلی را پیدا می کند؟
گوگل تمایلی به نمایش محتوای یکسان در نتایج ندارد، بنابراین بهترین نسخه محتوا را در نتایج نمایش میدهد. در واقع محتوایی را نمایش میدهد که در سایتی با بالاترین اعتبار منتشر شده و سایتی که معتبرتر است را به عنوان مطلب اصلی در نظر میگیرد.
راهکار مبارزه با سایتهای کپی کار چیست؟
استفاده از DMCA و شکایت به گوگل اولین راهکار است. گرچه این کار ممکن است انرژی زیادی از شما برای اثبات تولیدکننده اصلی اثر بگیرد اما راهکار قانونی مبارزه با کپی کنندگان محتوا است. همچنین شما میتوانید به صورت غیر مستقیم از طریق ایجاد لینکهای داخلی کیفیت محتوای خود را بهبود دهید و ردپای خود را در محتوا قرار دهید تا کپی کنندگان محتوا ردپای شما را با خود منتقل و پخش کنند. همچنین افزایش اعتبار و کیفیت مطالب سایت می تواند به مرور به گوگل اثبات کند که سایت معتبری دارید و شما را مولف اصلی اثر در نظر بگیرد.
گوگل به چه نوع محتوایی اهمیت بیشتری میدهد؟
محتوای یکتا، جامع و باهویت مشخص که بتواند برای کاربری که یک عبارت را جستجو کرده ارزش ایجاد کند و به نیاز او پاسخ دهد. در واقع حتی اگر بخشی از یک محتوای جامع کپی شده باشد، به این معنا نیست که گوگل آن مطلب را جریمه میکند. بنابراین اگر می خواهید از یک مطلب معتبر نقل قول کنید، یا مطلبی را جمع آوری میکنید نگران نباشید.
مشکل حجم اطلاعات در گوگل و سایر موتورهای جستجو
حجم اطلاعات موجود در اینترنت بسیار بالاست و هزینه بسیار هنگفتی برای نگهداری و ایندکس کردن اطلاعات موجود در وب توسط گوگل، یاهو، بینگ و … پرداخت می شود. یکی از دلایل پیشرو بودن گوگل در بازار موتورهای جستجو بانک اطلاعات بسیار غنی است که دارد، داشتن چنین بانک اطلاعاتی از محتوای سایت های اینترنتی به هیچ عنوان کار ساده ای نیست و بیش از اینکه امکانات نرم افزاری خاصی را طلب کند به امکانات سخت افزاری نیاز دارد.
راهکار مناسب برای کاهش حجم اطلاعات ایندکس شده در موتورهای جستجو ایندکس نکردن محتوای تکراری، بی ارزش و کم اهمیت است. همین موضوع باعث شد که موتور جستجوی یاهو در سال ۲۰۱۱ مقدار بسیار زیادی از محتوای ایندکس شده در دیتابیس خود را حذف کند. گوگل نیز از همین سیاست پیروی می کند و نه تنها محتوای کپی شده را ایندکس نمی کند بلکه این موضوع برای سئو سایت مورد نظر بسیار بد خواهد بود و نمره منفی خواهد گرفت.
آیا می توان جلوی کپی شدن محتوا را گرفت؟
واقعیت این است که راه حلی برای این موضوع وجود ندارد. البته می توان به گوگل اعلام کرد که محتوا توسط ما منتشر شده و اگر محتوای فوق اول در سایت ما ایندکس شود دیگران هستند که نمره منفی میگیرند. ابزاری هم برای معرفی سایت های خلافکار در این زمینه وجود دارد که از طریق آن می توانید به گوگل اعلام کنید که محتوای شما کپی شده است.
همانطور که توضیح دادم، اگر سایتی که اعتبار بالاتری نسبت به سایت شما دارد مطالب شما را کپی کند، این شما هستید که جریمه می شوید! بنابراین از یک طرف باید به دنبال افزایش اعتبار سایت خود در گوگل باشید و از طرف دیگر باید در برابر کپی شدن محتوای خود عکس العمل نشان دهید.
چگونه با سایت های کپی کار مقابله کنیم؟!
روش هایی برای تشخیص سایت های کپی کار و مقابله با آنها وجود دارد. برخی از روشهایی که برای جلوگیری از کپی کردن مطالب سایت توسط دیگران وجود دارند عبارتند از:
- گزارش سایت های کپی کار از طریق DMCA : گوگل از طریق ابزار DMCA که مطابق قانون کپی رایت امریکا عمل می کند، سایت های کپی کار را از نتایج حذف می کند. برای استفاده از این ابزار می توانید عبارت DMCA را در گوگل جستجو کرده و سپس به گوگل گزارش دهید که چه سایتی مطالب شما را کپی کرده است. گوگل نیز پس از بررسی آن سایت از نتایج حذف می کند و البته این امکان برای مدیر سایت متخلف وجود دارد که از خود دفاع کند. با این وجود قوانین کپی رایت بسیار سخت گیرانه هستند.
- پیگیری خارج از اینترنت: شما از طریق دستگاه قضایی و پلیس فتا می توانید پیگیر موضوع باشید و مطابق قوانین تجارت الکترونیک و حقوق مولفین کپی کردن محتوا جرم محسوب می شود و قابل پیگیری است.
- استفاده از ابزارهایی که جلوگیری از کپی شدن محتوا میکنند: یکی از معروفترین کارها جلوگیری از right click کاربر روی سایت یا انتخاب متن از طریق جاوا اسکریپت و یا فشرده سازی کدهای صفحه است. اینگونه ابزارها گرچه مفید هستند اما کاربران عادی را نیز آزار می دهند و راهکار جالبی بنظر نمی رسند.
- هویت سازی: ایجاد هویت در داخل متن و استفاده از المان های گرافیکی که هویت شما را به مخاطب نشان می دهد، می تواند یکی دیگر از راهکارها باشد. با این روش افرادی که محتوای شما را در سایر سایت ها مشاهده می کنند، متوجه کپی بودن محتوا می شوند. گرچه فرد متخلف با صرف وقت بیشتر می تواند هویت شما را از مطلب حذف کند اما اینکار برای او زحمت زیادی خواهد داشت.
- استفاده از لینک های داخلی: قراردادن لینک های داخلی در مطالب باعث میشود که لینک های سایت شما نیز همراه با مطلب کپی شود و ردپاری شما در درون محتوا باقی بماند.
- یک روش مبتکرانه: در ادامه یک روش مبتکرانه برای جلوگیری از کپی شدن محتوا را شرح خواهم داد!
روش مبتکرانه مقابله با سایت های کپی کننده محتوا و مطالب سایت
همانطور که می دانید، متاسفانه در حال حاضر تعداد سایت هایی که از طریق خواندن RSS مطالب سایت های مختلف را کپی می کنند بسیار زیاد شده است و این موضوع می تواند لطمه شدیدی به سئو سایت مورد نظر وارد کند. راه حل اساسی در چنین مواقعی می تواند افزایش نرخ ایندکس کردن گوگل از طریق ابزار مدیران گوگل باشد، اما دستکاری تنظیمات اولیه گوگل همواره خوب نیست و پیشنهاد نمی شود. بنابراین هر روشی که بتواند سرعت ایندکس شدن مطالب سایت شما را بالا ببرد می تواند راه حل مناسبی باشد، به عنوان مثال افزایش سرعت لود شدن صفحات سایت که به عواملی مثل مکان سرور، سرعت هاست، نحوه برنامه نویسی و… بستگی دارد.
گرچه افزایش سرعت ایندکس کردن به خودی خود راه حل مناسبی است، اما عملا راه کار مناسبی برای حل این مشکل نیست به این دلیل که ممکن است سایت های کپی کار نیز سرعت ایندکس خود را افزایش دهند و عملا شما درگیر رقابتی بین گوگل و سایت کپی کار خواهید شد که برنده شدن شما در این میان به سادگی اتفاق نمی افتد.
راه کار ابتکاری و بسیار جالب برای حل این مشکل، شامل دو مرحله می شود:
مرحله اول: سعی کنید سرعت ایندکس سایت خودتان را تا جای ممکن بالا ببرید.
مرحله دوم: در مرحله بعدی با توجه به این نکته که تمام سایت های کپی کار با استفاده از خروجی RSS متوجه درج مطالب جدید در سایت شما می شوند می توان در خروجی RSS سایت تاخیر ایجاد کرد، تاخیر فوق باعث خواهد شد که گوگل قبل از سایت های کپی کار مطالب شما را ایندکس کند و نهایتا شما برنده این مبارزه باشید.
ابزار تشخیص محتوای کپی شده
در این بخش ابزارهای مفید در زمینه شناسایی محتوای کپی، کیفیت محتوای داخلی سایت و بررسی متن های کپی شده را به شما معرفی میکنم. این ابزارها بر اساس تجربه شخصی من (رضا شیرازی مفرد) بدست آمده اند و ممکن است ابزارهای دیگری نیز در این زمینه باشند که اگر آنها را میشناسید خوشحال میشوم که آنها را به کاربران سایت معرفی نمایید.
استفاده از سایت Siteliner
بسیاری از مواقع مشکلات داخلی سایت باعث افت سئو سایت خواهد شد. مثلا وجود لینکهای خراب، محتوای یکسان با آدرس های متفاوت و… که در سایت ما وجود دارند. برای بدست آوردن چنین مشکلاتی می توانید از ابزار گوگل وبمستر تولز استفاده کنید. یک سایت بسیار مفید نیز در این زمینه وجود دارد که محتوای تکراری، نامناسب، لینک های خراب و پیج رنک صفحات داخلی شما را نمایش می دهد و از طریق آن می توانید مشکلات سایت خود را حل کنید.
استفاده از این سایت می تواند کمک بسیار زیادی به بهبود وضعیت سئو سایت شما بکند. زیرا علاوه بر اینکه محتوای تکراری، محتوای کپی شده و بی کیفیت را شناسایی میکند، لینکهای 404 و شکسته روی سایت را نیز تشخیص می دهد.
ابزار Copyscape برای بدست آوردن محتوای تکراری
بسیاری از مواقع ممکن است محتوای سایت شما از سایت دیگری کپی شده باشد (یا برعکس) و شما از این موضوع بی اطلاع باشید و همین موضوع نمره منفی برای سئو سایت شما باشد. وب سایت copyscape.com به شما کمک می کند تا این محتوای تکراری را تشخیص بدهید. دقت وب سایت فوق مناسب است اما ممکن است نتواند همه محتوای کپی شده را تشخیص دهد.
با بررسی اطلاعات این سایت می توانید محتوای نامناسب سایت خود را تشخیص داده وآنها را بهبود بدهید. این سایت بخشی هم برای حفاظت از سایت شما را دارد که من فکرمیکنم صرفا جنبه اطلاع رسانی دارد و استفاده از آن مزیت بیشتری به سایت شما نمی دهد.
وب سایت Duplichecker
وب سایت duplichecker.com ابزاری برای شناسایی متون کپی است. برخی از شرکتها برای تولید محتوا از نیروهای دورکار یا فریلنسرها می خواهند که برایشان کار تولید محتوا انجام دهند. متاسفانه در برخی از مواقع پیش می آید که محتوای تحویل داده شده به کارفرما کپی از سایت های دیگر بوده و مشکلاتی را بوجود می آورد. حتی بعضا ممکن است مشکل حقوقی برای کارفرما بوجود بیاید در حالی که کارفرما هزینه محتوا را به شخصی داده است که محتوا را از شرکت دیگری کپی کرده است. ابزارهایی برای تشخیص متن کپی وجود دارند که به آنها Plagiarism Checker میگویند. ابزارهای Plagiarism Checker به این صورت عمل می کنند که متن شما را دریافت کرده و محتوایی که متن شما از روی آن کپی شده را به شما نشان می دهند. وب سایت فوق یکی از سایت های خوب در این زمینه است.
چگونه محتوای دیگران را کپی کنیم که از طرف گوگل جریمه نشویم؟
کپی کردن محتوای دیگران بدون رعایت حقوق مادی و معنوی آنها کاری غیراخلاقی و خلاف است. انجام این کار ارزش افزوده ای برای شما به همراه ندارد و بهتر است به دنبال ایجاد محتوای باکیفیت و دارای هویت برای سایت خود باشید. برخی از سایتها هیچگونه علاقه ای ندارند که شما محتوای آنها را کپی کنید، با این حال، در صورتی که سایت مبدا در قوانین خود، ذکر کرده باشد که می توانید با ارائه لینک منبع مطالب را کپی کنید، همچنین اگر مطالب را جمع آوری میکنید بهتر است این کار با هدف ایجاد محتوایی ارزشمندتر و جامع نسبت به سایر محتواهای موجود در اینترنت باشد و مهمترین نکته این است که بتوانید برای مخاطب خود ارزش ایجاد کنید. بنابراین بهتر است تمرکز خود را به هیچ وجه بر روی کپی کردن محتوا از سایت های دیگر نگذارید و به دنبال دستیابی به نتیجه سریع بدون زحمت نباشید.
من در این مقاله سعی کردم شما را با مفهوم محتوای کپی در سئو آشنا کنم و دیدگاه گوگل در مورد این موضوع را تشریح کنم، همچنین دو ابزار مختلف برای تشخیص محتوای کپی شده معرفی کردم و به سوالات مربوط به این حوزه پاسخ دادم. در صورتی که سوالی دارید که در این مطلب به آن پرداخته نشده، در بخش نظرات بنویسید تا آن را پاسخ بدم.
این را هم بخوانید :
دیدگاهتان را بنویسید