Blocarea indexării în căutare cu noindex
noindex este o regulă setată fie printr-un tag <meta>, fie printr-un header de răspuns HTTP și este utilizată pentru a preveni indexarea conținutului de către motoarele de căutare care suportă regula noindex, cum ar fi Google. Când Googlebot accesează acea pagină și extrage tagul sau headerul, Google va elimina complet acea pagină din rezultatele Căutării Google, indiferent dacă alte site-uri fac legătura către ea.
Utilizarea noindex este utilă dacă nu aveți acces root la serverul dvs., deoarece vă permite să controlați accesul la site-ul dvs. pe baza fiecărei pagini.
Implementarea noindex
Există două modalități de a implementa noindex: ca un tag <meta> și ca un header de răspuns HTTP. Ambele au același efect; alegeți metoda care este mai convenabilă pentru site-ul dvs. și potrivită pentru tipul de conținut. Specificarea regulii noindex în fișierul robots.txt nu este suportată de Google.
Puteți combina, de asemenea, regula noindex cu alte reguli care controlează indexarea. De exemplu, puteți combina un indiciu nofollow cu o regulă noindex: <meta name="robots" content="noindex, nofollow" />.
<meta> tag
Pentru a preveni toate motoarele de căutare care suportă regula noindex să indexeze o pagină de pe site-ul dvs., plasați următorul tag <meta> în secțiunea <head> a paginii dvs.:
<meta name="robots" content="noindex">
Pentru a preveni doar crawlerii web Google să indexeze o pagină:
<meta name="googlebot" content="noindex">
Fiți conștienți că unele motoare de căutare ar putea interpreta regula noindex diferit. Ca rezultat, este posibil ca pagina dvs. să apară în continuare în rezultatele altor motoare de căutare.
Citiți mai multe despre tagul noindex <meta>.
Header de răspuns HTTP
În loc de un tag <meta>, puteți returna un header HTTP X-Robots-Tag cu o valoare de noindex sau none în răspunsul dvs. Un header de răspuns poate fi utilizat pentru resurse non-, cum ar fi fișiere PDF, fișiere video și fișiere imagine. Iată un exemplu de răspuns HTTP cu un header X-Robots-Tag care instruiește motoarele de căutare să nu indexeze o pagină:
HTTP/1.1 200 OK (...) X-Robots-Tag: noindex (...)
Citiți mai multe despre headerul de răspuns noindex.
Depanarea problemelor noindex
Trebuie să accesăm pagina dvs. pentru a vedea tagurile <meta> și headerele HTTP. Dacă o pagină apare în continuare în rezultate, probabil că nu am accesat pagina de când ați adăugat regula noindex. În funcție de importanța paginii pe internet, poate dura luni pentru ca Googlebot să reviziteze o pagină. Puteți solicita ca Google să recrawleze o pagină folosind instrumentul de inspectare a URL-urilor.
Dacă trebuie să eliminați rapid o pagină de pe site-ul dvs. din rezultatele căutării Google, consultați documentația despre eliminări.
Un alt motiv ar putea fi că fișierul robots.txt blochează URL-ul de la crawlerii web Google, astfel încât aceștia nu pot vedea tagul. Pentru a debloca pagina dvs. de la Google, trebuie să editați fișierul robots.txt.
În cele din urmă, asigurați-vă că regula noindex este vizibilă pentru Googlebot. Pentru a testa dacă implementarea dvs. noindex este corectă, utilizați instrumentul de inspectare a URL-urilor pentru a vedea -ul pe care Googlebot l-a primit în timp ce accesa pagina. De asemenea, puteți utiliza raportul de indexare a paginilor din Search Console pentru a monitoriza paginile de pe site-ul dvs. din care Googlebot a extras o regulă noindex.
Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.
