Hoe Voorkom Je Het Indexeren Van Een Pagina

Inhoudsopgave:

Hoe Voorkom Je Het Indexeren Van Een Pagina
Hoe Voorkom Je Het Indexeren Van Een Pagina

Video: Hoe Voorkom Je Het Indexeren Van Een Pagina

Video: Hoe Voorkom Je Het Indexeren Van Een Pagina
Video: Google Indexing Issues Deep Dive - Crawled / Discovered - Currently Not Indexed 2024, Maart
Anonim

De pagina's van elke site worden regelmatig gecrawld door zoekrobots, die de informatie op de site verwerken zodat deze beschikbaar is op verzoek van gebruikers in zoekmachines. Bezoeken van bezoekers van zoekmachines hebben een positief effect op het siteverkeer en stimuleren de ontwikkeling van het middel. Maar als er pagina's op de site zijn waarvan de informatie niet bedoeld is voor het internetpubliek (bijvoorbeeld de persoonlijke pagina's van gebruikers of de registratiepagina), dan is de overgang van zoekmachines naar dergelijke pagina's niet nodig en is het is het beter om te voorkomen dat deze informatie indexeert.

Hoe voorkom je het indexeren van een pagina
Hoe voorkom je het indexeren van een pagina

Noodzakelijk

  • - heb je eigen website
  • - om de links naar de pagina's te kennen, waarvan de indexering verboden zou moeten zijn.
  • - minimaal basiskennis van HTML hebben

instructies:

Stap 1

Om te voorkomen dat de zoekrobot bepaalde pagina's van de site indexeert, moet u wijzigingen aanbrengen in het robots.txt-bestand, als het al op uw site staat, of dit bestand aanmaken.

Stap 2

Als het robots.txt-bestand al naar de site is geüpload en het mogelijk is om dit bestand rechtstreeks vanuit het bronconfiguratiescherm te bewerken, open dan robots.txt via de webservice om het te bewerken.

Stap 3

Als er geen manier is om rechtstreeks vanuit het configuratiescherm wijzigingen aan het gewenste bestand aan te brengen, open dan robots.txt in een browser door op de link naar dit bestand te klikken. Kopieer alle gegevens van de pagina die wordt geopend en plak deze op het blad in Kladblok.

Stap 4

Als er geen robots.txt op de site staat, opent u het programma "Kladblok", in het nieuwe document waarvan u de benodigde code moet invoeren.

Stap 5

Schrijf op een blanco vel tekstdocument de eerste vereiste regel:

User-agent: *

Stap 6

Ga dan naar de volgende regel door op de Enter-toets te drukken en typ de volgende code:

Disallow: / index / page3Disallow: geeft aan dat er niet geïndexeerd wordt, en / index / page3 is een link naar een pagina die niet geïndexeerd hoeft te worden. Plaats in plaats van de link / index / pagina3 een link naar de pagina van uw site die u wilt blokkeren voor verwerking door robots.

Stap 7

Merk op dat de domeinnaam zelf aan het begin van de link ontbreekt; zijn aanwezigheid in het item impliceert de schuine streep. Bij het crawlen van een site voegt een zoekrobot automatisch een domeinnaam in dergelijke links in. Schrijf daarom op deze manier links naar de benodigde pagina's.

Stap 8

Na Disallow: u kunt niet alleen een link naar een specifieke pagina plaatsen, maar ook een link naar een sectie of directory van de site. Op dezelfde manier kunt u het indexeren van het gewenste deel van de site verbieden.

Stap 9

Als het nodig is om de verwerking door robots van verschillende secties van de bron te verbieden, schrijf dan een link naar elke sectie of pagina op een nieuwe regel, vergeet aan het begin niet om het item Disallow: te plaatsen.

Stap 10

Om het wijzigen van robots.txt te voltooien, klikt u op de knop "Opslaan" terwijl u het bestand in het configuratiescherm bewerkt, of slaat u een tekstdocument op met vermeldingen onder de naam robots.txt en uploadt u dit bestand naar de site.

Aanbevolen: