Kako izključiti vsebino WordPressa iz iskanja Google

Kako izključiti vsebino in datoteke WordPress iz Googlovega iskanja

Včasih morate določeno vsebino ali datoteke WordPress izključiti iz indeksiranja v Googlovih rezultatih iskanja. Kazalo ali indeksiranje pred pojavom Googla in drugih iskalnikov je bila beseda, večinoma povezana s knjigami. Običajno je na zadnji strani večine knjig, zato jo Cambridgeov slovar v tem kontekstu definira kot:


Kazalo: abecedni seznam, kot je ena, natisnjena na zadnji strani knjige, ki prikazuje, na kateri strani je predmet, ime itd.

Hitro naprej do leta 1995, med razcvetom interneta imamo storitve, kot je Yahoo iskalnik, in leta 1997 je Google iskanje močno spremenilo način iskanja in dostopa do informacij po internetu.

Glede na raziskavo, ki je bila narejena januarja 2018, je na internetu 1.805.260.010 (več kot 1,8 milijarde) spletnih mest in veliko teh spletnih mest sploh ne dobi obiskovalcev..

Kaj je Google indeksiranje?

Obstajajo različni iskalniki z drugačno obliko indeksiranja, vendar priljubljeni iskalniki vključujejo Google, Bing in za zasebnike, ki so naklonjeni zasebnosti, duckduckgo.

Googlovo indeksiranje se na splošno nanaša na postopek dodajanja novih spletnih strani, vključno z digitalno vsebino, kot so dokumenti, videoposnetki in slike, ter njihovo shranjevanje v svoji bazi podatkov. Z drugimi besedami, da se vsebina vašega spletnega mesta prikaže v Googlovih rezultatih iskanja, jih je treba najprej shraniti v Googlov indeks.

Kaj je Google indeksiranje?

Google lahko indeksira vse te digitalne strani in vsebino s pomočjo pajkov, pajkov ali botov, ki večkrat brskajo po različnih spletnih mestih v internetu. Ti boti in pajki upoštevajo navodila lastnikov spletnega mesta o tem, kaj naj se plazi in kaj je treba med pajkanjem prezreti..

Zakaj je treba spletne strani indeksirati?

V tej dobi digitalne dobe je skoraj nemogoče krmariti po milijardnih spletnih mestih, ki najdejo določeno temo in vsebino. Veliko lažje bo, če obstaja orodje, ki nam pokaže, katera spletna mesta so zaupanja vredna, katera vsebina je za nas uporabna in pomembna. Zato Google obstaja in v rezultate iskanja uvršča spletna mesta.

Indeksiranje postane nepogrešljiv del delovanja iskalnikov na splošno in zlasti Googla. Pomaga prepoznati besede in izraze, ki najbolje opisujejo stran, in na splošno prispeva k razvrstitvi strani in spletnih strani. Če se želite prikazati na prvi strani Googlovega spletnega mesta, vključno s spletnimi stranmi in digitalnimi datotekami, kot so videoposnetki, slike in dokumenti, je treba najprej indeksirati.

Indeksiranje je predpogoj za to, da se spletna mesta dobro uvrstijo na iskalnike na splošno in zlasti na Google. S ključnimi besedami se spletna mesta lahko bolje vidijo in odkrijejo, potem ko jih iskalniki in indeksirajo. To odpira vrata za več obiskovalcev, naročnike in potencialne stranke za vaše spletno mesto in podjetje.

Najboljše mesto za skrivanje trupla je druga Googlova stran.

Čeprav veliko strani indeksiranih strani ne pomeni, da se vaša mesta samodejno uvrstijo višje, če je vsebina teh strani tudi kakovostna, lahko izboljšate tudi SEO.

Zakaj in kako blokirati iskalnik pri indeksiranju vsebine

Čeprav je indeksiranje odlično za lastnike spletnih strani in podjetij, obstajajo strani, ki jih morda ne želite prikazati v rezultatih iskanja. lahko tudi izpostavite občutljive datoteke in vsebine prek interneta. Brez gesla ali preverjanja pristnosti zasebna vsebina obstaja nevarnost izpostavljenosti in nepooblaščenega dostopa, če boti brezplačno znova zavijte v mape in datoteke vašega spletnega mesta..

V začetku 2000-ih hekerji Google iskanje uporablja podatke za kreditno kartico s spletnih mest s preprostimi iskalnimi poizvedbami. To napako v varnosti so številni hekerji uporabili za krajo podatkov o karticah s spletnih mest za e-trgovino.

Še ena zadnja pomanjkljivost varnosti se je zgodila lani na box.com, priljubljen sistem za shranjevanje v oblaku. Varnostno luknjo je izpostavil Markus Neis, vodja obveščevalnih služb za grožnje za Swisscom. Povedal je, da lahko preprosti izkoriščanja spletnih iskalnikov, vključno z Googlom in Bingom, razkrijejo zaupne datoteke in podatke številnih poslovnih in posameznih strank.

Takšni primeri se zgodijo na spletu in lahko lastnikom podjetij povzročijo izgubo pri prodaji in prihodke. Za spletna mesta za podjetja, e-trgovino in članstvo je zelo pomembno, da najprej blokirate indeksiranje občutljive vsebine in zasebnih datotek v iskanju in jih verjetno postavite za spodoben sistem za preverjanje pristnosti uporabnikov..

Oglejmo si, kako lahko nadzirate vsebino in datoteke, ki jih lahko Google in drugi iskalniki iščejo in indeksirajo.

1. Uporaba Robots.txt za slike

Robots.txt je datoteka, ki se nahaja v korenu vašega spletnega mesta, ki Googlu, Bingu in drugim spletnim brskalnikom ponuja navodila, kako se plaziti in kaj ne. Medtem ko se robots.txt običajno uporablja za nadzor nad plaziranjem prometa in pajki v spletu (mobilni vs namizni računalniki), se lahko uporablja tudi za preprečevanje pojavljanja slik v Googlovih rezultatih iskanja..

Datoteka robots.txt na običajnih spletnih mestih WordPress bi izgledala tako:

Uporabniški agent: *
Onemogoči: / wp-admin /
Onemogoči: / wp-include /

Standardna datoteka robots.txt se začne z navodilom za uporabniško sredstvo in simbolom zvezdice. Zvezdica je navodilo za vse bote, ki prispejo na spletno mesto, da upoštevajo vsa navodila pod njim.

Botove oddaljite od določenih digitalnih datotek z uporabo Robot.txt

Robots.txt se lahko uporablja tudi za zaustavitev iskanja digitalnih datotek, kot so PDF, JPEG ali MP4 iskalnika. Če želite blokirati iskanje po PDF in JPEG datoteki iskanja, je treba to dodati datoteki robots.txt:

Datoteke PDF

Uporabniški agent: *
Onemogoči: / pdfs / # Blokiraj imenik / pdfs /.
Onemogoči: * .pdf $ # Blokiraj pdf datoteke iz vseh botov. Čeprav je nestandardno, deluje za večje iskalnike.

Slike

Uporabniško sredstvo: Googlebot-Image
Onemogoči: /images/cats.jpg #Block cats.jpg sliko posebej za Googlebot.

Če želite preprečiti, da bi se vse .GIF slike indeksirale in prikazale v iskanju google slike, medtem ko dopuščate druge oblike slik, kot sta JPEG in PNG, uporabite naslednja pravila:

Uporabniško sredstvo: Googlebot-Image
Onemogoči: /*.gif$

Pomembno: Zgornji odrezki bodo preprosto izključili, da bo vaša vsebina indeksirana na spletnih mestih tretjih oseb, kot je Google. Še vedno so dostopni, če kdo ve, kam naj pogleda. Če želite narediti datoteke zasebne, da nihče ne more dostopati do njih, morate uporabiti drugo metodo, kot so ti vtičniki za omejevanje vsebine.

Googlebot-Image se lahko uporablja za preprečevanje prikazovanja slik in določene razširitve slike v Googlovem iskanju slik. Če jih želite izključiti iz vseh iskanj v Googlu, npr. spletno iskanje in slike, je priporočljivo namesto tega uporabiti Googlov uporabniški agent.

Drugi Googlovi uporabniški agenti za različne elemente na spletnem mestu vključujejo Googlebot-Video za videoposnetke, ki se uporabljajo v razdelku Google video v spletu. Podobno bo uporabniško sredstvo Googlebot preprečilo prikazovanje vseh videoposnetkov v Googlovih videoposnetkih, spletnem iskanju ali mobilnem spletnem iskanju.

Roboti txt No-Index

Upoštevajte, da uporaba Robots.txt ni primeren način za blokiranje občutljivih ali zaupnih datotek in vsebine zaradi naslednjih omejitev:

  • Robots.txt lahko poučuje le dobro obnašane pajke; drugi neskladni iskalniki in boti lahko preprosto prezrejo njegova navodila.
  • Robots.txt vaš strežnik ne prepreči pošiljanja teh strani in datotek nepooblaščenim uporabnikom na zahtevo.
  • Iskalniki lahko še vedno najdejo in indeksirajo stran in vsebino, ki jo blokirate, če so povezane z drugih spletnih mest in virov.
  • Robots.txt je dostopen vsem, ki lahko nato preberejo vsa navedena navodila in neposredno dostopajo do teh vsebin in datotek

Če želite blokirati indeksiranje iskanja in učinkoviteje zaščititi svoje zasebne podatke, namesto tega uporabite naslednje metode.

2. Uporaba metaoznake za strani brez indeksa

Uporaba metaoznake brez indeksa je pravilen in učinkovitejši način za blokiranje indeksiranja občutljive vsebine na vašem spletnem mestu. Za razliko od robots.txt je metaoznaka brez indeksa postavljena v odsek spletne strani z zelo preprosto oznako HTML:



...

Nobena stran s tem navodilom v glavi ne bo prikazana v Googlovem rezultatu iskanja. Druge direktive na primer nofollow in notranslate se lahko uporabljata tudi, da spletnim pajkom poveste, naj ne pajkajo povezav, in ponuja prevod te strani.

Več pajkov lahko naročite tako, da na strani uporabite več meta oznak:



...


Obstajata dva načina, kako to kodo dodati na svoje spletno mesto. Vaša prva možnost je, da ustvarite otroško temo WordPress, nato pa lahko v svoje funkcije.php uporabite akcijski kavelj WordPress wp_head, da vstavite noindex ali katero koli drugo metaoznako. Spodaj je primer, kako noindex na svojo prijavno stran.

dodajanje ('wp_head', funkcija () {
if (is_page ('prijava')) {
odmev '';
}
});

Vaša druga možnost je, da za nadzor vidnosti strani uporabite svoj vtičnik SEO. S Yoast SEO lahko na primer odprete razdelek z naprednimi nastavitvami na strani in preprosto izberete »Ne«, če želite iskalniku prikazati stran:

Nastavitev rezultatov iskanja Yoast SEO

3. Uporaba glave X-Robots-Tag HTTP za druge datoteke

Oznaka X-Robots vam omogoča večjo fleksibilnost za blokiranje indeksiranja iskanja vsebine in datotek. Še posebej, če ga primerjamo z metaoznako brez indeksa, ga lahko uporabimo kot odziv glave HTTP za kateri koli dani URL. Na primer, lahko uporabite X-Robots-Tag za slikovne, video in dokumentne datoteke, kjer metaoznake robotov ni mogoče uporabiti.

Lahko berete Googlov celoten vodič z meta oznakami robotov, toda pa je, kako lahko pajkom naročite, naj ne sledijo in indeksirajo JPEG slike s pomočjo X-Robots-Tag v HTTP-odzivu:

HTTP / 1.1 200 V redu
Vrsta vsebine: image / jpeg
Datum: Sat, 27. november 2018 01:02:09 GMT
(…)
X-Robots-Oznaka: noindex, nofollow
(…)

Vse direktive, ki jih lahko uporabimo z metaoznako robotov, veljajo tudi za X-Robots-Tag. Podobno lahko naložite tudi več botov iskalnih iskalnikov:

HTTP / 1.1 200 V redu
Datum: Torek, 21. september 2018 21:09:19 GMT
(…)
X-Robots-Oznaka: googlebot: nofollow
X-Robots-Oznaka: bingbot: noindex
X-Robots-Oznaka: otherbot: noindex, nofollow
(…)

Pomembno je opozoriti, da boti v iskalnikih med postopkom pajka odkrijejo metaoznake Robots in glave HTTP X-Robots-Tag. Če želite, da ti boti upoštevajo vaše navodilo, da ne upoštevate ali indeksirate nobene zaupne vsebine in dokumentov, ne smete preprečevati, da bi se ti URL-ji strani in datotek lotili..

Če ne morejo plaziti z datoteko robots.txt, se vaša navodila za indeksiranje ne bodo brala in tako prezrta. Posledično bodo v primeru, da se druga spletna mesta povežejo z vašo vsebino in dokumenti, Google še vedno indeksiral.

4. Uporaba pravil .htaccess za strežnike Apache

V datoteko .htaccess lahko dodate tudi glavo HT-X-Robots-Tag, s katero lahko pajki preprečite indeksiranje strani in digitalne vsebine vašega spletnega mesta, ki ga gostite na strežniku Apache. Za razliko od metaoznak brez indeksa lahko pravila .htaccess uporabimo za celotno spletno mesto ali določeno mapo. Podpora navadnim izrazom ponuja še večjo prilagodljivost za ciljanje na več vrst datotek hkrati.

Če želite preprečiti, da bi Googlebot, Bing in Baidu poiskal spletno mesto ali poseben imenik, uporabite naslednja pravila:

Vnovično zapisovanje jezika vklopljeno
RewriteCond% {HTTP_USER_AGENT} (googlebot | bingbot | Baiduspider) [NC]
Prepiši Rule. * - [R = 403, L]

Če želite blokirati indeksiranje iskanja vseh datotek .txt, .jpg, .jpeg, .pdf na celotnem spletnem mestu, dodajte naslednji delček:


Nastavitev glave X-Robots-Tag "noindex, nofollow"

5. Uporaba preverjanja pristnosti strani z uporabniškim imenom in geslom

Zgornje metode preprečujejo, da bi se vaše zasebne vsebine in dokumenti pojavili v Googlovih rezultatih iskanja. Vendar lahko vsi uporabniki s povezavo dosežejo vašo vsebino in neposredno dostopajo do vaših datotek. Zaradi varnosti je zelo priporočljivo, da nastavite pravilno overjanje z uporabniškim imenom in geslom ter z dovoljenjem za dostop do vlog.

Uporaba preverjanja pristnosti strani

Na primer, strani, ki vključujejo osebne profile osebja in občutljive dokumente, do katerih anonimni uporabniki ne smejo dostopati, bi morali biti potisnjeni za avtentikacijsko vrata. Torej tudi, ko uporabniki nekako uspejo najti strani, bodo pred preverjanjem vsebine zaprošeni za poverilnice.

WordPress zaščita z geslom

Če želite to narediti z WordPressom, preprosto nastavite vidnost objave na zaščiteno z geslom. Tako lahko izberete geslo, ki je potrebno za ogled vsebine na tej strani. To je dokaj enostavno storiti na podlagi objave na stran. Za bolj celovito zasebnost spletnega mesta poskusite dodati enega od teh vtičnikov za članstvo v WordPressu na svoje spletno mesto.

Upoštevajte, da zaščitene z geslom ali skrite strani spletnih iskalnikov in obiskovalcev ne ščitijo nujno dokumentov, videoposnetkov in slik, priloženih vsebini. Za resnično zaščito nalaganja datotek v WordPress je zelo priporočljiva vrhunska storitev, kot je Prevent Direct Access Gold.

Zaključek

V tekmi, ki bo na Googlovi strani, bo lastnik podjetij morda ne upošteval, kaj lahko iščejo iskalniki. Ne glede na to, ali blokirate bote iz določene datoteke, skrivate stran za prijavo po meri ali geslo, ki ščiti zasebne uporabniške imenike … Obstaja veliko strani, o katerih je treba razmisliti o no-indeksiranju, ko gre za iskalnike.

Ali imate kakršno koli vprašanje o izključitvi vsebine iz rezultatov iskanja? Ali preprečujete, da se nekatere datoteke indeksirajo? Spodaj pustite komentar!

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me