Kaip neįtraukti „WordPress“ turinio iš „Google“ paieškos

Kaip neįtraukti „WordPress“ turinio ir failų iš „Google“ paieškos

Kartais reikia pašalinti konkretų „WordPress“ turinį ar failus, kad jie nebūtų indeksuojami „Google“ paieškos rezultatuose. Indeksas, arba „indeksavimas“ prieš atsirandant „Google“ ir kitoms paieškos sistemoms, buvo žodis, dažniausiai susijęs su knygomis. Paprastai jis yra daugelio knygų gale, todėl Kembridžo žodynas šiame kontekste jį apibūdina kaip:


Indeksas: abėcėlės tvarka pateiktą sąrašą, pavyzdžiui, atspausdintą knygos gale, rodantį, kuriame puslapyje yra tema, vardas ir pan.

Greitai į priekį iki 1995 m., Interneto bumo metu, turime tokias paslaugas kaip „Yahoo“ paieškos variklis, ir ateisime 1997 m., „Google“ paieška dramatiškai pakeitė tai, kaip mes ieškome ir pasiekiame informaciją internete.

2018 m. Sausio mėn. Atliktos apklausos duomenimis, internete yra 1 805 260 010 (daugiau nei 1,8 milijardo) svetainių, ir daugelis šių svetainių iš viso neturi lankytojų.

Kas yra „Google“ indeksavimas?

Yra įvairių paieškos sistemų, turinčių skirtingą indeksavimo formatą, tačiau populiariausiose paieškos sistemose yra „Google“, „Bing“ ir privatumo principą turintiems asmenims „duckduckgo“..

„Google“ indeksavimas paprastai reiškia naujų tinklalapių, įskaitant skaitmeninį turinį, pvz., Dokumentus, vaizdo įrašus ir vaizdus, ​​pridėjimą ir jų saugojimą duomenų bazėje. Kitaip tariant, norint, kad jūsų svetainės turinys būtų rodomas „Google“ paieškos rezultatuose, pirmiausia jį reikia saugoti „Google“ rodyklėje.

Kas yra „Google“ indeksavimas?

„Google“ sugeba indeksuoti visus šiuos skaitmeninius puslapius ir turinį naudodama savo vorus, tikrinimo įrenginius ar robotus, kurie pakartotinai tikrina skirtingas interneto svetaines. Šie robotai ir tikrinimo įrenginiai vykdo svetainių savininkų nurodymus, ką reikia nuskaityti ir ko reikia nepaisyti tikrinant.

Kodėl internetinės svetainės turi būti indeksuojamos?

Šiuo skaitmeninio amžiaus era beveik neįmanoma naršyti po milijardus svetainių, kuriose randama tam tikra tema ir turinys. Tai bus daug lengviau, jei yra įrankis, kuris parodys mums, kurios svetainės yra patikimos, koks turinys yra mums naudingas ir aktualus. Štai kodėl „Google“ egzistuoja ir reitinguoja svetaines jų paieškos rezultatuose.

Indeksavimas tampa neatsiejama paieškos sistemų ir konkrečiai „Google“ darbo dalimi. Tai padeda nustatyti žodžius ir posakius, kurie geriausiai apibūdina puslapį, ir apskritai prisideda prie puslapių ir svetainių reitingavimo. Norėdami, kad jūsų svetainė, įskaitant tinklalapius ir skaitmeninius failus, tokius kaip vaizdo įrašai, vaizdai ir dokumentai, pasirodytų pirmame „Google“ puslapyje, pirmiausia turi būti indeksuota..

Indeksavimas yra būtina sąlyga, kad svetainės galėtų gerai reitinguoti paieškos sistemas apskritai ir konkrečiai „Google“. Naudojant raktinius žodžius, svetaines galima geriau pamatyti ir atrasti po to, kai paieškos varikliai jas indeksuoja ir reitinguoja. Tai atveria duris daugiau lankytojų, abonentų ir potencialių jūsų svetainės ir verslo klientų.

Geriausia vieta paslėpti negyvą kūną yra antrasis „Google“ puslapis.

Jei turite daug indeksuotų puslapių, tai savaime nereiškia, kad jūsų svetainės užima aukštesnę vietą, tačiau jei šių puslapių turinys taip pat yra aukštos kokybės, galite padidinti SEO.

Kodėl ir kaip blokuoti paieškos variklius nuo turinio indeksavimo

Nors indeksavimas yra puikus svetainių ir įmonių savininkams, yra puslapių, kurių galbūt nenorite rodyti paieškos rezultatuose. taip pat galite rizikuoti, kad internete bus rodomi neskelbtini failai ir turinys. Neturint slaptažodžių ar autentifikavimo, privačiam turiniui gresia ekspozicija ir neteisėta prieiga, jei robotams bus suteikta nemokama prieiga prie jūsų svetainės aplankų ir failų.

2000-ųjų pradžioje įsilaužėliai kreditinės kortelės informacijai rodyti naudojo „Google“ paiešką iš svetainių, kuriose pateikiamos paprastos paieškos užklausos. Šią saugumo klaidą pasinaudojo daugelis įsilaužėlių, kad pavogtų kortelių informaciją iš el. Prekybos svetainių.

Kitas neseniai saugumo trūkumas įvyko pernai „box.com“, populiari debesų laikymo sistema. Saugumo skylę atskleidė „Swisscom“ grėsmės žvalgybos vadovas Markusas Neisas. Jis pranešė, kad paprastas paieškos sistemų, įskaitant „Google“ ir „Bing“, išnaudojimas gali atskleisti daugelio verslo ir individualių klientų konfidencialius failus ir informaciją.

Panašūs atvejai vyksta internetu ir gali prarasti pardavimus ir pajamas verslo savininkams. Įmonių, el. Prekybos ir narystės svetainėse ypač svarbu pirmiausia užblokuoti neskelbtino turinio ir privačių failų paieškos indeksavimą ir tada tikriausiai atiduoti juos už tinkamą vartotojo autentifikavimo sistemą..

Pažvelkime, kaip galite valdyti turinį ir failus, kuriuos gali aptikti ir indeksuoti „Google“ ir kiti paieškos varikliai.

1. „Robots.txt“ naudojimas vaizdams

„Robots.txt“ yra failas, esantis jūsų svetainės šaknyje, teikiantis „Google“, „Bing“ ir kitų paieškos sistemų robotams su instrukcijomis, ką tikrinti, o ko ne. Nors robots.txt dažniausiai naudojamas srauto ir žiniatinklio (mobiliųjų ar stalinių kompiuterių) tikrinimo skelbimų valdymui, jis taip pat gali būti naudojamas norint užkirsti kelią atvaizdams pasirodyti „Google“ paieškos rezultatuose..

Įprastų „WordPress“ svetainių robots.txt failas atrodytų taip:

Vartotojo atstovas: *
Neleisti: / wp-admin /
Neleisti: / į wp-įtraukta /

Standartinis failas robots.txt prasideda vartotojo agento instrukcija ir žvaigždutės simboliu. Žvaigždutė yra instrukcija visiems robotams, kurie atkeliauja į svetainę, kad būtų laikomasi visų žemiau pateiktų instrukcijų.

Laikykite „Robotus“ nuo konkrečių skaitmeninių failų naudodami „Robot.txt“

„Robots.txt“ taip pat gali būti naudojamas sustabdyti skaitmeninių failų, tokių kaip PDF, JPEG ar MP4, nuskaitymą paieškos sistemose. Norėdami užblokuoti PDF ir JPEG failų nuskaitymą, tai turėtų būti pridėta prie robots.txt failo:

PDF failai

Vartotojo atstovas: *
Neleisti: / pdfs / # Blokuoti katalogą / pdfs /.
Neleisti: * .pdf $ # Blokuoti visų failų pdf failus. Nors ir nestandartinis, jis veikia pagrindinėse paieškos sistemose.

Vaizdai

Vartotojo agentas: „Googlebot-Image“
Neleisti: /images/cats.jpg #Blokuoti kačių.jpg vaizdą, skirtą konkrečiai „Googlebot“.

Jei norite užblokuoti visus .GIF atvaizdus, ​​kad jie nebūtų indeksuojami ir rodomi „Google“ vaizdų paieškoje, tuo pačiu leidžiant naudoti kitus vaizdo formatus, tokius kaip JPEG ir PNG, turėtumėte naudoti šias taisykles:

Vartotojo agentas: „Googlebot-Image“
Neleisti: /*.gif$

Svarbu: Aukščiau pateikti fragmentai tiesiog pašalins jūsų turinio indeksavimą trečiųjų šalių svetainėse, tokiose kaip „Google“. Jie vis dar prieinami, jei kas nors žino, kur ieškoti. Kad failai būtų privatūs, kad niekas jų negalėtų pasiekti, jums reikės naudoti kitą metodą, pvz., Šiuos turinio ribojimo papildinius.

„Googlebot-Image“ gali būti naudojamas užblokuoti vaizdus ir tam tikrą vaizdo plėtinį, kad jie nebūtų rodomi „Google“ vaizdų paieškoje. Jei norite juos pašalinti iš visų „Google“ paieškų, pvz. žiniatinklio paieškoje ir vaizduose, patartina naudoti „Googlebot“ vartotojo agentą.

Kiti „Google“ naudotojų agentai, turintys skirtingus svetainės elementus, apima „Googlebot-Video“ vaizdo įrašams, skirtus naudoti „Google“ vaizdo įrašų skiltyje internete. Panašiai, naudodami „Googlebot“ vartotojo agentą, visi vaizdo įrašai nebus rodomi „Google“ vaizdo įrašuose, žiniatinklio paieškoje ar žiniatinklio mobiliesiems paieškoje.

Robotai txt be indekso

Atminkite, kad robots.txt naudojimas nėra tinkamas metodas blokuoti neskelbtinus ar konfidencialius failus ir turinį dėl šių apribojimų:

  • „Robots.txt“ gali nurodyti tik gerai besielgiantiems tikrinimo robotams; kitos neatitinkančios paieškos sistemos ir robotai galėtų tiesiog nepaisyti jos nurodymų.
  • „Robots.txt“ netrukdo jūsų serveriui siųsti tų puslapių ir failų pašaliniams vartotojams paprašius.
  • Paieškos sistemos vis tiek galėtų rasti ir indeksuoti jūsų užblokuotą puslapį ir turinį, jei jie bus susieti iš kitų svetainių ir šaltinių.
  • „Robots.txt“ yra prieinamas kiekvienam, kuris tada galėtų perskaityti visas jūsų pateiktas instrukcijas ir tiesiogiai pasiekti tą turinį ir failus

Norėdami blokuoti paieškos indeksavimą ir veiksmingiau apsaugoti savo asmeninę informaciją, naudokite šiuos metodus.

2. Puslapių metažymelės be indekso naudojimas

Metažymos be indekso naudojimas yra tinkamas ir veiksmingesnis būdas blokuoti slapto turinio jūsų svetainėje indeksavimą. Skirtingai nei robots.txt, be indekso metažyma dedama į tinklalapio skiltis su labai paprasta HTML žyma:



...

Bet kuris puslapis su šia antraštės instrukcija nebus rodomas „Google“ paieškos rezultatuose. Kitos direktyvos pvz., „nofollow“ ir „neversti“, taip pat gali būti naudojami nurodykite interneto tikrinimo įrenginiams netirti nuorodų ir siūlo atitinkamai to puslapio vertimą.

Galite nurodyti kelis tikrinimo įrenginius naudodami kelias metažymas puslapyje taip:



...


Yra du būdai, kaip pridėti šį kodą į savo svetainę. Pirmasis jūsų pasirinkimas yra sukurti „WordPress“ vaiko temą, tada savo funkcijose.php galite naudoti „WordPress“ veiksmo kabliuką „wp_head“, kad įterptumėte „noindex“ ar kitas meta žymeles. Žemiau yra pavyzdys, kaip norėtumėte indeksuoti savo prisijungimo puslapį.

add_action ('wp_head', function () {
if (is_page ('prisijungti')) {
aidėti '';
}
});

Antras jūsų pasirinkimas yra naudoti SEO papildinį, norint valdyti puslapio matomumą. Pvz., Naudodamiesi „Yoast SEO“ galite pereiti į išplėstinių parametrų skyrių puslapyje ir tiesiog pasirinkti „Ne“, kad būtų parinktys leisti paieškos varikliui parodyti puslapį:

Yoast SEO paieškos rezultatų nustatymas

3. „X-Robots-Tag HTTP“ antraštės naudojimas kitiems failams

„X-Robots-Tag“ suteikia daugiau lankstumo blokuoti jūsų turinio ir failų indeksavimą paieškoje. Visų pirma, palyginus su be indekso metažyma, ji gali būti naudojama kaip HTTP antraštės atsakas bet kuriam nurodytam URL. Pvz., Galite naudoti „X-Robots-Tag“ paveikslėlių, vaizdo įrašų ir dokumentų failams ten, kur neįmanoma naudoti robotų metažymų.

Galite skaityti Visas „Google“ robotų metažymų vadovas, bet štai kaip galite įpareigoti tikrinimo įrenginius nesekti ir indeksuoti JPEG vaizdo, naudodamiesi „X-Robots-Tag“ jo HTTP atsakyme:

HTTP / 1.1 200 gerai
Turinio tipas: image / JPEG
Data: Šeštadienis, 2018 m. Lapkričio 27 d. 01:02:09 GMT
(...)
„X-Robots-Tag“: „noindex“, „nofollow“
(...)

Bet kurios direktyvos, kurios galėtų būti naudojamos kartu su robotų metažyma, taip pat taikomos „X-Robots-Tag“. Panašiai jūs taip pat galite pavesti kelis paieškos variklius:

HTTP / 1.1 200 gerai
Data: 2018 m. Rugsėjo 21 d., Antradienis 21:09:19 GMT
(...)
„X-Robots-Tag“: „googlebot“: „nofollow“
„X-Robots-Tag“: „bingbot“: „noindex“
„X-Robots-Tag“: kitas robotas: „noindex“, „nofollow“
(...)

Svarbu atkreipti dėmesį, kad paieškos variklių robotai aptinka robotų metažymas ir „X-Robots-Tag HTTP“ antraštes nuskaitymo proceso metu. Taigi, jei norite, kad šie robotai vykdytų jūsų nurodymus nesekti ir neindeksuoti jokio konfidencialaus turinio ir dokumentų, neturėtumėte sustabdyti šių puslapių ir failų URL nuskaitymo.

Jei jiems neleidžiama nuskaityti naudojant failą robots.txt, jūsų indeksavimo instrukcijos nebus skaitomos ir ignoruojamos. Todėl, jei kitos svetainės nukreipia į jūsų turinį ir dokumentus, jas vis tiek indeksuoja „Google“ ir kitos paieškos sistemos.

4. „.htaccess“ taisyklių naudojimas „Apache“ serveriams

Taip pat galite pridėti „X-Robots-Tag HTTP“ antraštę prie savo .htaccess failo, kad blokuotumėte tikrinimo įrenginius iš savo svetainės, esančios „Apache“ serveryje, indeksavimo puslapių ir skaitmeninio turinio. Priešingai nei be indekso metažymų, .htaccess taisyklės gali būti pritaikytos visai svetainei ar tam tikram aplankui. Palaikant įprastas išraiškas, dar didesnis lankstumas leidžia nukreipti pagal kelis failų tipus vienu metu.

Norėdami užkirsti kelią „Googlebot“, „Bing“ ir „Baidu“ tikrinti svetainę ar specialų katalogą, laikykitės šių taisyklių:

„RewriteEngine“ įjungta
„RewriteCond% {HTTP_USER_AGENT}“ („googlebot“ | bingbot | „Baiduspider“) [NC]
„RewriteRule“. * - [R = 403, L]

Norėdami užblokuoti visų .txt, .jpg, .jpeg, .pdf failų paieškos indeksavimą visoje jūsų svetainėje, pridėkite šį fragmentą:


Antraštės rinkinys „X-Robots-Tag“ „noindex, nofollow“

5. Puslapio autentifikavimo naudojimas naudojant vartotojo vardą ir slaptažodį

Aukščiau aprašyti metodai neleis jūsų privačiam turiniui ir dokumentams pasirodyti „Google“ paieškos rezultatuose. Tačiau bet kuris vartotojas, turintis nuorodą, gali pasiekti jūsų turinį ir tiesiogiai pasiekti jūsų failus. Saugumo sumetimais labai rekomenduojama nustatyti tinkamą autentifikavimą naudojant naudotojo vardą ir slaptažodį bei prieigos prie vaidmens leidimą.

Puslapio autentifikavimo naudojimas

Pavyzdžiui, puslapiai, kuriuose yra asmeniniai personalo profiliai ir neskelbtini dokumentai, prie kurių negali prisijungti anonimai, turėtų būti stumiami už autentifikavimo vartų. Taigi net tada, kai vartotojams kažkaip pavyksta rasti puslapius, prieš pradedant tikrinti turinį, jų bus paprašyta prisijungimo duomenų.

„WordPress“ apsauga nuo slaptažodžio

Norėdami tai padaryti naudodami „WordPress“, tiesiog nustatykite įrašo matomumą apsaugotas slaptažodžiu. Tokiu būdu galite pasirinkti slaptažodį, reikalingą norint peržiūrėti to puslapio turinį. Tai gana lengva padaryti kiekvienam įrašui / puslapiui. Norėdami gauti išsamesnį svetainės privatumą, pabandykite į savo svetainę įtraukti vieną iš šių „WordPress“ narystės papildinių.

Atminkite, kad slaptažodžiu apsaugoti ar paslėpti puslapiai iš paieškos sistemų ir lankytojų nebūtinai saugo dokumentus, vaizdo įrašus ir vaizdus, ​​pridedamus prie jo turinio. Norint iš tikrųjų apsaugoti jūsų „WordPress“ failų įkėlimą, labai rekomenduojama tokia aukšto lygio paslauga, kaip „Prevent Direct Access Gold“.

Išvada

Lenktyniaudami viename „Google“ puslapyje, verslo savininkai gali neatsižvelgti į tai, ką gali pamatyti paieškos varikliai. Nesvarbu, ar blokuojate robotus iš konkretaus failo, slepiate pasirinktinį prisijungimo puslapį, ar slaptažodžiu apsaugote privačių vartotojų katalogus … Yra daugybė puslapių, į kuriuos reikia atsižvelgti neindeksuojant paieškos sistemų..

Ar turite klausimų apie turinio išskyrimą iš paieškos rezultatų? Arba neleidžiama tam tikriems failams indeksuoti „bing“? Palikite komentarą žemiau!

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map