Armiarmak eta web arakatzaileak: zer den jakin behar duzu webguneak babesteko
Armiarmak, "web arakatzaileak" ere aipatzen ditu Webgunean, eta ez dira adiskideak.
Spider-ak Spider Webguneak informazioa biltzeko
Google, Yahoo!
eta beste bilatzaile batzuek ez dituzte arakatzeko webguneak interesa dutenak, beraz, iruzurgileak eta zaborrak dira.
Armiarmak eta beste tresna automatizatuak spammers-ek erabiltzen ditu helbide elektronikoak aurkitzeko (webgune honetan praktika sarritan "bilketa" gisa aipatzen da) webguneetan eta gero erabili spam-zerrendak sortzeko.
Armiarmak bilaketa-motorrak erabiltzen dituen tresna bat da zure webguneari buruzko informazio gehiago jakiteko, baina ez da markatuta geratzen, webgune bat (edo, 'baimenak') zure webgunea nola arakatzen den azaltzen ez duen informazio garrantzitsuen segurtasun-arriskuak aurkez ditzakezu. Armiarmek honako esteken bidez bidaiatzen dute eta oso ondo ikusten dira datu-baseetarako, programazio fitxategietarako eta beste informazio batzuetarako loturak aurkitzeko.
Webguneek erregistroak ikusi ditzakete armiarmak eta beste robotek beren guneak bisitatu dituzten. Informazio hau web-orriek beren webgunea indexatzen duten eta zenbat aldiz ezagutzen duten jakiten du.
Informazio hau baliagarria da webmasterrek euren SEO sintonizatzeko eta robot.txt fitxategiak eguneratzeko aukera ematen baitute, etorkizunean bere webgunea arakatzeko zenbait robot debekatzeko.
Zure webgunea babestea Aholkuak Robot Crawler etatik
Modu nahiko erraza da zure webgunetik nahigabeko arakatzaileak mantentzeko. Zure gunea arakatzen duten armiarma gaiztoei buruzko kezkarik ez badago (helbide elektronikoa nahastea ez da arakatzaile gehienetatik babestuko), bilaketak jarraibide garrantzitsuak izan behar dituzu.
Webgune guztiek robots.txt fitxategi izeneko root direktorioan dago. Fitxategi honek web arakatzaileak azaltzen ditu indexatutako orrialdeak begiratu nahi badituzu (beste orrialde zehatz baten meta datuak ez badira indexatu beharrik izan ezean) bilatzaile bat bada.
Nabigatu nahi dituzun crawlers nahi duzun bezala esateko, hor ere esan ahal izango dituzu non joan eta arakatzaile zehatzak blokeatu ahal izango dituzula zure webgunetik.
Garrantzitsua da kontuan hartu behar dela robot.txt fitxategi on batek ondo biltzeko balio handia izango duela eta zure webgunearen errendimendua hobetzeko funtsezko elementua izan daitekeela, baina robot arakatzaile batzuk zure argibideak alde batera utziko dituzte. Horregatik guztiagatik, garrantzitsua da zure softwarea, pluginak eta aplikazioak eguneratuta egotea.
Lotutako artikuluak eta informazioa
Informazio okerraren erabilerarako (spam) helburuetarako erabilitako informazioaren prebalentzia dela-eta, 2003an onartutako legeria zenbait praktika legez kanpokotzat jotzen da. Kontsumitzaileen babeserako legeak 2003ko CAN-SPAM Legeak jasotzen ditu.
Garrantzitsua da CAN-SPAM Legean irakur dezazun denbora, negozioak komunikazio masiboak edo informazioa biltzea eragiten badu.
Spamaren aurkako legeei eta zaborrontziei nola aurre egin diezaiekezu, eta negozio jabe gisa ez duzula egin, honako artikulu hauek irakurtzerakoan:
- CAN-SPAM 2003 Legea
- CAN-SPAM Irabazi-asmorik gabeko Lege Arauak
- 5 CAN-SPAM arauak Small Business Jabeak Ulertu beharra