Definition av Spidering och Web Crawlers

Spindlar och Webb Crawlers: Vad du behöver veta för att skydda webbplatsdata

Spindlar är program (eller automatiserade skript) som "kryper" via webben och söker efter data. Spindlar reser genom webbadresser och kan dra data från webbsidor som e-postadresser. Spindlar används också för att mata information som finns på webbplatser för sökmotorer.

Spindlar, som även kallas "web crawlers" söker på webben och inte alla är vänliga i deras avsikt.

Spammare Spider webbplatser att samla information

Google, Yahoo! och andra sökmotorer är inte de enda som är intresserade av krypande webbplatser - det är också scammers och spammare.

Spindlar och andra automatiserade verktyg används av spammare för att hitta e-postadresser (på internet kallas denna praxis ofta som skörd) på webbplatser och använder sedan dem för att skapa skräppostlistor.

Spindlar är också ett verktyg som används av sökmotorer för att få reda på mer information om din webbplats men lämnade okontrollerade, en webbplats utan instruktioner (eller "behörigheter") om hur man kan krypa på din webbplats kan ge stora risker för informationssäkerhet. Spindlar reser genom att följa länkar, och de är mycket skickliga att hitta länkar till databaser, programfiler och annan information som du kanske inte vill ha tillgång till.

Webmasters kan se loggar för att se vilka spindlar och andra robotar som har besökt sina webbplatser. Den här informationen hjälper webbansvariga att veta vem som indexerar sin webbplats, och hur ofta.

Den här informationen är användbar eftersom den tillåter webmasters att finjustera deras SEO och uppdatera robot.txt-filer för att förbjuda vissa robotar från att krypa på deras webbplats i framtiden.

Tips om att skydda din webbplats från oönskade robotrobotar

Det finns ett ganska enkelt sätt att hålla oönskade sökrobotar ur din webbplats. Även om du inte är oroad över skadliga spindlar som kryper på din webbplats (förvirrande e-postadress skyddar dig inte från de flesta sökrobotar), bör du fortfarande ge sökmotorer viktiga instruktioner.

Alla webbplatser ska ha en fil i rotkatalogen som heter en robots.txt-fil. Den här filen låter dig instruera webbrobotare där du vill att de ska titta på indexsidor (om inte annat anges i en specifik sidas metadata som inte indexeras) om de är en sökmotor.

Precis som du kan berätta önskade sökrobotar där du vill att de ska bläddra, kan du också berätta för var de inte kan gå och till och med blockera specifika sökrobotar från hela din webbplats.

Det är viktigt att komma ihåg att en väl sammanställd robots.txt-fil kommer att ha enormt värde för sökmotorer och kan till och med vara ett viktigt inslag för att förbättra webbplatsens prestanda, men vissa robotsökare kommer fortfarande att ignorera dina instruktioner. Av den anledningen är det viktigt att du håller all din programvara, plugins och appar alltid uppdaterad.

Relaterade artiklar och information

På grund av förekomsten av informationshämtning som användes för skrämmande (spam) ändamål, godkändes lagstiftningen 2003 för att göra vissa förfaranden olagliga. Dessa konsumentskyddslagar omfattas av CAN-SPAM Act från 2003.

Det är viktigt att du tar dig tid att läsa igenom CAN-SPAM Act om ditt företag engagerar sig i någon masspost eller informationshämtning.

Du kan läsa mer om antispamlagar och hur man hanterar spammare och vad du som företagsägare kanske inte gör genom att läsa följande artiklar:

CAN-SPAM Act 2003
CAN-SPAM Act Regler för ideella organisationer
5 CAN-SPAM Regler Småföretagare behöver förstå

Intressanta Artiklar

Topp 10 sätt att Kickstart Din Jobbsökning

Hur man skapar metaforer

Arbetstagarplan för flexibilitet och framgång

US Coast Guard Diving Program

Rekommenderas

Varför inte välja karriär i försäljning

Visst, det finns många anledningar till varför du borde välja en karriär i försäljningen, men i full-avslöjandesedan finns det skäl till varför du kanske vill överväga en annan karriärväg. Försäljningen är inte för alla, precis som alla andra yrken passar inte alla. För dem som kommer in i försäljningen för att de inte kan hitta något annat val, kommer din tid i försäljningen förmodligen att vara mycket utmanande. Och de som anser alla p

Militärt lämnar, passerar och frihet

Tjäna upp ledighet och ledig tid i militären En av de rättigheter som mest ny militär personal vill lära sig om är LEAVE. Avgång betalas semester från tull för rekreation och lättnad från trycket av arbetsrelaterade uppgifter. Du kan också ta avgång av personliga skäl och nödsituationer. En "pass

Vad är incitament på jobbet?

Vilka incitament uppmuntrar anställda att bidra och uppnå mål? Ett incitament är ett objekt, värdepost eller önskad åtgärd eller händelse som spårar en anställd att göra mer av vad som uppmuntras av arbetsgivaren genom det valda incitamentet. Du vill hantera dina incitament på ett sådant sätt att du inte skapar rättiga anställda. Du vill inte he

Författare och redaktör

Karriärinformation Arbetsbeskrivning Författare och redaktörer kan delas in i tre kategorier. Författare och författare producerar innehåll för utskriftsmaterial, online media, tv, filmer och radio. Redaktörer utvärderar och väljer innehåll för publicering. Tekniska författare specialiserar sig på att producera material som instruktionsböcker och programdokumentation. Anställningsf

Högskolestudentpraktik

Praktikmöjligheter för gymnasieskolor ökar och de ger studenterna värdefull information även innan de går in på college. Precis som alla praktikplatser ger de möjligheter som finns tillgängliga för gymnasieskolor dem som huvudämne på några av de karriärmöjligheter som är tillgängliga för dem även innan de blir universitetsstuderande. Varför göra en pr

Provstämpelbrev

Lär dig hur man skriver ett uppsägningsbrev med detta prov Arbetsgivare vill skriva ett uppsägningsbrev när de brinner en anställd. Avslutningsbrevet bekräftar detaljerna i avfyrningen och sammanfattar den information som den nuvarande tidigare anställda behöver veta. Som arbetsgivare vill du behålla en kopia av uppsägningsbrevet i medarbetarens personaldokument så att du bevarar en rekord för eventuell framtida användning. Dessa regis