Semalt: Skrap enhver webside med et enkelt museklik

WebHarvy er et af de bedste værktøjer til skrapning af data og webcrawling på nettet. Det bruges til at skrabe billeder, webadresser, tekst og e-mails fra et stort antal sider. Med WebHarvy kan du gemme dit webindhold i forskellige formater og kan udtrække nyttige data med blot et par klik.
Skrab en række forskellige steder:

Ved hjælp af WebHarvy kan du nemt skrabe webadresser, e-mail-adresser, billeder, video- og lydfiler og tekst fra websider. I sin konfigurationsfunktion skal du bare flytte musemarkøren over siden, og dataene skrapes automatisk. Du kan også fremhæve de oplysninger, du vil skrabe, og WebHarvy vil begynde at udføre sin funktion med det samme. Når dataene er trukket ud, fremhæves de med den gule baggrund, og du kan kontrollere deres kvalitet. Forbløffende løser WebHarvy alle de mindre fejl i dine filer og viser det endelige resultat i et Capture-vindue. Hvis dataene ikke er fremhævet med den gule baggrund, skal du ændre værktøjets indstillinger og genstarte dem med det samme for at få gode resultater.
Identificer lignende dataelementer:
Med WebHarvy kan du identificere de lignende dataelementer og slippe af med indhold af lav kvalitet. Hvis du for eksempel havde skrabet en bestemt side tidligere og glemt den, vil WebHarvy ikke udtrække data fra den samme side og spare din tid og energi. I stedet kan du få adgang til disse data i WebHarvys database og downloade dem med det samme til din harddisk. Tilsvarende kan du fange flere dataelementer fra en side ved hjælp af dette værktøj og kan udføre flere skrabningsopgaver ad gangen.
Skrap billeder med WebHarvy:
Når vi klikker på en PNG- eller JPG-fil under konfigurationen, begynder WebHarvy øjeblikkeligt at skrabe den. Når billedet er trukket ud, downloades det automatisk til din harddisk eller gemmes i WebHarvys database til offline brug. Du kan skrabe op til 100 billedfiler og PDF-dokumenter ad gangen med denne service. Valgmuligheden 'Capture Image' kan også bruges til at skrabe HTML-dokumenterne, og du kan anvende regelmæssige udtryk for at få billed-URL på kort tid.

Skrap HTML-dokumenterne:
Med WebHarvy kan du skrabe HTML-dokumenterne med blot et par klik. For dette skal du vælge indstillingen 'Capture HTML' og klikke på knappen 'More Options' i vinduet Capture. Her vises HTML-koden for dit valgte element. Klik på knappen 'Optag HTML' og tag HTML'en for det valgte element.
Peg-og-klik-grænseflade:
WebHarvy er bedst kendt for sin peg-og-klik-grænseflade. Du behøver ikke at skrive koder eller scripts, mens du skraber dataene. I stedet kan du bruge WebHarvy til at navigere gennem forskellige websider og skrabe så mange sider som du vil med et enkelt museklik. WebHarvy identificerer automatisk datamønstrene og giver nøjagtige og pålidelige resultater. Du kan gemme oplysningerne i XML-, CSV-, JSON- og TSV-formater. Du kan endda skrabe dine websider anonymt og forhindre WebHarvy i at blokere din IP-adresse.