Wat is Octoparse?

Geschreven door: op dinsdag 25 februari 2020

Leestijd:

Één van de eerste taken die ik toegewezen kreeg toen ik aan de slag ging bij Sigma Solutions, was het binnenhalen van productdata voor een nieuwe webshop voor één van onze nieuwste klanten. De tool die ik hiervoor heb gebruikt heet Octoparse. In deze blog geef ik een korte uitleg van de werking en toepassing van dit handige programma.

Octoparse: een visuele webscraper

Octoparse maakt het mogelijk om veel informatie van een website binnen te halen en te ordenen, zonder dat daar code aan te pas komt. Door te werken in een omgeving die veel lijkt op een browser, bootst Octoparse in feite na hoe een bezoeker door een website zou browsen en gevonden data zou opslaan. Als gebruiker van Octoparse kun je zogezegd bepaalde ‘paden’ programmeren; je kan aangeven welke data Octoparse moet opslaan. Zo ‘programmeer’ je waar Octoparse naartoe moet navigeren, welke link moet worden opgeslagen, welke tekst op welke manier moet worden opgeslagen. Vervolgens ordent Octoparse die opgevraagde data in een Excel bestand.

Geen code nodig

Zoals eerder aangegeven, deze webscraper werkt visueel: je klikt als het ware een pad in elkaar op ongeveer dezelfde manier als wanneer je navigeert door een website. Dit gebruikersgemak heeft als voordeel dat ook minder ervaren gebruikers toch data kunnen 'scrapen' van websites.

Toepassing: wat is het nut van Octoparse?

Een dergelijk pad kan worden toegepast op een hele website, waardoor het mogelijk is om veel data op te halen in korte tijd en deze ook nog eens netjes te ordenen. Omdat je met Octoparse de data zo goed kan structureren, maakt het de vervolgstap stukken makkelijker: een import van (product)data voor de eigen site. Kortom: middels Octoparse kun je zeer snel veel data ophalen, deze ordenen en gebruiken naar eigen behoefte.

Meer weten?

Benieuwd naar wat Octoparse nog meer te bieden heeft? Bekijk dan hier de site of neem contact met ons op.


Andere blogartikelen

  • Het gebruik van await in C#

    Geschreven door: op zaterdag 28 maart 2020

    Binnen applicaties kunnen soms functies voorkomen die lang nodig hebben om te voltooien. Denk bijvoorbeeld aan een call naar een API van een derde partij die veel data teruggeeft die verwerkt moet wor ...

    Bekijk het artikel »
  • Het gebruik van de SemaphoreSlim class in C#

    Geschreven door: op zaterdag 28 maart 2020

    Webapplicaties kunnen meerdere calls vanuit meerdere plekken verwerken zonder dat deze requests op elkaar moeten wachten. Maar soms heb je te maken met een usecase waar je helemaal niet wilt dat funct ...

    Bekijk het artikel »
  • SQL en het gebruik van JOIN

    Geschreven door: op zaterdag 28 maart 2020

    Binnen SQL heb je verschillende manieren om tabellen met elkaar te koppelen om zo data uit beide tabellen terug te krijgen in de resultaten. Maar wat houdt elk van deze joins in?Verschillende typenE ...

    Bekijk het artikel »
Bel 072 5345 888
Meer dan 40 bedrijven vertrouwen op ons
Onze Middelen en Technologieën
microsoft silver partner
Adobe partner
fd-gazellen-2018.jpg
Google analytics
partners-logo.jpg
Op de hoogte blijven?

Meld u aan voor de gratis nieuwsbrief om op de hoogte te blijven van onze activiteiten