Computer vision is een discipline waar de laatste jaren enorm veel ontwikkelingen hebben plaatsgevonden. Bekende toepassingen zijn uiteraard de combinatie met robots, maar ook bij industrial safety spoelen camera’s steeds mer een rol.   

In de wereld van computer vision zijn softwarematige tools de sleutel tot het verwerken en analyseren van visuele gegevens. De laatste jaren heeft uitgerekend op dat gebied een enorme versnelling plaatsgevonden. Laten we een andere innovaties op een rij zetten.

1. OpenCV

OpenCV staat voor Open Source Computer Vision. Het gaat om een bibliotheek, met zeer veel algoritmen en functies die zo’n beetje ieder toepassingsgebied bestrijken, van beeld- en videobewerking tot functiedetectie en objectherkenning. Bovendien is de bibliotheek via meerdere programmeertalen aan te roepen, waardoor het inmiddels een populaire tool is voor developers van systemen waarbij computer vision een hoofdrol speelt.

2. Viso Suite

Wie op zoek is naar een alles-in-een pakket op het gebied van vision komt waarschijnlijk uit bij Viso Suite. Dit uitgebreide computer vision-platform biedt een no code-omgeving en vereenvoudigt daarmee het gehele ontwikkelings-, implementatie- en beheerproces van computer vision-toepassingen aanzienlijk. Het biedt krachtige objectdetectie-algoritmen als YOLOv7, volledig geïntegreerd in Viso Suite.

3. TensorFlow

TensorFlow is ontwikkeld door AI-specialistenj bij Google. Het is een open-source framework dat an Roeg ind e AI-hype bekend werd en machine learning en deep learning naar een heel nieuw niveau tilde. Met zijn uitgebreide bibliotheek voor computer vision kunnen we goed gebruik maken van neurale netwerken. Het biedt mogelijkheden voor bijvoorbeeld beeldclassificatie, objectdetectie en segmentatie. TensorFlow wordt algemeen gezien als erg flexibel, terwijl er inmiddels ook een grote community bestaat die zeer actief zijn op internet.

4. CUDA

CUDA is een parallelle rekenplatform en API-model gecreëerd door Nvidia. Deze omgeving stelt een computer vision engineer in staat om de enorme rekenkracht van Nvidia GPU's (graphical processing units) te gebruiken voor ultrasnelle beeld- en videobewerking. CUDA is geoptimaliseerd voor GPU-parallelisatie en is bezig aan een opmars in de wereld van rekenintensieve computer vision-taken.

5. Matlab

Matlab is uiteraard een bekende speler op het gebeid van computer vision. Deze  programmeeromgeving biedt een groot aantal functies en gereedschappen die speciaal zijn ontworpen voor computer vision-taken als beeldverwerking, functie-extractie of objectherkenning.  De redelijk intuïtieve syntaxis en uitgebreide functionaliteit maken het geschikt voor het prototypen en ontwikkelen van computer vision-algoritmen.

6. Keras

Keras is een API (application programming interface) voor high-level neurale netwerkomgevingen die lan worden aangeroepen met de programmeertaal Python. Met zijn gebruiksvriendelijke interface kunnen toepassingen op het gebied van deep learning worden ontwikkeld, waaronder computer vision-oplossingen. Keras biedt een uitgebreide reeks pre-trained modellen en integreert met populaire frameworks als TensorFlow, JAX and PyTorch. Dankzij zijn eenvoud en gebruiksgemak is Keras te gebruiken door zowel beginnende als ervaren vision engineers.

7. SimpleCV

Voor wie eenvoud en toegankelijkheid zoekt, is SimpleCV een goede keuze. Dit open source framework neemt de complexiteit uit computer vision-taken en biedt een intuïtieve API die ook beginnende vision engineers snel onder de knie zullen krijgen. Met SimpleCV is beeld- en videobewerking, functie-extractie en objecttracking mogelijk. Het wordt vaak geroemd voor zowel educatieve doeleinden als snelle prototyping.

8. BoofCV

BoofCV hoort vooral thuis in de wereld van de Java-programmeertaal. Het is een computer vision-bibliotheek die inmiddels flink wat impact heeft. Het biedt een breed scala aan algoritmen en functies, van camerakalibratie tot visuele odometrie. Snelheid en nauwkeurigheid zijn bekende kenmerken van BoofCV, waardoor het een goede keuze is voor toepassingen die realtime prestaties vereisen.

9. OpenVINO

OpenVINO is een open-source toolkit die is ontwikkeld door Intel. Het stelt engineers in staat om computer vision-modellen te optimaliseren en te implementeren op een breed scala aan Intel-hardware, van CPU's tot geïntegreerde GPU's en neurale compute-sticks. OpenVINO's vermogen om computer vision-workloads te versnellen en de ondersteuning voor meerdere frameworks maken het een interessante tooln.

10. YOLO

YOLO is vooral interessant als het om real-time toepassingen gaat, zoals industrial safety. Het biedt een algoritme voor objectdetectie. YOLO staat bekend om zijn enorme snelheid en nauwkeurigheid. Het neemt een invoerafbeelding, verdeelt deze in een raster en voorspelt direct begrensde vakken en klassenwaarschijnlijkheden. Ook is een combinatie met YOLO-NAS en de AS-ONE-bibliotheek mogelijk.

Conclusie

In de wereld van computer vision maken de juiste tools en de beste ontwikkelaars het verschil. De tools die in dit artikel zijn genoemd kunnen hierbij uitstekend van pas komen. Vaak is wel de nodige kennis van software development nodig. Maar daarmee zijn dan wel geavanceerde computer vision-toepassingen mogelijk.

Altijd op de hoogte blijven?