LLaVA Modell

Hierbei wird ein KI-Modell zur Verschlagwortung bzw. Beschreibung der Bilder verwendet welches lokal auf Ihrem PC ausgeführt wird. Es findet keine Online-Verbindung statt und es fallen auch keine weiteren Kosten an. Wenn Sie kein eigenes Modell bereitstellen wollen, wird WIA-Loader bei der ersten Verwendung anbieten, eines automatisch herunter zu laden. In diesem Fall lädt WIA-Loader dann dieses Modell von der Webseite https://huggingface.com herunter: llava-phi-3-mini-gguf

OpenAI ChatGPT

Hier werden die Bilder an ChatGPT übermittelt, mit der Aufgabe (dem Prompt), eine Liste an Schlüsselwörtern und einer Bildunterschrift zu erstellen und diese als JSON String auszugeben.

Wie auch der Microsoft Azure ist dieser Dienst kostenpflichtig, d.h. Sie müssen entweder einen eigenen API Schlüssel von OpenAI verwenden oder Credits aus dem Microsoft App Store kaufen. Anders als bei Azure ist, dass die Credit Kosten pro Bild nicht fix sind und je nach Länge der Antwort variieren können. Im Schnitt kann man aber ungefähr von 20 bis 30 Credits pro Bild ausgehen, wenn Tags und eine Bildunterschrift angefragt werden.

Microsoft Azure

WIA-Loader kann mit Hilfe der Microsoft Azure Cognitive Services ein automatisches Verschlagworten von Bildern durchführen . Dazu werden Miniaturversionen der Bildern an einen Cloud Dienst von Microsoft geschickt und von diesem analysiert.

Dieser Dienst ist kostenpflichtig daher müssen Sie entweder einen eigenen API Schlüssel verwenden oder über Microsoft Store 'Credits' zur Abrechnung pro Bild kaufen. Eine Anleitung zum Anlegen eines Accounts und eines API-Schlüssels finden Sie hier. Wenn Sie keinen eigenen API-Key erstellen möchten, müssen Sie Credits über den Microsoft Store erwerben. Je Bild werden 10 oder 20 Credits berechnet, je nachdem ob zusätzlich noch eine Bildunterschrift angefordert wird oder nicht.

Lokales ONNX Modell

Hier erfolgt die Auswertung der Bilder ebenfalls direkt auf Ihrem PC durch ein Neuronales Netzwerk. So entstehen keine zusätzlichen Kosten, allerdings ist das Ergebnis aktuell auch (noch) nicht mit dem der anderen Dienste zu vergleichen.

Ein passendes, vortrainiertes ResNetV2 ONNX Modell können Sie hier herunterladen. Den Pfad zu diesem Modell hinterlegen Sie dann in den Grundeinstellungen bzw. direkt im AutoTag Importschritt.

Zurück

© 2024 Patrick Mortara