Praxistest: Wie ChatGPT bei der Medienverwaltung helfen kann
Inhaltsverzeichnis
Im digitalen Zeitalter spielt eine effiziente Medienverwaltung eine wichtige Rolle für Unternehmen. Der englische Fachbegriff für die professionelle Verwaltung von Mediendateien lautet Digital Asset Management (kurz DAM). Medieninhalte werden hier zu Recht als Vermögenswerte verstanden. Digital Asset Management umfasst dabei alle nötigen Prozesse, um digitale Medien wie Fotos oder Videos optimal zu speichern, zu organisieren, zu finden und zu verteilen.
Inwiefern kann im DAM-Bereich nun der Einsatz eines KI-basierten Chatbots hilfreich sein? Dieser Frage werden wir in den folgenden Abschnitten anhand praktischer Beispiele auf den Grund gehen. Wir konzentrieren uns dabei auf den Star unter den Chatbots: ChatGPT von OpenAI.*
* OpenAI ist übrigens auch für den KI-Bildgenerator DALL-E bekannt.
Wie kann KI bei der Optimierung von DAM-Workflows helfen?
Gerade in Branchen, die offen für neue Technologien sind, trägt künstliche Intelligenz (KI) schon seit geraumer Zeit dazu bei, die Effizienz von DAM-Workflows zu steigern. Dies geschieht z.B. durch die automatische Detektion von Personen und Objekten auf digitalen Bildern, Stichwort Bilderkennung. Mit ChatGPT lassen sich nun weitere Prozesse beschleunigen. Diese haben aufgrund der Natur von ChatGPT alle etwas mit maschineller Sprachverarbeitung zu tun.
ChatGPT-Unterstützung bei der Metadatenoptimierung
Als KI-Sprachmodell wurde ChatGPT anhand riesiger Textmengen im Umfang von ca. 500 Milliarden Wörtern trainiert. Dieses enorme textuelle Wissen kann angezapft werden, um ein ideales Metadatenschema zu entwickeln: ein Schema, das unzweideutig ist und die für den jeweiligen Medienbestand entscheidenden Kategorien enthält.
Zwischenbemerkung: Zusätzliche Metadaten sind für die effiziente Organisation digitaler Medien unerlässlich. Auf diese Weise lassen sich die Suche und die Dateiverwaltung erheblich verbessern.
Praxistest 1: Erstellung eines Metadatenschemas mit Hilfe von ChatGPT
Wir haben den Praxistest gemacht und ChatGPT (Version 4) ein Metadatenschema für ein spezielles Medienarchiv entwickeln lassen. Die Eingabe am ChatGPT-Prompt lautete:
Entwickele ein detailliertes Metadatenschema für ein kommerzielles digitales Medienarchiv, dessen inhaltlicher Schwerpunkt auf Sportfotografie und insbesondere auf olympischen Sportarten liegt.
Das Schema, das ChatGPT vorschlug (einschließlich der Erläuterungen), enthält 18 Kategorien und sieht wie folgt aus:
- Bildkennung: eindeutige ID für jedes Foto.
- Titel: Titel des Fotos. Wenn er nicht händisch angegeben wird, kann er aus anderen Metadatenelementen (wie Event, Sportart, Athlet(en), Datum etc.) generiert werden.
- Bildbeschreibung: eine kurze Beschreibung des auf dem Foto festgehaltenen Moments.
- Schlüsselwörter: relevante Begriffe, die nicht in anderen Feldern enthalten sind und die Suche erleichtern.
- Datum: Tag, an dem das Foto aufgenommen wurde.
- Ort: geografischer Ort, an dem die Veranstaltung stattgefunden hat.
- Urheber: Fotograf, der das Foto aufgenommen hat.
- Quelle: woher das Foto stammt (z. B. von einer bestimmten Bildagentur oder Publikation)
- Rechte: Urheberrechtsinformationen, einschließlich möglicher Nutzungsbeschränkungen.
- Format: Dateityp und Dateigröße des Fotos.
- Auflösung: Pixeldimensionen des Bildes.
- Farbmodell: Angabe, ob das Foto in Farbe oder in Graustufen vorliegt.
- Event: Sportereignis, bei dem das Foto aufgenommen wurde. Dazu können Olympische Spiele (Jahr und Stadt), Weltmeisterschaften usw. gehören.
- Sportart: spezifische Sportart, die auf dem Foto festgehalten wurde.
- Athlet(en): Namen der auf dem Foto abgebildeten Athleten.
- Nation: das von den Sportlern vertretene Land.
- Medaillengewinner: Angabe, ob das Foto Medaillengewinner der Veranstaltung zeigt, und wenn ja, welche Medaille(n) sie gewonnen haben.
- Medaillenverleihung: Angabe, ob das Foto von einer Medaillenverleihung stammt.
Bewertung
Während die Kategorien 1 bis 12 mehr oder weniger Industriestandard sind und in jeder professionellen Mediendatenbank zum Einsatz kommen, sind die Kategorien 13 bis 18 speziell auf den festgelegten Anwendungsfall zugeschnitten (Bildarchiv / Bildagentur Sportfotografie).
Das Schema mag ausbaufähig sein, aber als Grundlage ist es erst einmal gut geeignet. Insofern ist festzuhalten, dass sich ChatGPT hier als nützliches Tool erweisen kann. Es wurden schließlich die relevantesten Metadatenfelder und ihre jeweiligen Eigenschaften identifiziert. Unternehmen, die Einsteiger in puncto Digital Asset Management sind, müssen dank ChatGPT also nicht bei Null anfangen.
Takeaway
Mit Hilfe von ChatGPT können Unternehmen ohne großen Aufwand ein Metadatenschema erstellen, das auf ihre jeweils spezifischen Bedürfnisse abgestimmt ist.
Praxistest 2: Erstellung eines Schlagwortbaumes mit Hilfe von ChatGPT
Kontrolliertes Vokabular ist für die Verschlagwortung und Metadatenoptimierung sehr wichtig. Besonders bei heterogenen Beständen ist ein gut strukturierter Schlagwortbaum (inkl. Synonymverzeichnis) von essenzieller Bedeutung. Denn je vielfältiger der Medienbestand ist, desto umfassender wird das Vokabular für die inhaltliche Erschließung ausfallen. Der Schlagwortbaum ist bei heterogenen Beständen daher stets mehrdimensional aufgebaut.
Wir haben den zweiten Praxistest gemacht und ChatGPT angewiesen, einen Schlagwortbaum für das besagte Medienarchiv mit Schwerpunkt olympische Sportarten zu entwickeln. Hier können Sie das Ergebnis einsehen:
1. Sportart
Leichtathletik
-
- Laufwettbewerbe
- Feldwettbewerbe
- Kombinierte Wettbewerbe
Turnen
-
- Kunstturnen
- Rhythmische Gymnastik
- Trampolinturnen
Wassersport
-
- Schwimmen
- Freiwasserschwimmen
- Synchronschwimmen
- Turmspringen
- Wasserball
… (und so weiter für alle Sportarten)
2. Sportevent
Olympische Spiele
-
- Olympische Sommerspiele
- Olympische Winterspiele
Weltmeisterschaften
Kontinentale Meisterschaften
Nationale Meisterschaften
… (andere Veranstaltungen)
3. Ort
Länder
-
- USA
- Japan
- Frankreich
- … (und so weiter für alle Länder)
Städte
-
- Tokio
- Paris
- Los Angeles
- … (und so weiter für alle Gastgeberstädte)
4. Athleten
Liste der Namen der Athleten (muss regelmäßig ergänzt werden)
5. Szene
Action-Aufnahme
Moment des Sieges
Medaillenzeremonie
Publikumsreaktion
Eröffnungszeremonie
Schlusszeremonie
… (andere wichtige Momente)
6. Ergebnis
Goldmedaille
Silbermedaille
Bronzemedaille
Weltrekord
Nationaler Rekord
Persönliche Bestleistung
Bewertung
Die Struktur hat (aufgrund der thematischen Enge) ein eher geringe Tiefe (nur 3 Ebenen) und gliedert sich in 6 Hauptkategorien. Natürlich ist auch dieses Schema nicht perfekt, aber die Kategorien sind sinnvoll gewählt und können als Ausgangsbasis für einen umfassenden und gut strukturierten Schlagwortbaum dienen.
Takeaway
ChatGPT erweist sich auch als hilfreiches Tool, wenn es darum geht, kontrolliertes Vokabular zu schaffen – in unserem Fall in Form eines Schlagwortbaumes, der auf die spezifischen Bedürfnisse einer Sportfotoagentur abgestimmt ist.
Zukünftige Einsatzgebiete von ChatGPT im DAM-Bereich
ChatGPT lässt sich zukünftig sicherlich so einbinden, dass Anfragen nach bestimmten Medieninhalten automatisch abgearbeitet werden. ChatGPT kann schließlich nicht nur sprachlich hochwertige Antworten erzeugen, sondern könnte z.B. auch dafür genutzt werden, um:
-
- eine gezielte Mediensuche einzuleiten
- eine Medienauswahl zusammenzustellen
- Updates zu Medieninhalten zu versenden
Immer vorausgesetzt der Medienbestand verfügt über textuelle Metadaten. Bilderkennung ist ChatGPTs Sache nämlich nicht.
Darüber hinaus könnte ChatGPT dabei helfen, bestehende Wissensdatenbanken für Nutzer besser zugänglich zu machen, z.B. durch das automatische Beantworten technischer Fragen oder die Bereitstellung von Anleitungen zur Medienverwaltung oder -nutzung.
Fazit
Der Einsatz von ChatGPT kann gerade beim Aufbau einer Mediendatenbank sehr hilfreich sein. Wie wir gesehen haben, lässt sich mit ChatGPT ein content-spezifisches Metadatenschema erzeugen, das als Ausgangsbasis für professionelles Digital Asset Management geeignet ist. Zudem kann ChatGPT Starthilfe leisten, wenn es darum geht, eine sinnvolle Struktur für kontrolliertes Vokabular zu schaffen. Andere Einsatzbereiche müssen noch getestet werden, aber es steht bereits fest, dass händische Aufgaben, die klassischerweise in den Bereich Mediendokumentation fallen, teilautomatisiert werden können. Das spart Zeit und verbessert unweigerlich den ROI von Marketing Assets wie Fotos und Videos. Es ist daher absehbar, dass KI-getriebene Chatbots wie ChatGPT bald auch im DAM-Bereich eine entscheidende Rolle spielen werden.
Profitieren Sie schon heute von KI-getriebener Medienverwaltung
Die DAM-Plattform von teamnext arbeitet schon heute mit leistungsfähigen KI-Modulen, die die Arbeit mit digitalen Medien enorm beschleunigen. Der teamnext | Media Hub verfügt über eine automatische Gesichtserkennung, die sich mit nur zwei Fotos auf eine bestimmte Person trainieren lässt. Außerdem verfügt unsere Lösung über eine Objektdetektion, die automatisches Verschlagworten ermöglicht, sowie über eine intelligente Bildähnlichkeitssuche.
Falls wir Sie neugierig gemacht haben und Sie die verschiedenen KI-Funktionen einfach mal ausprobieren möchten, dann können Sie quasi sofort loslegen, indem Sie eine kostenlose 14-tägige Testphase für den teamnext | Media Hub mit integrierter KI-Plattform starten. Zusätzlich können Sie natürlich jederzeit einen Termin für eine kostenlose Online-Produktdemo mit einem unserer Experten buchen. Benutzen Sie hierfür einfach unser Kontaktformular.