[ad_1]
Meta veröffentlicht neuen Datensatz zur Förderung von Vielfalt und Inklusion in AI-Projekten
Die künstliche Intelligenz (KI) gewinnt schnell an Bedeutung in vielen Bereichen des modernen Lebens. Von der Automatisierung von Geschäftsprozessen bis hin zur Analyse riesiger Datenmengen, um Entscheidungen in Echtzeit zu treffen: AI ist überall.
Aber trotz all ihrer Vorteile gibt es auch einige Herausforderungen mit AI. Einer davon ist die allgemeine Inklusion. AI-Tools und -Prozesse sollten so entwickelt werden, dass sie für alle zugänglich sind, unabhängig von ihrem Alter, Geschlecht, ihrer ethnischen Zugehörigkeit oder anderen demografischen Merkmalen. Um dieses Ziel zu erreichen, braucht es allerdings Daten, die eine breite Palette von Menschen abbilden.
Deshalb hat Meta, ein führendes Unternehmen im Bereich AI-Entwicklung, ein neues Datensatzpaket veröffentlicht, das Forschern und Entwicklern dabei helfen soll, die Vielfalt und Inklusion in ihren Projekten zu maximieren. Das Paket umfasst eine große Anzahl an face-to-face Video-Clips mit einer breiten Palette von Menschen aus unterschiedlichen demografischen Gruppen.
Ein neues Datensatzpaket für Inklusion und Vielfalt
Das neue Datensatzpaket heißt Casual Conversations v2. Es umfasst insgesamt 26.467 Video-Monologe, die in sieben verschiedenen Ländern aufgenommen wurden. Insgesamt waren 5.567 bezahlte Teilnehmer beteiligt. Die Videos sind mit begleitenden Sprach-, Visual- und demografischen Attributdaten versehen, um die systematische Effektivität zu messen.
Laut Meta ist der Datensatz „consent-driven“, was bedeutet, dass die Teilnehmer direkt um ihre Zustimmung gebeten wurden und die Daten nicht unbeabsichtigt oder verdeckt gesammelt wurden. Dabei ist zu betonen, dass die im Paket enthaltenen Inhalte dazu dienen, die Datengrundlage zu maximieren und dafür zu sorgen, dass AI-Modelle eine breite Palette von Menschen abbilden.
Ein weiteres wichtiges Merkmal des Datensatzpakets ist, dass es sich um das erste Open-Source-Datensatzpaket handelt, das Videos aus mehreren Ländern enthält. Es enthält detaillierte demografische Informationen, die AI-Entwicklern helfen, ihre Modelle auf Fairness und Robustheit zu testen.
Konzentration auf Diversität
Ein sehr wichtiger Aspekt dieses neuen Datensatzpakets ist, dass die Teilnehmer aus verschiedenen Ländern und mit unterschiedlichem Hintergrund stammen. Insbesondere stammen viele Teilnehmer aus Ländern wie Indien und Brasilien. Dies ist wichtig, da diese beiden Länder eine entscheidende Rolle bei der zukünftigen Entwicklung der digitalen Wirtschaft spielen werden.
Darüber hinaus hilft das Paket AI-Entwicklern, die Schwierigkeiten bei der Erkennung von Sprachbarrieren und körperlicher Vielfalt in einigen AI-Kontexten zu adressieren. Einige digitale Overlay-Tools haben beispielsweise aufgrund von Einschränkungen ihrer Trainingsmodelle bestimmte Benutzerattribute nicht erkannt. Einige wurden als rassistisch eingestuft.
Meta zeigt sich daher besonders daran interessiert, eine Vielzahl von demografischen Merkmalen zu erfassen. So verwendet das Unternehmen zum Beispiel zwei verschiedene Skalen für die Hautfarben-Annotation. Eine ist die sechsstufige Fitzpatrick-Skala – die am häufigsten verwendete numerische Klassifikation für die Hautfarbe aufgrund ihrer Einfachheit und ihrer weiten Verbreitung. Die andere ist die 10-stufige Skin Tone-Skala, die von Google eingeführt wurde und in seinen Such- und Foto-Services verwendet wird. Das Einbeziehen beider Skalen soll helfen, die Messung des Algorithmus und die Bewertung der Vielfalt und Inklusion zu verbessern.
Fazit
Insgesamt ist das Casual Conversations v2 Datensatzpaket ein wichtiger Schritt nach vorn für inklusives AI-Training. Es bietet Forschern und Entwicklern eine umfangreiche Basis, um ihre Modelle auf Fairness und Robustheit zu testen. Durch die Vielfalt der Teilnehmer und die breiten demografischen Informationen ist es zudem ein wichtiger Schritt zur Verbesserung der inklusiven Entwicklung von AI-Tools.
Für weitere Details zum Casual Conversations v2 Datensatzpaket besuchen Sie bitte die Meta-Website.