Google nutzt alles, was im Internet verfügbar ist, um seine KI zu trainieren
Google hat kürzlich seine Datenschutzrichtlinie aktualisiert und ermöglicht dem Unternehmen die Nutzung von Informationen von indizierten Websites zum Trainieren seines neuronalen Bard-Netzwerks. Diese neue Richtlinie trat am 1. Juli 2023 in Kraft.
Durch die Nutzung von Daten von indizierten Websites möchte Google das Internet als Plattform für das Training seiner Systeme der künstlichen Intelligenz nutzen. Das Unternehmen gibt an, dass dieser Ansatz es ihm ermöglichen wird, Produkte und Funktionen wie zu entwickeln Google Translate, Bard und Cloud AI.
Zuvor erwähnte die Richtlinie von Google die Verwendung von Daten für „Sprachmodelle“ statt für „KI-Modelle“ und verwies nicht ausdrücklich auf Google Translate, Bard und Cloud AI.
Sowohl Google als auch OpenAI verlassen sich beim KI-Training auf offene Daten, was dazu geführt hat, dass einige Plattformführer Änderungen vorgenommen haben. Beispielsweise haben Twitter und Reddit ihre Plattformrichtlinien geändert und den freien Zugriff auf ihre APIs eingeschränkt. Leider haben diese Maßnahmen die Funktionalität von Tools von Drittanbietern beeinträchtigt, auf die viele Benutzer beim Zugriff angewiesen waren diese Plattformen.
Tatsächlich muss Google für das KI-Training nicht unbedingt auf das gesamte Internet zugreifen. Der Zugriff auf kostenlose APIs von großen Websites wie Stack Overflow, Reddit, Twitter und anderen würde genügend Daten liefern, um ein leistungsstarkes KI-Modell zu trainieren. Und wenn es zu Einwänden kommt, greift Google möglicherweise zu einem Trick und schließt diese unter Berufung auf Datenschutzrichtlinien aus dem Datensatz zusammen mit seinen Suchergebnissen aus.
Die aktuellste Datenschutzerklärung ist Hier.
Quelle
Wenn Ihnen dieser Artikel gefällt, teilen Sie ihn bitte über die Schaltflächen unten. Es wird Ihnen nicht viel abverlangen, aber es wird uns helfen, zu wachsen. Danke für deine Unterstützung!