Google gebruikt alles wat op internet staat om zijn AI te trainen
Google heeft onlangs zijn privacybeleid bijgewerkt, waardoor het bedrijf informatie van geïndexeerde websites kan gebruiken om zijn Bard neurale netwerk te trainen. Dit nieuwe beleid is op 1 juli 2023 ingegaan.
Door gegevens van geïndexeerde sites te gebruiken, wil Google het internet gebruiken als een platform voor het trainen van zijn kunstmatige-intelligentiesystemen. Het bedrijf stelt dat deze aanpak hen in staat zal stellen om producten en functies te ontwikkelen zoals Google Vertalen, Bard en Cloud AI.
Eerder vermeldde het beleid van Google het gebruik van gegevens voor "taalmodellen" in plaats van "AI-modellen", en verwees het niet specifiek naar Google Translate, Bard en Cloud AI.
Google en OpenAI vertrouwen beide op open data voor AI-training, wat ertoe heeft geleid dat sommige platformleiders veranderingen hebben doorgevoerd. Zo hebben Twitter en Reddit hun platformbeleid aangepast en de vrije toegang tot hun API's beperkt. Helaas hebben deze maatregelen de functionaliteit van tools van derden beïnvloed waar veel gebruikers op vertrouwden om toegang te krijgen deze platforms.
In feite hoeft Google niet per se toegang te hebben tot het hele internet voor AI-training. Toegang tot gratis API's van grote websites zoals Stack Overflow, Reddit, Twitter en anderen zou voldoende gegevens opleveren om een goed presterend AI-model te trainen. En als er bezwaren ontstaan, kan Google een trucje uithalen door die uit de dataset samen met de zoekresultaten uit te sluiten, daarbij verwijzend naar de richtlijnen voor het privacybeleid.
Het meest recente privacybeleid is hier.
Bron
Als je dit artikel leuk vindt, deel het dan via de knoppen hieronder. Het zal niet veel van je vergen, maar het zal ons helpen groeien. Bedankt voor uw steun!
Advertentie