Google bruker alt som er på Internett for å trene opp AI
Google har nylig oppdatert sin personvernpolicy, slik at selskapet kan bruke informasjon fra indekserte nettsteder for å trene Bard nevrale nettverk. Denne nye retningslinjen trådte i kraft 1. juli 2023.
Ved å bruke data fra indekserte nettsteder har Google som mål å utnytte internett som en plattform for opplæring av sine kunstige intelligenssystemer. Selskapet opplyser at denne tilnærmingen vil gjøre dem i stand til å utvikle produkter og funksjoner som f.eks Google Translate, Bard og Cloud AI.
Tidligere nevnte Googles retningslinjer bruk av data for "språkmodeller" i stedet for "AI-modeller", og refererte ikke spesifikt til Google Translate, Bard og Cloud AI.
Google og OpenAI er begge avhengige av åpne data for AI-opplæring, noe som har ført til at noen plattformledere har implementert endringer. For eksempel har Twitter og Reddit endret plattformpolitikken og begrenset gratis tilgang til API-ene. Dessverre har disse tiltakene påvirket funksjonaliteten til tredjepartsverktøy som mange brukere stolte på for å få tilgang til disse plattformene.
Faktisk trenger ikke Google nødvendigvis å få tilgang til hele internett for AI-trening. Å få tilgang til gratis API-er fra store nettsteder som Stack Overflow, Reddit, Twitter og andre vil gi nok data til å trene en AI-modell med god ytelse. Og hvis det oppstår innvendinger, kan Google gjøre et triks med å ekskludere dem fra datasettet sammen med søkeresultatene, med henvisning til retningslinjer for personvern.
Den nyeste personvernerklæringen er her.
Kilde
Hvis du liker denne artikkelen, vennligst del den ved å bruke knappene nedenfor. Det vil ikke ta mye fra deg, men det vil hjelpe oss å vokse. Takk for støtten!
Annonse