Google používa všetko, čo je na internete, na trénovanie svojej AI
Google nedávno aktualizoval svoje zásady ochrany osobných údajov, ktoré spoločnosti umožňujú využívať informácie z indexovaných webových stránok na trénovanie svojej neurónovej siete Bard. Tieto nové pravidlá nadobudli účinnosť 1. júla 2023.
Pomocou údajov z indexovaných stránok sa Google snaží využiť internet ako platformu na trénovanie svojich systémov umelej inteligencie. Spoločnosť uvádza, že tento prístup im umožní vyvíjať produkty a funkcie ako napr Google Translate, Bard a Cloud AI.
Predtým sa v pravidlách spoločnosti Google zmieňovalo používanie údajov pre „jazykové modely“ a nie „modely umelej inteligencie“ a konkrétne sa neodvolávali na služby Google Translate, Bard a Cloud AI.
Google aj OpenAI sa spoliehajú na otvorené údaje pre školenia AI, čo viedlo k tomu, že niektorí lídri platforiem implementovali zmeny. Napríklad Twitter a Reddit upravili svoje zásady platformy a obmedzili voľný prístup k svojim rozhraniam API. Bohužiaľ, tieto opatrenia ovplyvnili funkčnosť nástrojov tretích strán, ku ktorým sa pri prístupe spoliehalo mnoho používateľov tieto platformy.
V skutočnosti spoločnosť Google nevyhnutne nepotrebuje prístup k celému internetu na školenie AI. Prístup k bezplatným rozhraniam API z veľkých webových stránok, ako sú Stack Overflow, Reddit, Twitter a ďalšie, by poskytol dostatok údajov na trénovanie dobre fungujúceho modelu AI. A ak sa vyskytnú námietky, Google môže urobiť trik s vylúčením týchto údajov zo súboru údajov spolu s výsledkami vyhľadávania, pričom cituje pravidlá ochrany osobných údajov.
Najnovšie zásady ochrany osobných údajov sú tu.
Zdroj
Ak sa vám tento článok páči, zdieľajte ho pomocou tlačidiel nižšie. Neberie vám to veľa, ale pomôže nám to rásť. Ďakujem za tvoju podporu!
Reklama