Google използва всичко, което е в интернет, за да обучи своя AI
Google наскоро актуализира своята политика за поверителност, позволявайки на компанията да използва информация от индексирани уебсайтове, за да обучи своята невронна мрежа Bard. Тази нова политика влезе в сила на 1 юли 2023 г.
Използвайки данни от индексирани сайтове, Google има за цел да използва интернет като платформа за обучение на своите системи за изкуствен интелект. Компанията заявява, че този подход ще им позволи да разработят продукти и функции като Google Translate, Bard и Cloud AI.
По-рано политиката на Google споменаваше използването на данни за „езикови модели“, а не „AI модели“, и не споменаваше конкретно Google Translate, Bard и Cloud AI.
И Google, и OpenAI разчитат на отворени данни за обучение с изкуствен интелект, което доведе до някои лидери на платформи да внедрят промени. Например Twitter и Reddit промениха правилата си за платформата и ограничиха безплатния достъп до своите API. За съжаление тези мерки се отразиха на функционалността на инструменти на трети страни, на които много потребители разчитаха за достъп тези платформи.
Всъщност Google не се нуждае непременно от достъп до целия интернет за обучение на AI. Достъпът до безплатни API от големи уебсайтове като Stack Overflow, Reddit, Twitter и други би предоставил достатъчно данни за обучение на добре работещ AI модел. И ако възникнат възражения, Google може да направи трик, като ги изключи от набора от данни заедно с резултатите от търсенето, цитирайки указанията за политиката за поверителност.
Най-новата политика за поверителност е тук.
Източник
Ако ви харесва тази статия, моля, споделете я чрез бутоните по-долу. Това няма да отнеме много от вас, но ще ни помогне да растем. Благодаря за подкрепата!