Google folosește tot ce este pe internet pentru a-și antrena AI
Google și-a actualizat recent politica de confidențialitate, permițând companiei să utilizeze informații de pe site-urile web indexate pentru a-și antrena rețeaua neuronală Bard. Această nouă politică a intrat în vigoare la 1 iulie 2023.
Prin utilizarea datelor de pe site-uri indexate, Google își propune să folosească internetul ca platformă pentru antrenarea sistemelor sale de inteligență artificială. Compania afirmă că această abordare le va permite să dezvolte produse și caracteristici precum Google Translate, Bard și Cloud AI.
Anterior, politica Google a menționat mai degrabă utilizarea datelor pentru „modele lingvistice” decât „modele AI” și nu făcea referire în mod specific la Google Translate, Bard și Cloud AI.
Google și OpenAI se bazează atât pe date deschise pentru instruirea AI, ceea ce a determinat ca unii lideri de platformă să implementeze schimbări. De exemplu, Twitter și Reddit și-au modificat politicile platformei și au restricționat accesul gratuit la API-urile lor. Din păcate, aceste măsuri au afectat funcționalitatea instrumentelor terțe pe care s-au bazat mulți utilizatori pentru a le accesa aceste platforme.
De fapt, Google nu trebuie neapărat să acceseze întregul internet pentru instruirea AI. Accesarea API-urilor gratuite de pe site-uri web majore precum Stack Overflow, Reddit, Twitter și altele ar oferi suficiente date pentru a antrena un model AI performant. Și dacă apar obiecții, Google poate face un truc prin excluderea acestora din setul de date împreună cu rezultatele căutării sale, invocând regulile politicii de confidențialitate.
Cea mai recentă politică de confidențialitate este Aici.
Sursă
Dacă vă place acest articol, vă rugăm să îl distribuiți folosind butoanele de mai jos. Nu va lua multe de la tine, dar ne va ajuta să creștem. Mulțumesc pentru sprijin!