Google utilise tout ce qui se trouve sur Internet pour former son IA
Google a récemment mis à jour sa politique de confidentialité, permettant à l'entreprise d'utiliser les informations des sites Web indexés pour former son réseau de neurones Bard. Cette nouvelle politique est entrée en vigueur le 1er juillet 2023.
En utilisant les données des sites indexés, Google vise à tirer parti d'Internet comme plate-forme de formation de ses systèmes d'intelligence artificielle. La société déclare que cette approche leur permettra de développer des produits et des fonctionnalités telles que Google Traduction, Bard et Cloud AI.
Auparavant, la politique de Google mentionnait l'utilisation des données pour les "modèles de langage" plutôt que pour les "modèles d'IA", et ne faisait pas spécifiquement référence à Google Translate, Bard et Cloud AI.
Google et OpenAI s'appuient tous deux sur des données ouvertes pour la formation à l'IA, ce qui a conduit certains leaders de la plate-forme à mettre en œuvre des changements. Par exemple, Twitter et Reddit ont modifié leurs politiques de plate-forme et restreint l'accès gratuit à leurs API. Malheureusement, ces mesures ont affecté la fonctionnalité des outils tiers sur lesquels de nombreux utilisateurs comptaient pour accéder ces plateformes.
En fait, Google n'a pas nécessairement besoin d'accéder à l'intégralité d'Internet pour la formation à l'IA. L'accès à des API gratuites à partir de sites Web majeurs tels que Stack Overflow, Reddit, Twitter et d'autres fournirait suffisamment de données pour former un modèle d'IA performant. Et si des objections surviennent, Google peut faire une astuce en les excluant de l'ensemble de données avec ses résultats de recherche, en citant les directives de la politique de confidentialité.
La politique de confidentialité la plus récente est ici.
Source
Si vous aimez cet article, partagez-le en utilisant les boutons ci-dessous. Cela ne vous demandera pas grand-chose, mais cela nous aidera à grandir. Merci pour votre aide!
Publicité