Google использует все, что есть в Интернете, для обучения своего ИИ
Google недавно обновила свою политику конфиденциальности, позволив компании использовать информацию с проиндексированных веб-сайтов для обучения своей нейронной сети Bard. Эта новая политика вступила в силу 1 июля 2023 года.
Используя данные с проиндексированных сайтов, Google стремится использовать Интернет в качестве платформы для обучения своих систем искусственного интеллекта. Компания заявляет, что этот подход позволит им разрабатывать продукты и функции, такие как Google Translate, Bard и облачный ИИ.
Ранее в политике Google упоминалось использование данных для «языковых моделей», а не для «моделей ИИ», и не упоминались конкретно Google Translate, Bard и Cloud AI.
Google и OpenAI полагаются на открытые данные для обучения ИИ, что привело к тому, что некоторые лидеры платформ внедрили изменения. Например, Twitter и Reddit изменили политику своих платформ и ограничили свободный доступ к своим API. К сожалению, эти меры повлияли на функциональность сторонних инструментов, которые многие пользователи использовали для доступа эти платформы.
На самом деле Google не обязательно нужен доступ ко всему Интернету для обучения ИИ. Доступ к бесплатным API с крупных веб-сайтов, таких как Stack Overflow, Reddit, Twitter и других, предоставит достаточно данных для обучения хорошо работающей модели ИИ. И если возникнут возражения, Google может пойти на хитрость, исключив их из набора данных вместе с результатами поиска, сославшись на рекомендации политики конфиденциальности.
Самая последняя политика конфиденциальности здесь.
Источник
Если вам понравилась эта статья, пожалуйста, поделитесь ею с помощью кнопок ниже. Это не потребует от вас многого, но поможет нам расти. Спасибо за вашу поддержку!