Компания
Представляем наш новый метод нанесения водяных знаков на текст и видео, генерируемые искусственным интеллектом, а также то, как мы внедряем SynthID в ключевые продукты Google.
Инструменты генеративного искусственного интеллекта и лежащие в их основе технологии больших языковых моделей захватили воображение общественности. От помощи в выполнении рабочих задач до повышения творческих способностей — эти инструменты быстро становятся частью продуктов, которые используются миллионами людей в повседневной жизни.
Эти технологии могут быть чрезвычайно полезными, но по мере того, как они становятся все более популярными в использовании, возрастает риск того, что люди причинят случайный или преднамеренный вред, например, распространяя дезинформацию и фишинг, если контент, созданный ИИ, не будет должным образом идентифицирован. Вот почему в прошлом году мы запустили SynthID, наш новый цифровой набор инструментов для нанесения водяных знаков на контент, созданный искусственным интеллектом.
Сегодня мы расширяем возможности SynthID для нанесения водяных знаков на текст, сгенерированный искусственным интеллектом, в приложении и веб-интерфейсе Gemini, а также на видео в Veo, нашей самой функциональной генеративной видеомодели.
SynthID для текста предназначен для дополнения наиболее широко доступных моделей генерации текста с помощью искусственного интеллекта и для масштабного развертывания, а SynthID для видео основан на нашем методе водяных знаков для изображений и аудио, позволяющем включать все кадры в сгенерированные видео. Этот инновационный метод встраивает незаметный водяной знак, не влияя на качество, точность, креативность или скорость процесса создания текста или видео.
SynthID не является панацеей для идентификации контента, созданного ИИ, но является важным строительным блоком для разработки более надежных инструментов идентификации ИИ и может помочь миллионам людей принимать обоснованные решения о том, как они взаимодействуют с контентом, созданным ИИ. Позднее этим летом мы планируем открыть SynthID с открытым исходным кодом для текстовых водяных знаков, чтобы разработчики могли создавать проекты с использованием этой технологии и включать ее в свои модели.
Как работает текстовый водяной знак
Большие языковые модели генерируют последовательности текста, когда им дают подсказку типа «Объясните мне квантовую механику, как будто мне пять лет» или «Какой ваш любимый фрукт?». LLM прогнозируют, какой токен, скорее всего, последует за другим, по одному токену за раз.
Токены — это строительные блоки, которые генеративная модель использует для обработки информации. В этом случае они могут представлять собой один символ, слово или часть фразы. Каждому возможному жетону присваивается балл, который представляет собой процентную вероятность того, что он окажется правильным. Токены с более высокими баллами будут использоваться с большей вероятностью. LLM повторяют эти шаги, чтобы выработать последовательный ответ.
SynthID предназначен для встраивания незаметных водяных знаков непосредственно в процесс генерации текста. Это достигается путем введения дополнительной информации в распределение токенов в момент их генерации путем модуляции вероятности создания токенов — и все это без ущерба для качества, точности, креативности или скорости генерации текста.
SynthID корректирует оценку вероятности токенов, сгенерированных большой языковой моделью.
Окончательный набор оценок для обоих вариантов выбора слов модели в сочетании со скорректированными оценками вероятности считается водяным знаком. Этот шаблон оценок сравнивается с ожидаемым шаблоном оценок для текста с водяными знаками и без водяных знаков, помогая SynthID определить, сгенерировал ли текст инструмент искусственного интеллекта или он может быть получен из других источников.
Фрагмент текста, созданный Gemini, с водяным знаком, выделенным синим цветом.
Преимущества и ограничения этой техники
SynthID для текстовых водяных знаков работает лучше всего, когда языковая модель генерирует более длинные ответы и разными способами — например, когда ей предлагается создать эссе, театральный сценарий или варианты электронного письма.
Он хорошо работает даже при некоторых преобразованиях, таких как обрезка фрагментов текста, изменение нескольких слов и легкий перефраз. Однако его показатели достоверности могут значительно снизиться, если текст, сгенерированный ИИ, тщательно переписать или перевести на другой язык.
Текстовые водяные знаки SynthID менее эффективны при ответах на фактические запросы, поскольку существует меньше возможностей для корректировки распределения токенов без ущерба для фактической точности. Сюда входят такие подсказки, как «Какая столица Франции?» или вопросы, в которых ожидается небольшое изменение или вообще не ожидается никаких изменений, например «прочитай стихотворение Уильяма Вордсворта».
Многие доступные в настоящее время инструменты обнаружения ИИ используют алгоритмы маркировки и сортировки данных, известные как классификаторы. Эти классификаторы часто хорошо справляются только с определенными задачами, что делает их менее гибкими. Когда один и тот же классификатор применяется к разным типам платформ и контента, его производительность не всегда надежна и единообразна. Это может привести к неправильной маркировке текста, что может вызвать проблемы, например, когда текст может быть неправильно идентифицирован как созданный искусственным интеллектом.
SynthID эффективно работает сам по себе, но его также можно комбинировать с другими подходами к обнаружению ИИ, чтобы обеспечить лучший охват типов контента и платформ. Хотя этот метод не предназначен для того, чтобы напрямую помешать мотивированным злоумышленникам, таким как кибератаки или хакеры, причинить вред, он может затруднить использование контента, созданного ИИ, в вредоносных целях.
Как работает водяной знак на видео
На выставке I/O в этом году мы анонсировали Veo, нашу самую функциональную модель генеративного видео. Хотя технологии создания видео не так широко доступны, как технологии создания изображений, они быстро развиваются, и становится все более важным помочь людям узнать, создано ли видео искусственным интеллектом или нет.
Видео состоят из отдельных кадров или неподвижных изображений. Поэтому мы разработали технику нанесения водяных знаков, вдохновленную нашим инструментом SynthID для изображений. Этот метод встраивает водяной знак непосредственно в пиксели каждого видеокадра, делая его незаметным для человеческого глаза, но обнаруживаемым для идентификации.
Предоставление людям знаний о том, когда они взаимодействуют со средствами массовой информации, созданными ИИ, может сыграть важную роль в предотвращении распространения дезинформации. Начиная с сегодняшнего дня, все видео, созданные Veo на VideoFX, будут иметь водяные знаки SynthID.
SynthID для водяных знаков видео отмечает каждый кадр сгенерированного видео.
Внедрение SynthID в более широкую экосистему искусственного интеллекта
Технология текстовых водяных знаков SynthID совместима с большинством моделей генерации текста AI и масштабируется для различных типов контента и платформ. Чтобы предотвратить широкое злоупотребление контентом, созданным искусственным интеллектом, мы работаем над внедрением этой технологии в более широкую экосистему искусственного интеллекта.
Этим летом мы планируем опубликовать больше о нашей технологии текстовых водяных знаков в подробном исследовательском документе, а также опубликовать текстовые водяные знаки SynthID с открытым исходным кодом с помощью нашего обновленного набора инструментов Responsible Generative AI Toolkit, который содержит рекомендации и необходимые инструменты для создания более безопасных приложений искусственного интеллекта. , чтобы разработчики могли создавать модели с использованием этой технологии и включать ее в свои модели.