© El.kz / Recraft / Динмухамед БЕЙСЕМБАЕВ

Голос под прицелом ИИ: учёные придумали, как защитить речь от цифрового шпионажа

29.10.2025 01:03

Когда мы звоним через Zoom, FaceTime или WhatsApp, кажется, что делимся только словами. Но на самом деле мы раскрываем куда больше: возраст, пол, настроение, происхождение, даже особенности личности. Голос стал таким же биометрическим отпечатком, как лицо или отпечатки пальцев. И теперь, в эпоху искусственного интеллекта, он превратился в новый источник уязвимости, пишет El.kz со ссылкой на Techxplore.

По словам профессора компьютерных наук Университета Мэриленда Нирупама Роя, мы уже привыкли к фишинговым письмам и утечкам в соцсетях, но почти не задумываемся, что наши собственные голоса стали частью цифровых данных.

Сегодня огромная часть голосовых коммуникаций проходит через онлайн-платформы. Это создаёт беспрецедентную угрозу приватности, ведь речь – одна из самых личных форм информации, – говорит учёный.

Голосовые данные, попавшие в чужие руки, способны нанести не меньший вред, чем украденные пароли. На их основе можно создавать реалистичные deepfake-подделки, взламывать системы голосовой аутентификации, проводить мошеннические звонки, имитируя знакомых людей. В результате даже безобидный разговор через мессенджер превращается в источник персональных данных.

Чтобы защитить человека от подобных угроз, команда Нирупама Роя создала систему VoiceSecure – технологию, которая делает речь невидимой для искусственного интеллекта, но полностью понятной для собеседников. Это своего рода «маска для голоса»: она скрывает звуковые особенности, по которым машины способны определить личность, но сохраняет естественное звучание.

Принцип работы VoiceSecure основан на различии между человеческим и машинным слухом. Человеческое ухо воспринимает звуки не с математической точностью, а через контекст и смысл. Мы не улавливаем все частоты, особенно высокие – там, где машина видит ключ к идентификации. VoiceSecure использует это различие: система изменяет именно те параметры, которые важны для ИИ, но не заметны для человека.

Технология работает на уровне микрофона, ещё до того, как голос попадает в операционную систему или приложение. Таким образом, защита включается ещё до того, как кто-либо может перехватить данные. В испытаниях пользователи легко понимали речь, а автоматические системы не могли распознать говорящего.

Когда коммуникационные системы становятся сложнее, человек всё чаще теряет контроль над собственными данными. Даже end-to-end-шифрование не спасает, если защита включена только на одной стороне. Мы хотим вернуть людям возможность управлять своей речью, – объясняет Рой.

Параллельно с этим учёный запустил ещё один проект – Cyber-Ninja, образовательную платформу, которая в игровой форме обучает подростков и пожилых людей распознавать киберугрозы. Программа уже успешно протестирована в библиотеках штата Мэриленд и помогает пользователям различать фишинг и вырабатывать цифровую грамотность.

В эпоху, когда голосовые помощники, чат-боты и умные устройства стали неотъемлемой частью быта, вопрос приватности звучит всё громче.

Искусственный интеллект делает нашу жизнь удобнее, – признаёт Рой, – но вместе с этим мы должны развивать и защитные технологии. Мы хотим, чтобы мать по-прежнему могла узнать голос своего сына, но, чтобы никакая машина не смогла извлечь из этого разговора личные данные.

Возможно, именно в этой тонкой грани – между тем, что слышит человек, и тем, что улавливает алгоритм, – сегодня проходит линия обороны цифровой эпохи.

El.kz также писал о том, как отличить настоящий автоштраф от фейкового.