Новости Литвы на русском языке. Онлайн газета "Литовский курьер" - всегда свежие новости. Сегодня: 2016.12.08 Текущий номер: N47 (1135) 24 ноября
Подписка на еженедельник «Литовский курьер» на 2017 год

Проверка синтеза слухом

Поделиться в Facebook! Поделиться!   |   Опубликовано: 2012 08 02, 0:02   |   1 комментарий

Обмануть глаза проще, чем уши. Когда Юрий Гецевич набирает на клавиатуре предложение «Мама мыла раму» и его тут же произносит «говорящая голова» на мониторе, зрение соглашается: да, мимика по ту сторону экрана абсолютно достоверна. Но на слух воспринимается не очень. Работа над созданием более совершенной, естественной речи — одна из главных задач, которую решают сегодня ученые под руководством Юрия Гецевича, и.о. заведующего лаборатории распознавания и синтеза речи Объединенного института проблем информатики НАН.

Озвучивание текстов — одна из самых сложных областей, и белых пятен, над которыми еще трудиться и трудиться, тут хватает. Например, Юрий Гецевич сейчас занят тем, чтобы машина могла понять и правильно прочитать вслух разные сочетания цифр и букв, аббревиатур, сокращений, автоматически ставила ударения в новых (неизвестных для синтезатора) словах. Ведь далеко не все при написании придерживаются правил. Его диссертация посвящена лингвистической обработке текста для синтезатора речи: «Мы даже в незнакомых фамилиях можем поставить ударения — а как научить машину искать такие, интуитивные решения? Есть и еще более интересная задача: слова–омографы. В русском и белорусском их не так много, около 10 тысяч, но они так портят картину! Как компьютеру разобраться — правильно сказать «приобретает все бОльшую популярность или большУю? Да, у нас есть система, которая ищет слова–омографы, но рано или поздно мы все равно сталкиваемся с тем, что машина не в состоянии воспринять смысл, контекст». Поэтому–то совершенствование синтеза речи — задача того же уровня, что и создание искусственного интеллекта.

С тех пор как на молодежном инновационном форуме Национальной академии наук проект Юрия Гецевича и Дмитрия Покладка — синтезатор русской и белорусской речи по тексту для стационарных и мобильных платформ был признан лучшим, произошло много чего. Он был презентован на конференции, посвященной искусственному интеллекту OSTIS–2012, участвовал в инновационной неделе, получил диплом на «ТИБО–2012». На выставки приглашают постоянно. Ведь именно эти молодые ученые научили компьютер и мобильный телефон говорить по–белорусски. Раньше синтезатора «роднай мовы» попросту не существовало!

Добиться, чтобы компьютер заговорил, — огромный, кропотливый труд. Записывается голос реального человека, раскладывается в специальной программе, показывающей мельчайшие колебания звука, нарезается на «детали» — аллофоны (мельчайшие вариации фонемы) — ведь та же буква «а» в ударном и безударном слогах и произносится по–разному. В итоге складывается база из тысяч аллофонов. А уже потом создаются алгоритмы, которые вынимают из этой базы нужные детали слова, которое надо воспроизвести. «Сшивают» слово из мельчайших кусочков. Интересно, что при записи голоса диктору вовсе не нужно начитывать объемные произведения. Ученые разработали специальный сбалансированный текст, на шесть минут читки, в котором есть все необходимые фонемы.

Естественно, у программы, переводящей текстовые файлы в звуковые, должны быть обширный словарь и система его пополнения — детище Юрия Гецевича оперирует более чем двумя миллионами слов русского и белорусского языков.

Разработана и компьютерная система создания аудиокниг. Недавно со студентами–практикантами перевели учебник «Грамадазнаўства» за 10–й класс в звуковой вариант — это заняло всего около недели. Студенты говорили, что такой реально нужной для людей практики у них еще не было.

А самая свежая разработка делает систему синтеза применимой для систем оповещения: достаточно набрать нужную информацию, и голос объявит, когда и на какой путь прибывает поезд или какая остановка у троллейбуса следующая. Или — из новинок: телефонный робот. Сам наберет десятки номеров абонентов и каждому сообщит о задолженности с указанием конкретной суммы, лишь бы эти данные были в компьютере.

В ближайших планах ученых — создание интернет–версии программы синтеза речи. Вполне вероятно, что первым «заговорит» сайт Национальной библиотеки. Тогда любой посетитель сможет воспользоваться поиском книги «на слух».

Юлия ВАСИЛИШИНА.

Метки:  , , , , , , , , , ,

SELECTORNEWS
Комментарии читателей (1)
  1. (78.60.154.229) дей пишет:

    зачем полная копия человека /это что-то не здоровое






В комментариях запрещается размещение рекламных материалов, использование ненормативной лексики, разжигание межнациональной розни. Нарушители выше упомянутых правил могут привлекаться к ответственности!

Please note: Comment moderation is enabled and may delay your comment. There is no need to resubmit your comment.

 Доступные символы

Защитный вопрос *

Реклама
Мы в Фейсбуке!