Ну да бог с ним, с происхождением, главное, что «Катерина» и в самом деле хороша. Непосредственно ScanSoft свой движок не продает, а предоставляет по лицензии разработчикам так называемых читалок (TTS Tools по-научному), поэтому первым делом я ринулся на сайт компании NextUp - создателя TextAloud, которым комплектовался мой AT amp;T Natural Voices. И не прогадал: «Катерину» отпускают за 20 долларов (плюс сама читалка $29,95; рис. 1).

Журнал «Компьютерра» №44 от 29 ноября 2005 года pic_53.jpg

Надо сказать, цены у NextUp.com божеские: 16-килогерцовые английские, немецкие, французские Natural Voices - по 25 долларов за штуку. Столько же стоят и хиты сезона, предельно реалистичные 16 Khz SAPI5-говоруны Kate и Paul от Neospeach. Одна незадача: американские процессинговые системы кредитных карт (единственный доступный на сайте вариант платежа) принципиально не работают с российскими IP-адресами.

Когда я поведал Кену Уайту из NextUp.com о троекратной попытке приобрести «Катерину» по американской кредитной карте, что увенчалось тройным списанием средств со счета (25+25+25=75 долларов[Разумеется, деньги через неделю были разморожены, хотя все равно неприятно]) при одновременном уведомлении об ошибке и отказе выдать товар (ну разумеется: карта американская, а запрос идет из России!), тот расчувствовался и просто подарил мне этот речевой синтезатор, честно предупредив, что с TextAloud «Катерина» не работает!

Так оно и оказалось: даже после третьей бутылки водки русскоязычный человек произносит слова быстрее, чем это делала «Катерина» в «читалке» NextUp.com, причем ни скорость, ни высота голоса не поддаются никакой регулировке. Судя по всему, реализация SAPI5 в этом конкретном синтезаторе RealSpeak конфликтует по каким-то параметрам с TextAloud. Ну да не беда: первый же отечественный бесплатный «чтец»[Слово «читалка» не подходит по сюжетным соображениям] Cool Reader лег на «Катерину» как родной (рис. 2, 3).

Журнал «Компьютерра» №44 от 29 ноября 2005 года pic_54.jpg

Именно в последней версии Cool Reader - 2.00.52a от 2 ноября - реализована корректная поддержка SAPI5-движков ScanSoft, поэтому «Катерина» отлично настраивается и регулируется. Единственное ограничение: заточен Cool Reader исключительно под чтение электронных книг (понимает форматы html, rtf, doc, txt, fb2 и автоматически распознает русские кодировки dos, win, koi-8, а также latin, utf-8 и unicode), поэтому ему невозможно скормить содержимое буфера обмена, как в TextAloud.

Журнал «Компьютерра» №44 от 29 ноября 2005 года pic_55.jpg

Заключительный аккорд - о качестве звучания «Катерины». Оно хорошее. Твердая «четверка». Залогом тому служит уже размер дистрибутива - 45 мегабайт, что десятикратно превышает аллофонную базу «Коляна» от Elan Speech. Другое дело, что до настоящего 16-килогерцового продукта все равно еще далеко: размер каждого голоса AT amp;T Natural Voices - 600 мегабайт. Кстати, так и не сумел разобраться в цифрах из полного названия «Катерины»: ScanSoft Katerina Full 22 Khz. О каких килогерцах идет речь? Надеюсь, кто-нибудь из профессионалов откликнется и просветит. В любом случае, «Катерина» - это первый в истории русский голос, напоминающий больше человека, чем робота. Прорыв грандиозный!

Линки, помянутые в «Голубятне», вы найдете на домашней странице internettrading.net/guru .



Перейти на страницу:
Изменить размер шрифта: