14 лет назад 1 июня 2005 в 1:47 137

Аудиокнига – отличная вещь. Ее можно слушать на ходу и за рулем автомобиля, в общественном транспорте и на прогулке в лесу, на рыбалке и пляже. Такое “чтение” и зрение сбережет, и нудную работу скрасит, и ребенка убаюкает, а плохо видящих людей приобщит к литературе.

К сожалению, в магазинах выбор аудиокниг невелик, заказанные в интернете долго ждать, да и не накупишься этих промышленных дисков. Другое дело – самому создавать звуковые книги. Нужно просто научиться озвучивать тексты на компьютере и записывать их в аудиофайлы. Перекинуть потом эти файлы на карманный МР3-плейер, КПК, обычный “кассетник” и даже на “мобилу” – дело техники.
Судя по отзывам на нашу статью “Русский как иностранный” в февральском номере журнала, именно эта возможность вызвала наибольший интерес наших читателей.

Общий вопрос: как и с помощью чего это сделать, не слишком напрягаясь с настройками программ и не потратив при этом больших денег (лучше совсем бесплатно). Вот почему в этой статье мы не будем вдаваться в технологические тонкости синтеза речи, а сразу дадим четкую инструкцию по созданию аудиокниг. Для решения этой задачи нам понадобится, прежде всего, голос, который наговорит нашу книжку, и программа, умеющая записывать речь в MP3.

ЧТО ТАКОЕ АУДИОКНИГА
Для начала давайте разберемся с самим понятием “аудиокнига”. Дословно – это “звучащая книга” или “книга, прочитанная вслух”. Исходя из этого определения, можно точно сказать, что записи различных радиопередач – это все-таки спектакли, постановки, разыгранные на голоса, а никак не аудиокниги. По существующему западному стандарту аудиокнига должна быть озвучена одним голосом, содержать минимум музыкального сопровождения и всевозможных эффектов (вроде шума моря, шелеста дождя или криков птиц). В идеале таких посторонних звуков в аудиокниге не должно быть вообще, если они и есть, то чуть-чуть, между главами.

Многие из тех, кто “подсел” на аудиокниги, “выслушивают” в день от трех до пяти часов озвученного текста (в месяц это занимает 80-140 часов). Чтобы вы смогли представить объем “проглатываемой” таким образом информации, приведем эквивалент нижней границы в других единицах: 85 часов звучат 10 томов Бориса Акунина об Эрасте Фандорине (4,3 Мб).

А теперь в денежном измерении. Некоторые аудиокниги можно скачать бесплатно в файлообменных сетях, но этот вариант только для тех, кто не платит за трафик из собственного кармана. Цена средней озвученной книги на Горбушке – 100 рублей, в приличном магазине – 200 рублей. Таким образом, за всю эпопею с Фандориным придется выложить от 1000 до 2000 рублей. И это при условии, что книги эти озвучили и выпустили в продажу на дисках, что редко бывает, к сожалению. Вот почему “слушающим книги” людям так нужен в хозяйстве личный чтец, который бы озвучивал любые произведения.

ГОЛОС НИКОЛАЯ
“Приятный дикторский голос прочтет вам эти книги” – такое описание имеющихся в продаже аудиокниг можно встретить на некоторых сайтах в интернете. Если цена таких книг подозрительно низка (порядка 50 рублей за книжку или диск), не спешите делать заказ – скорее всего, эти книги озвучены одним из синтезаторов речи, в частности голосом Digalo Russian Nikolai.

Этот голосовой модуль является самым популярным среди людей, активно использующих синтез речи для прослушивания книг, и действительно обладает довольно приятным тембром. А спешить с заказом не стоит по той причине, что с помощью этого голосового движка вы сами сможете озвучить любое количество книг, не затратив при этом ни копейки. Нужно оговориться: конечно же, при наличии самой программы-синтезатора. И здесь возникает резонный вопрос: где взять этого Николая (будем так называть этот голос для краткости).

ЧТО СТАРЫЙ, ЧТО НОВЫЙ
Обычно при упоминании русского движка Digalo подразумевается одна из версий программы 2000 года – Digalo 2000. Именно она в основном используется для синтеза речи, и именно ее дальше по тексту мы будем называть старым “Николаем”. Более свежую версию движка – Digalo 2003 – мы даже не будем рассматривать, поскольку управляется она только родной оболочкой, совершенно “не видится” программами-говорилками, а по качеству синтеза ничуть не лучше Digalo 2000.

К сожалению, на сайте программы (www.digalo.com) “висит” как раз эта неуправляемая версия 2003 года, и по этой причине ее оттуда скачивать не нужно. Старого “Николая” можно найти в Сети без затруднений (например, здесь: doublestyle.com1.ru/mp3book/download.html). Поскольку программа не поддерживается хозяевами, за регистрацию ее давно никто не платит.

Внятность речи – главное достоинство старого “Николая”, из-за которого многие терпят и его недостатки. Движок работает под управлением MS SAPI 4.x и в наименьшей степени поддерживает ее спецификацию. В результате на фоне других добропорядочных движков наш “Николай” зачастую оказывается “рыжим” – для него невозможно задать возраст чтеца, поставить смысловое ударение, заставить говорить шепотом или использовать интонацию (восходящую или нисходящую) и много других “не”. Однако самый большой его недостаток в том, что нельзя записывать синтезированную речь в аудиофайл в ускоренном режиме (что это за режим, расскажем чуть позже).

Совсем недавно появилась новая версия “Николая” (www.elantts.com). Теперь программа называется по-другому – Speech Cube Rus (Nicolai). Этот “Николай” работает и под SAPI 4, и под SAPI 5, но остается таким же “рыжим” и обладает тем же голосом, что и старый. Однако новый “Николай” (будем так называть версию движка 2005 года) излечился от некоторых старых болезней. Он теперь не сбоит на глючных словах (не боится ни “уколов”, ни “приставов”) и длинных паузах, но самое главное – позволяет записывать речь с ускорением.

Кроме того, у нового “Николая” намного шире диапазон настраиваемых параметров речи. Если скорость чтения у старого “Николая” находилась в пределах от 70 до 190 условных слов в минуту, то у нового – от 17 до 850 слов. Правда, такие широкие возможности вряд ли кому пригодятся на деле – при значении этого параметра выше 250 слов уже ничего не воспринимается, а при скорости ниже 50 синтезатор бормочет заплетающимся языком алкоголика. Значительно расширен и частотный диапазон нового “Николая”: от голоса человека, перенесшего трахеотомию, до кастрированного в раннем детстве старика. Демо-период нового “Николая” – 30 дней. Затем вам придется платить за регистрацию, однако сумма разработчиками не афишируется.

ЗАПИСЬ В GOVORILKA – “НА ЛЕТУ” И БЕСПЛАТНО
Как и было обещано в самом начале статьи, мы расскажем о бесплатном способе записи аудиокниг. Будем считать, что хотя бы одного из “Николаев” вы уже нашли в Сети и установили. Теперь понадобится программа-оболочка, умеющая не только воспроизводить текст голосом этого движка, но и записывать синтезированную речь в аудиофайл. Как нельзя лучше для этой цели подойдет бесплатная программа Антона Рязанова Govorilka (www.vector-ski.com/vecs/govorilka), представляющая собой интерфейс к голосовым движкам, поддерживающим MS SAPI 4.x.

Чтобы Govorilka “увидела” обоих “Николаев” в числе доступных голосов, необходимо установить компоненты этого самого SAPI 4.x (www.microsoft.com/msagent/downloads/user.asp). (Что именно скачать и для чего это все нужно, смотрите в нашей февральской статье. Если нет под рукой этого номера, то список нужных компонентов можно найти на сайте Govorilka).

Далее все просто: нужно открыть текстовый файл в Govorilka, установить приемлемые настройки речи (скорость, тембр и голос), задать имя файла, в который будет производиться запись, и нажать на кнопку начала чтения. Звука при записи слышно не будет.

Настройки программы для записи в аудиофайл по умолчанию выставлены оптимальные, поэтому ничего менять в них не стоит. За исключением пункта “Не читать нумераторы” – если его не отключить, то не будут читаться не только эти нумераторы, но и любые цифры в тексте. Режим записи “на лету”, также включенный по умолчанию, подразумевает, что программа будет записывать книгу сразу в MP3 без создания промежуточного несжатого wav-файла, а это сильно экономит место на жестком диске во время записи. Наличие этого режима является уникальной возможностью Govorilka, и, конечно же, ею стоит воспользоваться.

Битрейт (качество записи) – 32 kbps – вполне достаточен для прослушивания речи. Повышать этот параметр нет необходимости – это приведет лишь к значительному увеличению полученного MP3-файла. Тем более что размер этого файла в Govorilka ограничен 60 Мб. А это уже накладывает ограничение на размер текста, который можно записать в программе за один сеанс – примерно 200 кб. Большую книгу для записи в Govorilka придется предварительно “драть” на мелкие кусочки, что не совсем удобно. Размер этих кусочков лучше делать не превышающим 50 кб, что соответствует примерно одному часу звучания записанного аудиофайла.

Есть в Govorilka возможность записи с повышенной скоростью, и это действительно работает со всеми движками, но только не с нашими “рыжими”. Какую скорость ни выбирай – что для старого Николая, что для нового – запись идет только в реальном времени. Сколько положено книжке звучать, столько времени и уйдет на ее запись (85 часов для 10-томной эпопеи про Фандорина). И самое печальное то, что все это время вы ничего больше не сможете делать на компьютере – процесс записи использует все системные ресурсы.

ЗАПИСЬ “СТАРЫМ” НИКОЛАЕМ В MAX-READER – УСКОРЕННАЯ И ПО СЦЕНАРИЮ
Считается, что заставить старого Николая записывать книги в ускоренном режиме невозможно стандартными методами. Александр и Максим Васильевы, авторы другой программы – Max-Reader (maxreader.narod.ru), сумели обойти программные ограничения производителя голосового движка на ускоренную запись. Обычным пользователям эта возможность теперь доступна за дополнительную плату вместе с приобретением утилиты.

Как бы то ни было, а в этой программе книгу можно записать ускоренно – в 30-70 раз быстрее, чем она звучит реально. В результате те же 10 “фандоринских” томов в Max-Reader запишутся за 1,5-3 часа вместо положенных 85, как в Govorilka. Для такой ускоренной записи в программе рекомендуется использовать версию старого “Николая” от 18.04.2000, со всеми известными недостатками которой авторам Max-Reader удалось справиться. При использовании других версий “Николая” появляются дефекты в выходном аудиофайле и резко падает скорость записи.

Плюс ко всему более свежие версии Николая мало того, что не имеют никаких преимуществ, так еще и привносят свои недостатки. Например, Николай от 21 августа того же 2000 года произнесение любой цифры сопровождает звуком “и” (“два-и”, “три-и” и т. д.). Запись же новым Николаем идет в Max-Reader в реальном времени, и, что удивительно, текст при этом проговаривается вслух, причем с периодическим искажением, как на заезженной пластинке.

Впрочем, нужная версия “Николая” (как и многие другие голосовые движки, а также компоненты SAPI 4.x) устанавливается вместе с Max-Reader по умолчанию, так что особо забивать голову этими премудростями не стоит. Не стоит и гадать, каким же образом в программе реализовано ускорение – пусть это останется секретами программистов. Однако из наблюдений за работой этой утилиты можно предположить, что в прежних версиях Max-Reader авторы каким-то образом связали это ускорение записи с системными часами.

Во время записи стрелки часов неслись как угорелые, и к концу записи могли уйти на целый месяц вперед. Нужно было возвращать часы назад, и, если это не было сделано сразу же, возникали некоторые неудобства – например, электронные письма уходили и приходили с еще не наступившей датой. В ныне существующей версии Max-Reader 5.6 от 18 марта 2005 года ускорение сделано более корректно и никак не затрагивает систему (во всяком случае, часы с ума не сходят).

Реальное ускорение при записи зависит от параметров озвучивания, в некоторой степени от самого текста и от того, одним или двумя голосами он озвучивается. Дело в том, что в Max-Reader встречающуюся в русском тексте иностранную речь можно заставить читать другого чтеца. Например, в “Турецком гамбите” Акунина очень много предложений на французском языке, и логично озвучить их французской версией движка – Digalo French Robert.

Таким образом, наш “Николай” будет читать русский текст, а Роберт – французский. При использовании двух синтезаторов запись книги замедляется, но остается довольно высокой – на компьютере с процессором Celeron 850 и 250 Мб ОЗУ наблюдалось ускорение записи до 30 раз! Если заставить “Николая” читать иностранный текст, то скорость записи можно повысить дополнительно. Однако лучше этого не делать – читать этот текст наш Коля будет не по правилам иностранного языка, а как обычную латиницу.

Еще одно удобство Max-Reader – наличие сценариев записи, которые несколько компенсируют непривычный для обычных пользователей интерфейс (программа специально сделана для слабовидящих людей). Достаточно один раз записать любимые настройки в сценарий, и потом можно совершенно забыть о них. Нужно просто открыть хоть 10 текстов (именно столько окон в программе) и нажатием на кнопку MP3 запустить процесс их записи в аудиофайл.

После завершения процесса вы получите то, что заказывали: аккуратно разложенные по папкам MP3-файлы определенного размера, аудиофайлы для записи на кассеты и даже готовый для прослушивания CD с записанными на нем аудиокнигами. Очень приятно то, что программа предварительно обсчитывает необходимое дисковое пространство и примерное время записи – это позволяет, например, подобрать комплект книг, которые точно поместятся на диске.

ТРУДНОСТИ НОВОГО “НИКОЛАЯ”
Как уже говорилось, новый “Николай” поддерживает оба стандарта SAPI – и 4-й, и 5-й. Но чтобы увидеть, как работает движок под управлением SAPI 5, нужна программа-оболочка, также понимающая этот стандарт. Одной из таких программ является Talker Pro компании “Сакрамент” (www.sakrament.com), однако записать новым “Николаем” с ее помощью ничего не удалось.

Вернее, программа записывала только часть текстов, останавливаясь случайным образом на обычных словах, которые никак нельзя назвать сбойными. Кроме этого, в Talker недоступны настройки голоса нового “Николая”, и можно изменить лишь скорость чтения. Нужно сказать, что и под управлением SAPI 4 с настройками нового “Николая” имеются проблемы – в Govorilka все параметры этого голоса фиксируются (невозможно перетащить ползунки настроек), а в Max-Reader ползунки перетащить можно, но голос остается без изменения.

ЗАПИСЬ НОВЫМ “НИКОЛАЕМ” В MP3BOOK2005 УСКОРЕННАЯ И НЕ МОНОТОННАЯ
Программа Владимира Шойтова MP3book2005 (www.mp3book.best-host.ru) создавалась специально для записи аудиокниг в формате MP3, поэтому имеет все необходимые инструменты для комфортного выполнения этой задачи. Программа работает с голосовыми движками и под SAPI 4, и под SAPI 5, что само по себе является уникальным. Кроме того, она обладает интересными возможностями, отсутствующими у других программ-говорилок.

Начнем с возможности ускоренной записи. Любую книгу в этой программе можно записать с ускорением до пяти раз голосом нового “Николая” под управлением SAPI 5. Нужно отметить, что реализовано это ускорение стандартными (его родными, “дигаловскими”) средствами, поэтому компьютер будет работать в штатном режиме, без каких-либо разгонов и переводов времени.

Теперь о преимуществах такой записи. Компоненты SAPI 5 уже установлены в Windows XP, поэтому не нужно тащить тяжеловесные файлы с сайта Microsoft, как в случае записи под SAPI 4. Уже отмечалось, что новый “Николай” не подвержен сбоям на “плохих” словах и имеет широкий диапазон тембров и скоростей. Последнее обстоятельство делает возможной ускоренную запись на обычный магнитофон (диктофон) с переключением скоростей.

Другими словами, можно записать книгу на высокой скорости, а слушать на пониженной. Сделать это можно не в любой программе-говорилке, поскольку у многих из них параметры голоса жестко фиксируются. MP3book2005 автоматически опрашивает параметры каждого голосового движка, установленного в системе, и на регуляторах выставляет только допустимые максимальные и минимальные значения параметров для конкретного выбранного голоса. При переходе от одного голоса к другому это можно заметить визуально – регуляторы как бы “перепрыгивают”.

Еще один плюс записи новым “Николаем” под SAPI 5: совершенно не тормозится компьютер. В связи с этим и ускоренная запись становится не такой актуальной, поскольку одновременно с этим процессом можно работать и даже играть в 3D-игры. MP3book2005 при этом еще и сворачивается принудительным образом, дабы не мешать вашей работе или игре (кстати, развернуть программу до конца записи даже не пытайтесь – это невозможно).

Программа поддерживает многокомпьютерную обработку – отличное решение для тех, кому пятикратное ускорение записи новым “Николаем” покажется недостаточным. Например, задействовав сразу пять компьютеров, вы получите ускорение записи в 25 раз! Эту же возможность можно применить и при записи старым “Николаем”, который, как и в Govorilka, в MP3book2005 пишет в режиме реального времени – ускорение будет равно числу компьютеров, задействованных в процессе записи.

Отдельно нужно рассказать об интересной возможности MP3book2005 изменять тембр и скорость звучания голоса “Николая” в диалогах, комментариях и простом тексте. Реализовано это в “Блоке диалогов” программы. Потаскав ползунки в этом блоке, можно нажать на специальную кнопку и прослушать тестовую фразу с заданными настройками.

“После того, как были сделаны все необходимые настройки, решено было проверить результаты. “Ну, и как? Вы удовлетворены результатом? – сказал компьютер своим скрипучим голосом. – Если удовлетворены, то можете сохранить настройки”. И после этого пользователю ничего не оставалось, как согласиться с машиной, поскольку он знал, что с таким голосовым движком лучшего добиться нельзя”.

Например, здесь простое повествование (до и после прямой речи) можно сделать неторопливым и с привычным тембром голоса. Прямую речь озвучить более высоким голосом, а слова автора, наоборот, более низким. В общем, простора для экспериментов достаточно, а записанная с такими настройками аудиокнига будет звучать не так монотонно.

С помощью MP3book2005 можно записывать аудиокниги не только в MP3, но и в форматах для сотовых телефонов, что позволяет прослушивать книги на мобильных устройствах, имеющих достаточную свободную память: все смартфоны, Siemens SL45 и все телефоны 65 серии, LG G1800 и т. д. Автор программы планирует встроить и поддержку цифровых диктофонов.

Интерфейс MP3book2005 представляет собой удобный для пользователя браузер, в котором непосредственно отображается содержимое файла, если на нем стоит курсор. Это дает возможность сразу видеть все произведение и облегчает жизнь в тех ситуациях, когда мучаешься вопросом “Что бы такое “почитать”?”

Незарегистрированная MP3book2005 сохраняет все функции и не имеет никаких временных ограничений, но постоянные напоминания и сброс индивидуальных настроек делают работу с ней очень неудобной (особенно в режиме записи MP3-файлов). Регистрация обойдется в 500 рублей.

ПСИХОЛОГИЧЕСКИЙ МОМЕНТ
Прослушивание книг – занятие для настоящих фанатов, для тех, кто воспринимает информацию на слух лучше, чем с листа. Многие любители-“говорильщики” жалуются на непонимание близких: “Как можно слушать эту бормоталку?!” Вот почему новичкам в этом деле можно посоветовать для начала установить бесплатную Govorilka, озвучить “Николаем” и прослушать несколько небольших текстов. Если такое “чтение” придется по вкусу и возникнет потребность слушать книги вдали от компьютера, тогда можно подумать и насчет покупки серьезных программ – Max-Reader и MP3book2005. Кроме комфортной и ускоренной записи аудиокниг эти программы предлагают массу других замечательных возможностей, например, они помогут привести в порядок вашу электронную библиотеку, разбросанную по разным закоулкам на диске.

Немаловажно, что обе программы имеют режим продолжения записи после сбоя – свет ли выключат, или Digalo “вылетит” на последней строчке записываемой книги – начинать все сначала не нужно. Но главное, с помощью этих программ вы на всю жизнь обеспечите себя хорошим “чтивом” – аудиокнигами, которые сделают вашу жизнь более наполненной. Взять, к примеру, рыбалку: поймаете ли вы за день хоть одного сопливого ерша – еще вопрос, а вот удовольствие от прослушанной книги получите точно.

Перед тем как начать запись…
Несмотря на наличие в программах многотысячных словарей по корректировке произношения “Николая”, некоторые слова в книге все же окажутся проблемными. Особенно это касается имен, фамилий, географических названий и мудреных терминов. Поэтому перед тем как запустить запись в аудиофайл какой-то необычной книги вроде “Бардо Тодол” (“Тибетской Книги Мертвых”), стоит проверить правильность звучания наиболее часто встречающихся в этом произведении слов.

Сделать это можно с помощью программ, умеющих составлять рефераты и аннотации по заданным текстам – например, “Либретто” (www.medialingua.ru/annotator.html) от “МедиаЛингва” или “ОРФО” (www.orfo.ru) компании “Информатик”. Можно и не ходить далеко, а воспользоваться простейшим аннотатором, встроенным в Microsoft Word.

Полученную любым способом аннотацию нужно сохранить в отдельный файл, а затем прослушать в программе-говорилке, обращая особое внимание на ключевые слова (“Сидпа”, “Хониид”, “Чикаи” в “Книге Мертвых”). То же самое лучше проделать и перед записью “нормальной” книги.

Другие голосовые движки
Выбор “голосов” для озвучивания книг невелик. Ниже приведен список голосовых движков, доступных обычным пользователям.

– L&H TTS3000 Russian (www.microsoft.com/msagent/downloads/user.asp) – создан компанией Lernout&Hauspie, поддерживает MS SAPI 4.x. Распространяется бесплатно корпорацией Microsoft в составе компонентов Microsoft Agent.

– Sakrament TTS Engine (www.sakrament.com/main.php?TopId=30) – разработан белорусской компанией “Сакрамент”, полностью соответствует MS SAPI 5.1. Можно купить за $32 в комплекте с Sakrament TTS Engine Home Edition – многокомпонентным продуктом для персонального использования.

– “Говорящая Мышь” (www.sciencepark.ru/voicem.htm) – движок Клуба голосовых технологий при научном парке МГУ, использует собственные библиотеки для воспроизведения голоса, поэтому не требует установки MS SAPI. Стоит порядка $20 вместе с программой-оболочкой.

– ScanSoft TTS (www.scansoft.com/network/tts) – серия голосовых движков компании “Скансофт”. Демоверсии, как и информация о цене продуктов, предоставляются только серьезным корпоративным покупателям. Простые смертные могут воспользоваться интерактивным сервисом, синтезирующим речь по заданной фразе.