1

Тема: Синтезатор українського мовлення (Ukrainian TTS)

Шановне панство! Пропоную підтримати проект створення нового синтезатора української мови:
https://www.facebook.com/syntezator/info/?tab=page_info
Великою перевагою проекту є те, що використовується уже досить добре розвинена відкрита платформа RHVoice. Ця платформа підтримує Windows, Linux та Android.
Інформація зі сторінки проекту:

Над створенням синтезу мовлення на базі обчислювальної техніки люди почали працювати ще з кінця п’ятдесятих років двадцятого століття. Спочатку системи синтезу мовлення були, так би мовити, електронно-механічними. Зараз же розробка майже повністю перейшла у площину програмування. Ясна річ, у світі ця галузь досягла неабияких висот. Синтезований голос звучить ледь не так само, як голос людини. Тобто, коли чуєш у комп’ютері або пристроях на Android, чи iOSсинтезований голос, не відразу збагнеш, що це говорить «машина». Уже існує безліч синтезаторів Англійського мовлення, багато Німецьких голосів, Російських, Польських і т.ін. Розроблено навіть синтезатори мовлення для Естонської, Грузинської, Вірменської та Казахської мов.
Синтез мовлення має дуже широке застосування. Його використовують і у зв’язку, і у інформаційно-довідкових службах. Нас же, головно, цікавить робота з синтезованими голосами пересічних користувачів. Найчастіше люди за допомогою синтезаторів мовлення читають літературу, при чому, літературу будь-яку – художню, науково-популярну і т.ін. Для цього існують такі програми, як «Балаболка» і їй подібні. Є немолоді люди, які синтезаторами «читають» дрібний текст з екрана. Найважливіше значення синтез мовлення має для незрячих користувачів комп’ютерів, смартфонів та планшетів. Завдяки цим штучним голосам та програмам зчитування з екрана, люди з вадами зору організовують собі дозвілля і, багато хто з них, має роботу.
Нажаль, досі, не існує якісного синтезатора Українського мовлення. Так, треба подякувати тим аматорам, які розробляли Українські голоси, це і Анатолій Чорний і Ярослав Козак, які створили, відповідно, «Розмовляльку» і UkrVox. Але світ уже далеко попереду! Є ще такі голоси, як «Newfon» та «MyMouse». Користуються ними кількадесят незрячих, та й то ті, у кого «залізобетонні» нерви та «брезентові» барабанні перетинки. Складність їх сприйняття зумовлена тим, що вони звучать дуже вже механічно і неприродно, нерозбірливо, і найголовніше, створено їх на Російській фонетичній базі у далекі вісімдесяті роки. Люди з вадами зору, які тільки-но починають опановувати комп’ютерну техніку, не сприймають ці голоси. Тим паче, що можуть порівнювати їх з сучасними російськими та Англійськими синтезаторами. Відповідно, кілька десятків тисяч незрячих юзерів користуються лише російськомовним сегментом Інтернету, в найкращому випадку ще Англомовним. Тобто Український повністю недоступний. Так само вони не можуть працювати у програмах, у яких Український інтерфейс. Хоча ратифікована ВР ще у 2009році Конвенція «Про права інвалідів» http://zakon4.rada.gov.ua/laws/show/995_g71 гарантує сприяння держави у забезпеченні права інвалідів на доступ до інформації. Але, нажаль, досі ніхто навіть пучкою не кивнув, щоб змінити ситуацію.
Тому ініціативна група незрячих вирішила звернутися по допомогу до програміста, у якого вже є неабиякий досвід роботи над створенням синтезаторів мовлення і неабиякий доробок у цій галузі. Пропонуємо послухати як читають тексти голоси створені Ольгою Яковлевою: http://www.trosti.com.ua/files/Alexandr.mp3, http://www.trosti.com.ua/files/Anna.mp3, http://www.trosti.com.ua/files/Elena.mp3, http://www.trosti.com.ua/files/Irina.mp3. А ось сторінка, на якій можна завантажити дистрибутиви цих, і не тільки, голосів: http://tiflo.info/rhvoice/.
До ініціативної групи входять Сергій Москалець, Євген Міцук, Олександр Стариченко, Олександр Шалухін, Валерій Савченко, Віталій Сухар. Ми зобов’язалися допомагати Пані Ользі у створенні кінцевого продукту. Наприклад, до наших обов’язків входить пошук дикторів, редагування текстів для читання дикторами, організація та участь в акціях, ярмарках із збору коштів. Крім цього ми підтримуємо проект своїми власними грошима.
Пропонуємо усім охочім долучитися до цієї цікавої і необхідної справи. Допомога приймається у вигляді ідей, порад і, звісно ж, у вигляді грошей. У нас в Українців, здається, найкраще виходять справи, коли ми до них беремося толокою! Доречи, принагідно, висловлюємо подяку Костянтинові Брулю з Києва, який нам надав словник наголосів Української мови!
Гроші можна переказувати за такими реквізитами:
для юр. осіб: ХМГОІ "Соціально-реабілітаційний центр незрячих", код 25863676 Р/р 26007060816900 в ПАТ КБ “ПРИВАТБАНК” м. Харкова МФО 351533

Фізичним особам можна зробити внесок в будь-якому відділенні або терміналі самообслуговування Приватбанку. При цьому за поповнення карткового рахунку ви не платите комісію зовсім. Номер картки в Приватбанку для поповнення:
5168 7423 2891 6170, отримувач - Москалець Сергій Дмитрович.

Звіт про перебіг роботи, про кошторис, про надходження коштів будемо давати щонайрідше раз на тиждень.

2

Re: Синтезатор українського мовлення (Ukrainian TTS)

Доброго дня!
Звернув увагу, що посилання на зразки голосів не діють через кому в посиланні. Надаю вірні:

http://www.trosti.com.ua/files/Alexandr.mp3
http://www.trosti.com.ua/files/Anna.mp3
http://www.trosti.com.ua/files/Elena.mp3
http://www.trosti.com.ua/files/Irina.mp3

Також даю посилання на перші зразки голосу вже нашого, україномовного синтезатора, який було названо "Анатоль":
http://www.trosti.com.ua/download/test_1.ogg
http://www.trosti.com.ua/download/test_2.ogg
http://www.trosti.com.ua/download/test_3.ogg
http://www.trosti.com.ua/download/test_4.ogg

Сам синтезатор ще у розробці.

3

Re: Синтезатор українського мовлення (Ukrainian TTS)

Дмитрович написав:

Також даю посилання на перші зразки голосу вже нашого, україномовного синтезатора, який було названо "Анатоль":
Сам синтезатор ще у розробці.

Він кросплатформений?

Віддамся на один вечір в хороші дівочі руки.. не дорого, в у.о. .. Якщо сподобається, то залишуся безкоштовно назавжди..
Подякували: ostap34PHP1

4

Re: Синтезатор українського мовлення (Ukrainian TTS)

HetmanNet написав:
Дмитрович написав:

Також даю посилання на перші зразки голосу вже нашого, україномовного синтезатора, який було названо "Анатоль":
Сам синтезатор ще у розробці.

Він кросплатформений?

Він ще ніякий ), але буде, сподіваємось, і під Android, і під Windows як і решта синтезаторів Ольги.

Подякували: ostap34PHP1

5

Re: Синтезатор українського мовлення (Ukrainian TTS)

Дмитрович написав:
HetmanNet написав:
Дмитрович написав:

Також даю посилання на перші зразки голосу вже нашого, україномовного синтезатора, який було названо "Анатоль":
Сам синтезатор ще у розробці.

Він кросплатформений?

Він ще ніякий ), але буде, сподіваємось, і під Android, і під Windows як і решта синтезаторів Ольги.

Мене більше цікавить linux та macosx

Віддамся на один вечір в хороші дівочі руки.. не дорого, в у.о. .. Якщо сподобається, то залишуся безкоштовно назавжди..
Подякували: ostap34PHP1

6

Re: Синтезатор українського мовлення (Ukrainian TTS)

HetmanNet
Лінукс є, а MacOS X напевне можна буде додати самому, бо двигун з відкритими сирцями.

Подякували: ostap34PHP1

7 Востаннє редагувалося HetmanNet (02.03.2016 14:10:34)

Re: Синтезатор українського мовлення (Ukrainian TTS)

Torbins написав:

HetmanNet
Лінукс є, а MacOS X напевне можна буде додати самому, бо двигун з відкритими сирцями.

Він зроблений нормально чи по віндузяцьки? Тобто так, що ним може користуватися весь софт який на то розрахований (наприклад kde) чи він через дупу інтегрується як то зазвичай на вінде?

Віддамся на один вечір в хороші дівочі руки.. не дорого, в у.о. .. Якщо сподобається, то залишуся безкоштовно назавжди..
Подякували: ostap34PHP1

8

Re: Синтезатор українського мовлення (Ukrainian TTS)

Почитайте Вікі, на яку я дав лінку у першому пості. Написано, що на Лінуксі використовує Speech Dispatcher. Нормально це, чи "по віндузяцьки" я не знаю.

Подякували: ostap34PHP1

9

Re: Синтезатор українського мовлення (Ukrainian TTS)

Torbins написав:

Почитайте Вікі, на яку я дав лінку у першому пості. Написано, що на Лінуксі використовує Speech Dispatcher. Нормально це, чи "по віндузяцьки" я не знаю.

То ви не про "Анатоль"?

Віддамся на один вечір в хороші дівочі руки.. не дорого, в у.о. .. Якщо сподобається, то залишуся безкоштовно назавжди..
Подякували: ostap34PHP1

10

Re: Синтезатор українського мовлення (Ukrainian TTS)

"Анатоль" то лише один з голосів, яким може говорити двигун RHVoice.

Подякували: ostap34PHP1

11

Re: Синтезатор українського мовлення (Ukrainian TTS)

Torbins написав:

"Анатоль" то лише один з голосів, яким може говорити двигун RHVoice.

А чому обрали RHVoice?

Віддамся на один вечір в хороші дівочі руки.. не дорого, в у.о. .. Якщо сподобається, то залишуся безкоштовно назавжди..
Подякували: ostap34PHP1

12

Re: Синтезатор українського мовлення (Ukrainian TTS)

Це не до мене. Я читав, що просто знайшли спеціаліста, який погодився зробити голос. А уже вона обрала двигун. До речі сама ж його й розробила.

Подякували: ostap34PHP1

13

Re: Синтезатор українського мовлення (Ukrainian TTS)

HetmanNet написав:
Torbins написав:

Почитайте Вікі, на яку я дав лінку у першому пості. Написано, що на Лінуксі використовує Speech Dispatcher. Нормально це, чи "по віндузяцьки" я не знаю.

То ви не про "Анатоль"?

Це не той Анатоль. Тепер їх два.

Подякували: ostap34PHP1

14

Re: Синтезатор українського мовлення (Ukrainian TTS)

Вітаю.
Відсьогодні (мені та іншим слоупокам) стало відомо, що гугл транслейт тепер вміє читати український текст. Якість поки що не дуже, але й не найгірша, до того ж зрозуміло, що це лише початок.
Хочу запитати: що шановне панство планує робити за цих обставин?

Подякували: HetmanNet1

15

Re: Синтезатор українського мовлення (Ukrainian TTS)

Ілько
Думаю, що продовжувати. Чим більша конкуренція, тим більше виграє споживач. До того ж інколи бувають випадки, коли треба мати кілька різних голосів.

16

Re: Синтезатор українського мовлення (Ukrainian TTS)

Ілько написав:

Відсьогодні (мені та іншим слоупокам) стало відомо, що гугл транслейт тепер вміє читати український текст. Якість поки що не дуже, але й не найгірша, до того ж зрозуміло, що це лише початок.

А перекладати він вже навчився?
Бо часом таке видає, що жах.
І десь нещодавно проскакувало (з посиланням на їхній сайт), що українська у нього досі лише через транзит.
any→ru→uk
uk→ru→any
тому і фігня виходить.

printf("Nested comments is %s\n", */*/**/"*/"/*"/**/ == '*' ? "OFF" : "ON");

17

Re: Синтезатор українського мовлення (Ukrainian TTS)

З англ. на укр. перекладає через рос. — виходить фігня через російські кальки, з укр. на англ. перекладає напряму́, але виходить фігня ще більша через бідність бази перекладів.

py -3 -m pip install git+https://github.com/snoack/python-goto
∩⍴○⌈⍴⍺/∧\∨/⊢○ ⌿⍀⍴⌊
Подякували: ostap34PHP, HetmanNet2

18

Re: Синтезатор українського мовлення (Ukrainian TTS)

Привіт. Де можна скачати синтезатор? Мені потрібний з голосом чоловіка.

Подякували: ostap34PHP1

19

Re: Синтезатор українського мовлення (Ukrainian TTS)

Поки що тут: http://www.trosti.com.ua/anatol.html
Згодом з'явиться на офіційній сторінці: https://github.com/Olga-Yakovleva/RHVoi … Russian%29

Подякували: ostap34PHP1

20 Востаннє редагувалося Torbins (11.10.2017 13:58:03)

Re: Синтезатор українського мовлення (Ukrainian TTS)

Свіжі новини:

Друзі! І ми, і ви чекали і, нарешті, дочекалися! “Анатоль” отримав оновлення – підтримку режиму “Pseudo-English”! Тобто тепер синтезатор буде намагатися правильно прочитати слова, написані англійською мовою!
Перед тим, як дати посилання на оновлення, звернемо вашу увагу на кілька важливих нюансів, які допоможуть зробити користування “Анатолем” значно приємнішим для ваших вух, і, разом з тим, наведемо для вас коротку інструкцію..
1. Режим “Pseudo-English” підтримується у всіх варіантах синтезатора: для Android, NVDA чи Windows SAPI. Це також доступно і для Linux, однак ми зосередимо свою увагу лише на трьох вищеназваних платформах, оскільки наразі вони є найпопулярнішими серед спільноти.
2. Користувачі NVDA- чи SAPI-версії можуть вмикати /вимикати цей режим двома способами: першим – редагуванням конфігураційного файла (деталі: goo.gl/uahU4W), або другим – встановлюючи або видаляючи англійський мовний пакет (доступний в архіві за посиланням нижче).
3. Користувачі Android можуть вимикати чи вмикати цю функцію просто з меню програми. Для цього після встановлення усіх APK-файлів з архіва в меню програм (в тому меню, де розміщено ярлики на всі встановлені на пристрої застосунки) створиться ярлик “RHVoice settings”. Де саме він розташується – залежить від вашого пристрою. Для зручності скопіюйте цей ярлик також на робочий стіл (як це зробити – залежить від пристрою та оболонки (louncher), яку ви використовуєте). Відкривши програму, оберіть українську мову, після чого заберіть або встановіть прапорець у пункті “Try to read english words correctly” (“намагатися читати правильно англійські слова). На жаль, на українську мову цей пункт розробниця синтезатора ще не переклала. До слова, там же можна змінити гучність і швидкість синтезатора. Не рекомендуємо ставити гучність вище 150 – після цього значення починаються потріскування.
4. Режим “Pseudo-English” не буде увімкнено зовсім, якщо ви не встановите англійський мовний пакет. Це стосується всіх платформ.
5. Вашій увазі також пропонуються оновлені словники:
– файл abr.txt вказує синтезатору, що те чи інше буквосполучення є абревіатурою, відповідно, таку абревіатуру треба читати по буквах;
– файл dictionary.txt – це файл словника, який вказує, з яким наголосом синтезатор має вимовляти те чи інше слово;
– файл pronunciation.txt – це також файл словника, який вказує, як синтезатор має вимовляти ті чи інші слова. Ми створили його, щоб вказати “Анатолю”, як треба вимовляти найпоширеніші англомовні слова чи буквосполучення. Останніх поки що небагато.
Ви можете змінювати усі вищезазначені файли на свій розсуд, або ж можете залишити все як є, не копіюючи файли словників. Для того, щоб зміни набули чинності, перезапустіть додаток, який використовує “Анатоля”.
6. При увімкненому режимі “Pseudo-English” файл словника завжди буде пріоритетнішим за вбудовані можливості синтезатора. Це дозволить вам, шляхом редагування словника, вказувати синтезатору, як він має промовляти ті чи інші слова, написані латинськими літерами. Це однаково працюватиме як з режимом “Pseudo-English”, так і без нього. Ми наголошуємо на цьому, оскільки “Pseudo-English” багато слів відверто спотворює, і внесення відповідних правил до словника вирішує цю проблему. А взагалі ми радимо експериментувати зі словниками, а своїм корисним досвідом ділитися з нами :)
7. Як підключити словники, написано у відповідному текстовому файлі, який розміщений в архіві зі словниками.
8. ПОПЕРЕДЖЕННЯ! Ця версія синтезатора, як і попередні, розміщені тут, є тестовою, вона зібрана з джерельних кодів, розміщених на сторінці RH-Voice (goo.gl/WoB7UR). Ви встановлюєте її, розуміючи, що вона може не працювати або працювати некоректно. Стабільну роботу таких версій не гарантують навіть розробники.
9. Важливі поради:
– Порада для користувачів SAPI-версії: синтезатор тріщить менше, якщо експериментувати з гучністю. Наприклад, при використанні SAPI-версії з NVDA під час тестування ми виявили, що потріскування починаються після рівня гучності 80.
– Порада для користувачів Android: якщо у вас вже встановлена попередня версія синтезатора, то перед оновленням все-таки рекомендується її видалити.
10. Ми дякуємо тим, хто збирав для нас ці версії.

Завантажити синтезатор українського мовлення “Анатоль” можна за посиланнями нижче:
Для Android: Anatol_for_Android.zip
для NVDA (у вигляді додатків nvda-addon): Anatol_for_NVDA.zip
для Windows (SAPI 5): Anatol_for_SAPI.zip
словники: dicts.zip
Примітка! Для коректної роботи синтезатора на тій чи іншій платформі ви повинні встановити всі файли з архіва для цієї платформи.

Приємного користування!
Запитання пишіть у коментарях!